معلومة

كيف نبني شجرة النشوء والتطور بدون مجموعة خارجية؟

كيف نبني شجرة النشوء والتطور بدون مجموعة خارجية؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لدي تسلسلات كاملة محاذاة للجينوم لأربع مجموعات من الخنافس من نفس النوع. أرغب في بناء شجرة النشوء والتطور مع الأربعة. ومع ذلك ، لا يمكنني العثور على مجموعة خارجية مناسبة من الأنواع ، لذلك لا يمكنني استخدام مجموعة خارجية لجذر الشجرة. هل هناك طريقة معينة يمكن استخدامها لبناء شجرة بدون مجموعة خارجية؟ لقد وجدت أن برنامج MEGA يعمل بشكل جيد. ما هي نظرية وفهم بناء شجرة بدون مجموعة خارجية؟ ما هي الآثار المترتبة على بناء شجرة بدون مجموعة خارجية؟ هل تم قياس المسافات بين الأشجار بالنسبة لبعضها البعض؟


تقوم معظم خوارزميات إعادة بناء السلالات الكلاسيكية بجذر الشجرة بشكل لاحق ، بناءً على المجموعة الخارجية التي اختارها المستخدم. يتم استنتاج الشجرة في الواقع وتمثيلها داخليًا بدون جذر.

لذلك ، إذا كنت تستخدم برنامجًا يطلب منك مجموعة خارجية ، فمن المحتمل أنه يمكنك فقط اختيار برنامج تعسفي ثم "إزالة جذر" الشجرة التي تم الحصول عليها لاحقًا.


بناء الطالب لأشجار النشوء والتطور في مقرر علم الأحياء التمهيدي

أصبحت أشجار التطور الوراثي أساسية بشكل متزايد عبر تخصصات علم الأحياء. وبالتالي ، أصبح التعرف على أشجار النشوء والتطور مكونًا مهمًا في تعليم علم الأحياء ومجال اهتمام لبحوث تعليم علم الأحياء. غالبًا ما تُستخدم مهام البناء ، التي يقوم فيها الطلاب بإنشاء أشجار النشوء والتطور من بعض أنواع البيانات ، في التدريس. ومع ذلك ، فإن تأثير هذه التمارين على تعلم الطلاب غير مؤكد ، ويرجع ذلك جزئيًا إلى معرفتنا المجزأة بما يبنيه الطلاب أثناء المهام. كان الهدف من هذا المشروع هو تطوير طريقة أكثر قوة لوصف أشجار النشوء والتطور التي يولدها الطلاب ، والتي ستدعم التحقيقات المستقبلية التي تحاول ربط مهام البناء بتعلم الطلاب.

نتائج

من خلال الفحص التكراري للبيانات المأخوذة من دورة تمهيدية في علم الأحياء ، قمنا بتطوير طريقة لوصف أشجار النشوء والتطور التي يولدها الطلاب من حيث الأسلوب والتوافق والدقة. استخدم الطلاب النمط القطري أكثر من نمط القوس لمهام البناء. تم بناء غالبية أشجار النشوء والتطور بشكل تقليدي ، وكان الاتجاه المتغير للفروع هو السمة غير التقليدية الأكثر شيوعًا. بالإضافة إلى ذلك ، تم إنشاء غالبية أشجار النشوء والتطور بشكل صحيح (بدون أخطاء) أو بشكل كاف (أخطاء بسيطة فقط) من حيث الدقة. كان الاقتراح بأن الأصناف الموجودة تنحدر من الأصناف الأخرى الموجودة هو الخطأ الرئيسي الأكثر شيوعًا ، في حين أن الفروع الفارغة والعقد الإضافية كانت أخطاء بسيطة شائعة جدًا.

الاستنتاجات

كشفت الطريقة التي طورناها لوصف أشجار النشوء والتطور التي أنشأها الطلاب عن العديد من الاتجاهات التي تتطلب مزيدًا من البحث. على سبيل المثال ، في حين أن أشجار النشوء والتطور المائل والأقواس تحتوي على معلومات مكافئة ، فإن تفضيل الطالب لاستخدام النمط القطري يمكن أن يؤثر على الفهم. بالإضافة إلى ذلك ، على الرغم من الافتقار إلى التعليمات الواضحة ، أنشأ الطلاب أشجارًا تقليدية ودقيقة إلى حد كبير. والمثير للدهشة أن الدقة والتقارب كانت تعتمد أيضًا على بعضها البعض. تعتمد طريقتنا في وصف أشجار النشوء والتطور التي أنشأها الطلاب على بيانات من دورة تمهيدية في علم الأحياء في مؤسسة واحدة ، ومن المحتمل أن تكون النتائج محدودة. نحن نشجع الباحثين على استخدام طريقتنا كخط أساس لتطوير أداة أكثر قابلية للتعميم ، والتي ستدعم التحقيقات المستقبلية التي تحاول ربط مهام البناء بتعلم الطلاب.


المواد والأساليب

أخذ العينات من الأصناف والشخصية

لاختبار علاقات تمساحيات التلاتوسوتشيان ، أجريت تحليلًا للتطور النشئي لـ 394 حرفًا مورفولوجيًا تم تسجيله لثمانية مجموعات خارجية و 78 تصنيفًا داخليًا ، بما في ذلك 24 نوعًا من أنواع التلاتوسوتشيان (الملحق 1 عبر الإنترنت متاح كمواد تكميلية على درياد في http: //dx.doi. org / 10.5061 / dryad.00ss6). مجموعة البيانات الجديدة هذه هي نسخة معدلة من تلك المقدمة في Wilberg (2015) مع إضافة 10 أحرف جديدة وتعديل العديد من الشخصيات الأخرى (الملحق 2 عبر الإنترنت متاح كمواد تكميلية على Dryad على http://dx.doi.org/ 10.5061 / درياد.00ss6). لتقليل الأخطاء في ترميز الأحرف ، ركزت أخذ العينات الجماعية على العينات التي يمكنني مراقبتها مباشرة أو تلك التي تحتوي على أوصاف منشورة مفصلة. لقد بذلت جهدًا لأخذ عينات على نطاق واسع من جميع مجموعات Crocodylomorph الرئيسية. ركز أخذ عينات الأصناف داخل Thalattosuchia على التقاط مجموعة واسعة من الأشكال الموجودة في المجموعة عبر مدتها الزمنية بأكملها. تمت زيادة أخذ عينات المجموعة الخارجية من التحليلات السابقة بقصد توصيف أفضل لتوزيع حالات الشخصية في الأشكال غير الديناميكية. مثل القاعدية جراسيليسوكس تم استخدامه لجذر الشجرة بناءً على موقعها في التحليل الواسع النطاق لـ Archosauria بواسطة Nesbitt (2011). راويسوتشيد (سينسو نيسبيت 2011) بوستوسوكس كيركباتريكي أدرج لسببين رئيسيين. أولاً ، تم استرداد Rauisuchidae كثيرًا كمجموعة شقيقة لـ Crocodylomorpha ، خارج "Sphenosuchia" غير المستقرة نسبيًا (على سبيل المثال ، Benton and Clark 1988 Parrish 1993 Juul 1994 Nesbitt 2011). ثانيا، بوستوسوكس كيركباتريكي معروف جيدًا من عينات متعددة تمثل الهيكل العظمي الكامل تقريبًا مما يسمح بتسجيل معظم الأحرف. كما تم أخذ عينات من ستة أصناف "sphenosuchian". تم استرداد ثلاثة منها كأصناف شقيقة لـ Crocodyliformes في التحليلات السابقة (Junggarsuchus سلوني، كلارك وآخرون. 2004 Kayentasuchus walkeri، نسبيت 2011 Almadasuchus figariiبول وآخرون. 2013). إن تضمين هذه الأصناف سيوفر اختبارًا أكثر صرامة لموضع Thalattosuchia المحتمل كمجموعة شقيقة لـ Crocodyliformes. لتقييم حساسية الطوبولوجيا لأخذ العينات خارج المجموعة ، تم إجراء التحليل أيضًا في ثلاثة تباديل: استبعاد القاعدية مثل جراسيليسوكس (تجذير بوستوسوكس) باستثناء الأصناف noncrocodylomorph جراسيليسوكس و بوستوسوكس (تجذير فرس البحر أجيليس) واستبعاد جميع الأشكال غير الديناميكية والتأصيل على البروتوسوتشيان Orthosuchus Stormbergi كما هو الحال في بعض التحليلات المنشورة (على سبيل المثال ، Sereno و Larsson 2009).

كما هو الحال مع أي تحليل لعلم الوراثة ، تحتوي مجموعة بيانات الدراسة على كميات عالية نسبيًا من البيانات المفقودة (40.75٪ مفقودة أو غير قابلة للتطبيق). يتركز الكثير من البيانات المفقودة في شخصيات ما بعد الجمجمة حيث أن العديد من أصناف التمساح معروف في المقام الأول من مادة الجمجمة. ثلاثة أصناف (Zaraasuchus shepardi, Eoneustes gaudryi، و Steneosaurus brevidens) ناقصة للغاية (80-82٪) ، في حين أن متوسط ​​عدم الاكتمال لكل تصنيف هو 36٪. ومع ذلك ، في حين تبين أن البيانات المفقودة تقلل من دقة النشوء والتطور (على سبيل المثال ، Wiens 2003 Prevosti و Chemisquy 2010 والمراجع الواردة فيهما) ، فإن كمية البيانات المفقودة لا ترتبط ارتباطًا مباشرًا بمحتوى معلومات أحد الأصناف. قد يستمر تصنيف غير مكتمل للغاية في زيادة الدقة إذا كان يحتوي على معلومات متشابكة إعلامية (Kearney and Clark 2003 Wiens 2003).

تحليل البخل

تم تحليل مجموعة بيانات النشوء والتطور في TNT v1.1 (Goloboff et al. 2008) باستخدام البخل الموزون بالتساوي. تم العثور على أشجار الطول الأدنى باستخدام بحث إرشادي مع 1000 مكرر من أشجار Wagner باستخدام متواليات إضافة عشوائية متبوعة بتقسيم الأشجار وإعادة الاتصال (TBR) مبادلة الفروع. تعرضت أقصر الأشجار التي تم الحصول عليها من هذه التكرارات لجولة نهائية من تبديل فرع TBR لضمان اكتشاف جميع الأشجار ذات الطول الأدنى. انهارت الفروع ذات الطول الصفري إذا كانت تفتقر إلى الدعم تحت أي من الأشجار ذات الطول الأدنى (القاعدة 1 من Coddington و Scharff 1994). تم إجراء تحليلين منفصلين. في الأول ، لاختبار تأثير مجموعات متداخلة محتملة من التماثلات الموجودة في بعض الأحرف متعددة الدول ، تم التعامل مع 36 حرفًا على أنها مطلوبة (الملحق 2 عبر الإنترنت متاح كمواد تكميلية على Dryad على http://dx.doi.org/10.5061/dryad .00ss6). في الثانية ، تم التعامل مع الشخصيات متعددة الدول على أنها غير مرتبة لتجنب صنعها بداهة الافتراضات حول عملية التطور (على الرغم من أن معاملة مثل هذه الشخصيات على أنها غير مرتبة تتضمن افتراضات مبررة بشكل أفضل قد تم التشكيك فيها ، على سبيل المثال ، Lipscomb 1992 Slowinski 1993).

الدعم العقدي

تم تقييم الدعم العقدي باستخدام إعادة أخذ عينات من سكين الرافعة كما هو مطبق على بيانات الشخصية (Farris et al.1996). تم حساب دعم Jackknife في TNT باستخدام 1000 مكرر مع احتمالية إزالة الأحرف المستقلة عند 0.37 (∼e −1 على النحو الموصى به في Farris et al. 1996). تم استخدام بحث إرشادي مع كل مكرر يتكون من 10 متواليات إضافة عشوائية ، مما يوفر 10 أشجار لكل تكرار. تم تلخيص الهياكل الناتجة باستخدام ترددات GC (الفرق بين تكرار استرداد مجموعة معينة والمجموعة المتناقضة الأكثر شيوعًا Goloboff et al. 2003). تُفضل ترددات GC على الترددات المطلقة (الطريقة القياسية لعد الترددات في تحليلات التمهيد والسكاكين) لأنها تمثل الدليل الذي يدعم الكليد بالإضافة إلى مقدار الأدلة التي تزيف هذا الفرع.

المصفوفات المقارنة

لتقييم تأثير أخذ عينات المجموعة الخارجية على طوبولوجيا الأشجار ، تم التحقيق في اثنين من مصفوفات شخصية كروكوديلومورف التي تم نشرها مسبقًا (Turner and Buckley 2008 Sereno and Larsson 2009). يتكون تحليل Turner and Buckley (2008) من 75 تصنيفًا و 290 حرفًا ويتضمن Gracilisuchus storanicorum, Terrestrisuchus gracilis، و Dibothrosuchus elaphros كأصناف خارج المجموعة (متجذرة في جراسيليسوكس). يتضمن تحليل Sereno and Larsson (2009) 43 تصنيفًا و 252 حرفًا (متجذرة في البروتوسوتشيان Orthosuchus Stormbergi). لم يتم تعديل كلتا المصفوفتين باستثناء إضافة تصنيفات مجموعة خارجية جديدة. في حالة Turner and Buckley (2008) ، اصنفة المحطة الواحدة بوستوسوكس كيركباتريكي تمت أضافتة. لأغراض المقارنة ، كلاهما بوستوسوكس و جراسيليسوكس تمت إضافتها إلى مجموعة بيانات Sereno و Larsson (2009). تم تحليل مجموعات البيانات هذه باستخدام البخل غير الموزون في TNT v.1.1 ونفس معلمات البحث الموصوفة أعلاه. تضمن كلا التحليلين أحرفًا مضافة ، وتم الاحتفاظ بها على هذا النحو. جراسيليسوكس تم تعيينه كجذر لكلا المصفوفتين. جميع مجموعات بيانات علم الوراثة متاحة كمواد تكميلية على درياد على http://dx.doi.org/10.5061/dryad.00ss6.


كيفية بناء شجرة النشوء والتطور في Geneious Prime

تُستخدم أشجار النشوء والتطور لاستنتاج العلاقات التطورية بين المتتاليات. يمكن للجينات بناء أشجار النشوء والتطور باستخدام المسافة ، أو أقصى احتمالية أو طرق بايزي. يصف هذا الدليل الخطوات الأساسية لبناء شجرة والتعامل مع عارض الشجرة في Geneious.

قبل الشروع في بناء شجرتك ، يجب أن تتعرف على مبادئ بناء الأشجار ونقاط القوة والضعف في كل طريقة. المراجعة أدناه مكان جيد للبدء.

1. قم بمحاذاة التسلسلات الخاصة بك

قبل أن تتمكن من بناء شجرة النشوء والتطور ، تحتاج إلى محاذاة التسلسلات الخاصة بك. للقيام بذلك ، حدد كل التسلسلات الخاصة بك واختر محاذاة / تجميع - محاذاة متعددة. يوفر هذا الارتباط دليلًا للخوارزميات المتاحة.

بمجرد أن تصبح راضيًا عن المحاذاة الخاصة بك ، حددها وانقر فوق شجرة لفتح خيارات بناء الشجرة.

2. اختر منشئ الشجرة والمعلمات

في الجزء العلوي من خيارات بناء الشجرة ، سترى خوارزميات بناء الشجرة المتاحة. يتضمن ذلك Geneious Tree Builder (و Consensus Tree builder) وأي مكونات إضافية قمت بتثبيتها.

ينتج Geneious Tree Builder أشجار مسافة باستخدام طرق Neighbor-Join أو UPGMA. بالإضافة إلى ذلك ، تتوفر المكونات الإضافية التالية لإنتاج الحد الأقصى من الاحتمالية أو البخل أو أشجار Bayesian:

RAxML - أقصى احتمالية ، مُحسَّن لمجموعات البيانات الكبيرة

FastTree - أقصى احتمال تقريبي لمجموعات البيانات الكبيرة للغاية

PAUP * - البخل أو الحد الأقصى من الاحتمالية (يتطلب نسختك الخاصة من PAUP * ، إما الإصدار 4.0b10 أو 4.0a149 وما فوق من هنا)

يتوفر مزيد من المعلومات حول بناة الأشجار القصوى على هذا الرابط.

كل منشئ شجرة له واجهة مختلفة لتحديد النموذج التطوري والمعلمات الأخرى. نقترح عليك الرجوع إلى دليل المستخدم لكل منشئ شجرة لتتعرف على الخيارات المتاحة. قد ترغب أيضًا في استخدام برنامج مثل Modeltest خارج Geneious لتحديد أفضل نموذج لبياناتك قبل إنشاء الشجرة.

3. قم بتشغيل الشجرة الخاصة بك

انقر فوق "موافق" لبدء بناء الشجرة الخاصة بك. سيختلف الوقت الذي يستغرقه بناء الشجرة اعتمادًا على الخوارزمية التي اخترتها ، وحجم المحاذاة والمعلمات (مثل عدد النسخ المتماثلة للتمهيد) التي اخترتها. عادةً ما تكتمل أشجار المسافات بسرعة إلى حد ما (خلال دقائق) ، ولكن قد تستغرق أقصى درجات الاحتمالية وأشجار Bayesian ساعات أو حتى أيامًا للتشغيل.

4. عرض شجرتك

عندما تنتهي الشجرة من العمل ، سيتم إنشاء مستند شجرة جديد وسيفتح تلقائيًا في العارض. بشكل افتراضي ، يعرض Geneious الأشجار في تخطيط مستطيل (متجذر) ، حتى إذا كانت الشجرة غير مجذرة. يمكن العثور على خيارات التنسيقات الدائرية أو الشعاعية ضمن ملف عام علامة التبويب ، جنبًا إلى جنب مع عناصر التحكم في التكبير / التصغير.

إذا كنت ترغب في تجذير الشجرة الخاصة بك ، فانقر فوق عقدة التصنيف الذي ترغب في تحديده على أنه المجموعة الخارجية وانقر فوق جذر. لقلب موضع الأصناف عموديًا ، دون تغيير الهيكل ، استخدم تبادل الأشقاء اختيار.

تحتوي عناصر التحكم الموجودة أعلى العارض أيضًا على خيارات للتلوين وتعيين أحجام الخطوط على شجرتك. لتلوين كليد بأكمله ، حدد العقدة الموجودة في قاعدة الكليد وحددها عقد اللون.


1 إجابة 1

أنت بحاجة إلى دعم التمهيد باستخدام خوارزمية بناء شجرة قائمة على نموذج ، عبر أقصى احتمال (يستخدم عدد قليل من الأشخاص Bayes). تنسيق الملف هو تنسيق phylip مريح (يرجى إرسال سؤال منفصل إذا واجهت صعوبات هنا - إنه صعب بعض الشيء).

أنا أستخدم RAxML القياسي هنا ، وتحديدًا raxmlHPC (يمكن تنزيله بسهولة وتجميعه على نظامي Linux و OSX). الرموز معقدة للغاية وقد قدمتها أدناه.

شجرة احتمالية قصوى قوية ،

ستعمل هذه الشجرة على تمهيد 500 تكرار ، ولكن للبدء ، سأستخدم 100 تكرار.

اصنع شجرة إجماع لأعمال التمهيد ،

أنت تحتاج إلى دعم bootstrap> 80٪ ويرجى تكرار ذلك مع وبدون 5-2 / 5-3 (لا يزال يبدو طويلاً)

المجموعة التي يمكنك الوصول إليها جيدة للحساب ، وسوف يستغرق الأمر حوالي 24 ساعة لإكمال حساب تمهيد واحد لمجموعة بيانات واحدة ومن الواضح أنك بحاجة إلى موازنة حسابك عبر 22 contigs.

عرض الشجرة ، يعتبر FigTree (لنظام التشغيل Mac OSX) أمرًا سهلاً.

يمكن أن يكون التجذير معقدًا لأنني لا أعرف حقًا البكتيريا الخاصة بك.

تعد مسألة إعادة التركيب أكثر تعقيدًا ، لكنني سأبني 22 شجرة من كونتيكس الخاص بك وتقييمها من أجل التطابق. Panmixia هو مصدر قلق ، مما يعني الكثير من إعادة التركيب


كيف تقرأ شجرة النشوء والتطور

لقد مر أكثر من 50 عامًا منذ أن اقترح ويلي هينيغ طريقة جديدة لتحديد علاقات الأنساب بين الأنواع ، والتي أطلق عليها اسم علم الأنساب النظامي. ومع ذلك ، لا يزال الكثير من الناس يتعاملون مع الطريقة بحذر ، قلقين من أنهم سيضطرون إلى التعامل مع عدد هائل من المصطلحات والمفاهيم الجديدة. في الواقع ، قراءة وفهم أشجار النشوء والتطور ليس بالأمر الصعب على الإطلاق. ما عليك سوى تعلم ثلاث كلمات جديدة ، التشابك العصبي ، التشابك العصبي ، والتشكيل. جميع المفاهيم الأخرى (على سبيل المثال ، الأسلاف ، المجموعات أحادية الفصيلة ، المجموعات شبه الحركية) هي مفاهيم مألوفة كانت بالفعل جزءًا من التطور الدارويني قبل وصول هينيج إلى المشهد.

نقوم أنا ودان بروكس بتدريس دورة التنوع البيولوجي (EEB 265) لطلاب السنة الثانية في جامعة تورنتو. يتم تنظيم الدورة بأكملها حول إطار نسبي. نبدأ بالشجرة الكبيرة ، وإن كانت مبسطة ، من Metazoa ، ثم نعمل في طريقنا من الإسفنج إلى الثعابين ، مع التركيز على الشخصيات التي تربط المجموعات معًا والشخصيات التي تجعل كل مجموعة فريدة. إذا كنا نقوم بعملنا بشكل صحيح ، يجب أن يكون طلابنا قادرين على الإجابة على الأسئلة التالية - ما هو هذا الحيوان (كيف تعرف)؟ ماذا تعمل، أو ماذا تفعل؟ ما الذي يجعلها مميزة؟ ما هي جوانب بيولوجيتها التي تجعلها عرضة للتدخل البشري؟ نظرًا لأن جميع الطلاب قد أخذوا بالفعل مختبرًا في السنة الأولى من علم الأحياء يغطي أساسيات علم الوراثة ، فقد افترضنا أننا لن نحتاج إلى مراجعة منهجية التطور في دورة التنوع البيولوجي لدينا. لم يستغرق الأمر وقتًا طويلاً حتى أدركنا أن افتراضنا كان ساذجًا بحلول الوقت الذي وصل فيه العديد من الطلاب إلى EEB 265 ، وكانوا قد نقروا بالفعل على زر الحذف بجوار "علم الوراثة" في عقولهم. من دواعي التواضع دائمًا (إعادة) اكتشاف أنه لا يشارك الجميع وجهات نظرك حول الأشياء المثيرة للاهتمام والمهمة في الحياة!

العودة الى لوحة الرسم. تتمثل إحدى المشكلات الرئيسية في تدريس دورة تدريبية حول تنوع metazoan في أنك ببساطة لا تملك الوقت الكافي لتغطية جميع المجموعات. آخر شيء أردنا القيام به هو التضحية بالمحاضرات القائمة على علم الأحياء من أجل مناقشة النظرية. لذا ، كان التحدي بسيطًا: صمم محاضرة ، في غضون 50 دقيقة ، تعلم الطلاب كيفية فهم ما تخبرهم به شجرة النشوء والتطور. لم يكن هدفنا تعليم الطلاب كيفية صنع الأشجار ، وكيفية قراءتها فقط. هذه الورقة مبنية على تلك المحاضرة.

كلمة "نسالة" هي مزيج من كلمتين يونانيتين ، طبع (القبيلة - على وجه الخصوص ، أكبر تقسيم سياسي فرعي في الدولة الأثينية القديمة [www.yourdictionary.com www.etymonline.com]: كلمة أخرى نحصل عليها من هذه "اللجوء") و الجينات (الأصل [www.etymonline.com]: كلمة أخرى نحصل عليها من هذا هي "الجين"). صاغها عالم الأحياء التطوري إرنست هيجل في عام 1866 ثم دافع عنها داروين في عمله الشهير ، حول أصل الأنواع (بداية من الطبعة الخامسة عام 1869). ربط كلا البيولوجيين فكرة "نسالة" - أصل المجموعات - بالتطور. وبالتالي ، فإن أشجار التطور هي مجرد رسوم بيانية تصور أصل وتطور مجموعات من الكائنات الحية.

على الرغم من أنك قد لا تعرف ذلك ، إلا أننا جميعًا على دراية بفكرة أشجار النشوء والتطور. كان الناس يصنعون مثل هذه الأشجار منذ عقود ، مستبدلين كلمة "عائلة" بكلمة "نسالة" (الشكل 1). مثلما يرتبط الأفراد في الأسرة عبر الأجيال بروابط "الدم" (عملية التكاثر التي تنتج النسل) ، ترتبط الأنواع الفردية بالروابط التطورية (العمليات البيولوجية مثل الانتقاء الطبيعي والعمليات الجيولوجية مثل الانجراف القاري أو النهر تغيير المسار الذي ينتج الأنواع). وبهذا المعنى ، فإن الانتواع (إنتاج أنواع جديدة) = التكاثر (إنتاج أفراد جدد). بعبارة أخرى ، نحن جميعًا ، من أفراد من نفس العائلة إلى أفراد من نفس النوع ، مرتبطون بالجينات.

شجرة العائلة لمجموعة مثيرة للاهتمام من الناس. بمصطلحات علم الوراثة ، أشجار العائلة (أنساب الناس) = أشجار النشوء والتطور (أنساب الأنواع)

تميل أشجار العائلة إلى رسمها كما لو كانت معلقة رأسًا على عقب ، مثل عنقود العنب. يتم تصوير أشجار النشوء والتطور بشكل مختلف نوعًا ما. تخيل أنك تحتفظ بشجرة العائلة للقطط الكبيرة الموضحة في الشكل 2 أ. الآن ، اقلبها جانبًا (قم بتدوير 90 درجة عكس اتجاه عقارب الساعة) وستظهر لك الصورة في 2 ب. قم بتدوير هذه الصورة بمقدار 90 درجة أخرى عكس اتجاه عقارب الساعة ، وقم بتنعيمها ، وستظهر لك الصورة الموضحة في الشكل 2 ج (كان شكل الشجرة هذا هو الشكل الذي استخدمه داروين في حول أصل الأنواع). الشيء المهم الذي يجب تذكره هو أن الصور الثلاثة تشير إلى نفس الشيء تمامًا عن العلاقات بين أنواع القطط الكبيرة. تعتمد الطريقة التي تختارها لرسم أشجار النشوء والتطور ، جزئيًا ، على التفضيل الشخصي - يجد بعض الأشخاص أنه من الأسهل قراءة 2 ب ، بينما يفضل البعض الآخر 2 ج.

أج هناك العديد من الطرق لرسم شجرة العائلة / النشوء والتطور للجنس النمر

يتم إعادة بناء أشجار النشوء والتطور من خلال طريقة تسمى "نظاميات النشوء والتطور" (الشكل 3). تقوم هذه الطريقة بتجميع مجموعات الكائنات الحية معًا بناءً على الأحرف المشتركة والفريدة التي يطلق عليها المشابك. على سبيل المثال ، تشارك وجود العمود الفقري مع القطط ، ولكن ليس مع الفراشات. وبالتالي ، فإن وجود العمود الفقري يسمح لنا بافتراض أن البشر يرتبطون ارتباطًا وثيقًا بالقطط أكثر من ارتباطهم بالفراشات (الشكل 4 أ) ، والقطط والأشخاص لديهم عمود فقري ، والفراشات عديمة الشوكة ، الحاشية السفلية 1. ليست كل الشخصيات متشابكة. تسمى بعض السمات تعدد الأشكال، يتم مشاركتها من قبل جميع أعضاء المجموعة. بالعودة إلى شجرتنا ، نرى أن القطط ، والبشر ، والفراشات جميعها لديها حمض نووي (الشكل 4 ب). يسمح لنا وجود الحمض النووي بافتراض أن هذه الأنواع الثلاثة كلها جزء من نفس المجموعة ، لكنه لا يخبرنا بأي شيء عن كيفية ارتباط هذه الأنواع ببعضها البعض. فكر في الأمر بهذه الطريقة: اسم عائلتي يخبرني أنني جزء من عشيرة ماكلينان. إذا قابلت شخصًا يُدعى جيسي ماكلينان ، فأنا أعلم أننا مرتبطون بطريقة ما ، لكن ليس لدي أي فكرة عما إذا كانت ابنة عم مفقودة منذ فترة طويلة أو شخصًا من فرع أبعد من شجرة العائلة. المصطلح الأخير الذي تحتاج إلى معرفته هو ذاتي الشكل—الأسماء التي توجد فقط في عضو واحد من المجموعة. على سبيل المثال ، يمكن تمييز الفراشات عن القطط والناس لأن لديهم هيكلًا خارجيًا مصنوعًا من مادة الكيتين (مشتق جلوكوز قوي ومقاوم للماء). تساعدنا Autapomorphies على تحديد نوع معين في مجموعة ، لكنها ، مثل plesiomorphies ، لا تخبرنا شيئًا عن العلاقات داخل المجموعة. بشكل عام ، يمكن تشبيه هذه الأنواع الثلاثة من الشخصيات بقصة Goldilocks: تكون الأشكال متعددة الأشكال شديدة الحرارة (منتشرة جدًا) ، والتشكيلات الذاتية شديدة البرودة (محدودة للغاية) ، والتشابك التشابهي صحيح تمامًا (لتحديد العلاقات التطورية).

أساس علم الوراثة النظامي

تحديد أنواع الشخصيات على شجرة النشوء والتطور. أ التشابك العصبي ب تعدد الأشكال ج ذاتي الشكل

ما يكفي من الشخصيات في الوقت الحالي إلى الأشجار نفسها. لماذا تحمل الفروع الموجودة على الشجرة أسماء (على سبيل المثال ، أسد ، نمر ، إلخ) ، بينما لا تحمل الخطوط التي تربط الفروع المختلفة معًا (الشكل 5)؟ هذا لأن هذه الخطوط تمثل أسلاف. السلف هو نوع خضع لحدث انتواع لإنتاج أنواع سليلة. عادة ما "يختفي" الجد أثناء عملية التنوّع. هل هذا يعني أن السلف قد انقرض؟

العثور على أسلاف على شجرة النشوء والتطور

للإجابة على هذا السؤال ، يجب علينا السفر لبعض الوقت حاملين جهازًا رقميًا يسجل كل ما نراه (الشكل 6). تخيل أنك سافرت إلى الوراء 10000000 سنة ، ثم توقف ، مفتونًا بنوع مثير للاهتمام من السحالي ذات البقع الحمراء على ظهرها (النوع أ). بعد فترة ، قررت المضي قدمًا في غضون خمسة ملايين سنة أو نحو ذلك ثم توقف مرة أخرى. أنت تبحث وتكتشف نوعين جديدين من السحالي ، أحدهما به بقع زرقاء على ظهره (النوع B) والآخر به خطوط حمراء (النوع C) ، لكن الأنواع A لا يمكن رؤيتها في أي مكان. هل انقرضت؟ تنظر إلى تسجيلك الرقمي لتلك الخمسة ملايين سنة وتكتشف أن الأنواع A انقسمت إلى مجموعتين ، والتي أصبحت مختلفة في بعض النواحي عن بعضها البعض عبر الزمن. من الناحية التطورية ، النوع A هو سلف (سلف 1) والنوعان B و C هما من نسله. تقدم سريعًا إلى اليوم (مع المزيد من المواد الرقمية لمشاهدتها) وستجد ثلاثة أنواع من السحالي: صديقك القديم ، السحلية الزرقاء المرقطة (النوع B) واثنين من السحالي الجديدة (أحفاد النوع C ، السحلية المخططة الحمراء) ، واحدة باللون الأزرق المشارب (النوع D) والآخر ذو الظهر الأسود الصلب (النوع E). اليوم ، إذن ، هناك ثلاثة أنواع فقط من السحالي على قيد الحياة. لم تعد ترى أيًا من الأسلاف (السحالي الحمراء المرقطة والحمراء المخططة) ، لكننا ما زلنا نعرضها على شجرة النشوء والتطور.

السفر عبر الزمن لاكتشاف الأجداد

الجواب على سؤالنا الأصلي "هل انقرض الجد؟" وبالتالي لا! في كثير من الحالات ، يتم تقسيم السلف و يتم تمرير المعلومات البيولوجية (الجينية) المتضمنة في السلف إلى الأنواع السليفة. بمرور الوقت ، يتغير الأحفاد ويصبحون مختلفين في بعض النواحي عن بعضهم البعض وعن السلف ، مع الاحتفاظ ببعض الأشياء المشتركة (على سبيل المثال ، جميع أنواع السحالي لدينا عمود فقري). هذا هو التطور.

إذن ما الذي يعتبر حقًا انقراضًا؟ الانقراض هو فقدان المعلومات البيولوجية - الخسارة المادية للأنواع. على سبيل المثال ، ضع في اعتبارك شجرة نسج مبسطة للديناصورات (الشكل 7). انقرضت جميع المجموعات الموجودة على الفروع المنقطة - لم يعد أي من الأنواع في هذه المجموعات موجودًا على هذا الكوكب (على الرغم من Jurassic Park) ، مما يعني أن جميع المعلومات التي كانت فريدة من نوعها لكل مجموعة من هذه المجموعات. كانت المجموعة الوحيدة التي تمكنت من تجنب الانقراض هي Aves (أو الطيور) - الأنواع الطافية هي آخر الديناصورات المتبقية.

الانقراضات الفعلية. انقرضت المجموعات التي تم تصويرها بخطوط منقطة ، لذا فُقدت جميع السمات الجينية والمورفولوجية والفسيولوجية والبيئية والسلوكية التي تنفرد بها كل مجموعة في المحيط الحيوي

حسنًا ، دعنا نأخذ ما تعلمناه عن الأسلاف ومجموعات المجموعات بناءً على الأحرف المشتركة والفريدة (التشابك العصبي) ونستخدم ذلك لفك تشفير المعلومات الموجودة داخل شجرة النشوء والتطور. إليكم شجرة تصور العلاقات بين الأعضاء الأحياء في Amniota ، وهي مجموعة كبيرة من الفقاريات تضم معظم الحيوانات المألوفة لديك (الشكل 8). أنت تعلم بالفعل أن أسماء الأنواع ، أو مجموعات الأنواع ، مكتوبة عبر أطراف الفروع على الشجرة. الشيء التالي الذي يجب أن تعرفه هو أن الشخصيات تم تصويرها في نقطة نشأتها على شجرة نسج. لذلك ، في هذه الشجرة ، يمكنك أن ترى أن (1) البويضة التي يحيط بالجنين نشأت في الجد 1 وتم نقلها إلى جميع أحفادها (الثدييات ، سلف 2 ، السلاحف ، سلف 3 ، سلف 4 ، تماسيح ، طيور ، سلف 5 ، تواتارا والسحالي والثعابين). من الناحية التطورية ، فإن البويضة التي يحيط بالجنين هي سمة فريدة لا يتقاسمها إلا السلف 1 وجميع أحفاده (2) نوع خاص من بروتين الجلد (β كيراتين) نشأ في السلف 2 وتم نقله إلى جميع أحفاده ( السلاحف ، سلف 3 ، سلف 4 ، تماسيح ، طيور ، سلف 5 ، تواتارا وسحالي بالإضافة إلى الثعابين). β الكيراتين هو سمة فريدة تشترك فيها مجموعة تسمى "Reptilia" و (3) ذيل قابل للكسر نشأ في سلف 5 وتم نقله إلى جميع أحفاده (tuataras ، السحالي بالإضافة إلى الثعابين). الذيل القابل للكسر هو سمة فريدة يتقاسمها أعضاء مجموعة التواتارا + السحالي + الثعابين.

كيف تقرأ الأحرف على شجرة النشوء والتطور

في الواقع ، كل كائن حي عبارة عن فسيفساء معقدة من آلاف السمات. إذا كنت لا تصدق هذا ، اجلس واذكر كل السمات التي تجعلك أنت. بالإضافة إلى الأشياء الواضحة مثل لون العين ولون الشعر ، لا تنس حقيقة أن لديك الحمض النووي الريبي ، والحمض النووي ، والخلايا الفردية ، والنهاية الأمامية والخلفية ، والجمجمة ، والفكين ، والعظام ، والذراعين ، والساقين ، تأتي من السلى. بيضة ، لها ثلاثة عظام في أذنك الداخلية ، وقد رُضعت من الحليب المنتج في الغدد الثديية ، ولها إبهام معاكسة ، وليس لها ذيل. بعبارة أخرى ، عندما تنظر إلى شجرة النشوء والتطور ، سترى أن جميع الفروع تحتوي على حرف واحد على الأقل ، وعلى الأرجح العديد من الأحرف (العلامات المائلة في الشكل 9 أ). لهذا السبب ، غالبًا ما يكون من الصعب بالفعل تسمية جميع السمات الموجودة على الشجرة لأنها تشتت الانتباه بصريًا. تم تطوير طريقة مختصرة للتعامل مع هذه المشكلة: ارسم الشجرة التي توضح العلاقات بين المجموعات (الشكل 9 ب) وقم بإدراج التشابك العصبي لكل فرع في مكان آخر في الجدول. من ناحية أخرى ، إذا كنت مهتمًا بواحدة أو أكثر من السمات المحددة ، فيمكنك إبرازها على شجرة النشوء والتطور دون إظهار جميع الشخصيات الأخرى. على سبيل المثال ، إذا أردت مناقشة تطور الثدييات ، يمكنك إظهار شجرة السلى وإبراز التشابك العصبي للثدييات (على سبيل المثال ، ثلاثة عظام في الأذن الوسطى: الشكل 9 ج). تذكر ، هذا مجرد اختصار!

أج تمثيل الشخصيات على شجرة النشوء والتطور

هناك شيء واحد أخير في الشخصيات من المهم أن نفهمه: الشخصيات ليست أشياء ثابتة. تتطور عبر الزمن. بعبارة أخرى ، قد لا يبدو "التشابك العصبي" في كل الأنواع التي تمتلكه. لذلك ، على سبيل المثال ، ضع في اعتبارك عظم الركاب ، أحد العظام الثلاثة في الأذن الوسطى المسؤولة عن نقل الموجات الصوتية من طبلة الأذن إلى غشاء الأذن الداخلية. هذا العظم الصغير له تاريخ تطوري طويل ومعقد ورائع. لفهم هذا التاريخ ، يجب أن نسافر عدة مئات الملايين من السنين إلى أصل Deuterostomes ، وهي مجموعة كبيرة تضم Echinodermata (نجم البحر وأقاربهم) ، نصفي الحبال (مخلوقات بحرية تشبه الدودة) ، و Chordata ( amphioxus + tunicates + Craniata [كائنات ذات جماجم]). كان لسلف هذه المجموعة الكبيرة العديد من الشقوق في البلعوم (تسمى الأقواس الحشوية) التي تشارك في التغذية بالترشيح. مر الوقت وظهرت قضبان غضروفية توفر الدعم للأقواس ، وتم تقسيمها وتعديلها. الجزء العلوي من قضيب القوس الحشوي الثاني هو محور قصتنا (الشكل 10). مع تقدمنا ​​أكثر في الوقت المناسب ، تخضع هذه الشخصية للعديد من التعديلات الهيكلية والموضعية في جوهرها ، وتصبح أكبر ، وأكثر قوة ، وتشارك في دعم الفكين (عند هذه النقطة تسمى hyomandibula) ، وتتغير من الغضروف إلى العظام ، ثم يبدأ في الانخفاض التدريجي في الحجم ، وينفصل عن منطقة الفك / الخد ، ويتحرك إلى الأذن الوسطى (عند هذه النقطة يطلق عليه الركاب). بشكل عام ، فإن الجزء العلوي من القوس الحشوي الثاني - عظم الفك السفلي - هو نفس الهيكل الذي تم تعديل شكله ووظيفته على مدى مئات الملايين من السنين. لذلك ، على الرغم من أن وجود "قضيب غضروفي في القوس الحشوي الثاني الموجود في منطقة الحلق" قد يكون تشابكًا مشابكًا لـ Craniata ، فلن تجد هذا الهيكل الدقيق في أي حيوانات رباعية الأقدام. بدلًا من ذلك ، ما ستجده هو تعديل ذلك القضيب الغضروفي ، الركائز. يسمى التطور المستمر لشخصية معينة بعد نقطة نشأتها بـ سلسلة التحول التطوري.

التشابهات العصبية ليست ثابتة وقد تستمر في التطور. التغييرات في الحرف "الجزء العلوي من القوس الحشوي الثاني" [hyomandibula ، ركاب] يتم تتبعها على شجرة النشوء والتطور في الحبليات (الحيوانات ذات الحبال الظهري). تم تبسيط كل من القصة وشجرة النشوء والتطور إلى حد كبير للتأكيد على فكرة أصل الشخصية وتعديلها بدلاً من التفاصيل الدقيقة لتطور الشخصية. الأسماء بخط مائل تشير إلى الأنواع المنقرضة المعروفة من الحفريات. يمكن العثور بسهولة على الرسومات الخطية والصور الفوتوغرافية لمختلف الهياكل والأنواع على الويب

الشيء التالي الذي يجب على طلاب علم الوراثة معرفته هو كيفية التعرف على أنواع مختلفة من مجموعات الكائنات الحية. هناك نوعان عامان من المجموعات ، أحدهما "جيد" والآخر "سيئ".

لنبدأ بـ "الطيب" ، مجموعة أحادية النمط (الشكل 11). كلمة "monophyletic" هي مزيج من كلمتين يونانيتين ، مونو (مفرد) و طبع (قبيلة). لقد صاغها صديقنا القديم إرنست هيكل ، الذي ، كما تتذكر ، اخترع أيضًا كلمة نسالة. A monophyletic group includes an ancestor and الكل من نسله. It is identified by the presence of shared, unique characters (synapomorphies). Each phylogenetic tree contains as many monophyletic groups as there are ancestors. For example, looking at the tree in Fig. 11, we can identify five monophyletic groups, only two of which are shown on Fig. 12 (I’ll leave it up to you to discover the other three).

Identifying monophyletic groups

Two of the five monophyletic groups on the hypothetical tree

Now onto “the bad.” The word “paraphyletic” is, once again, a combination of two Geek words, الفقرة (near) and phyle (tribe), so the implication is that the whole tribe is not present (Fig. 13). Paraphyletic groups include an ancestor but ليس كل شيء من نسله. On this hypothetical tree, species C has been eliminated from the group, even though it is a descendant of ancestor 1 just like the rest of the species. Paraphyletic groups are problematic because they mislead us about how characters evolve and how species are related to one another. For example, let’s consider the big tree for the Amniota and highlight the “old” Reptilia, one of the most famous paraphyletic groups (Fig. 14). Even today people still speak about three distinct classes, the reptiles, the birds, and the mammals. When you look at this figure, what is wrong about the class Reptilia, the way it is drawn?

Identifying paraphyletic groups

The most famous paraphyletic group, the reptiles

حق! In (Fig. 15) Ancestor 2 is the ancestor of all the reptiles but, as highlighted on this figure, the Reptilia does not include all of ancestor 2’s descendants ancestor 4 and the birds have been removed from the group. The only way to make the Reptilia a monophyletic group is to redefine the term to include crocodiles, turtles, tuataras, lizards, snakes, و الطيور. In the past, birds were not considered to be reptiles because they are warm-blooded (in fact, they were often grouped with mammals because of that trait). But phylogenetic studies have demonstrated that birds are indeed reptiles because they share many morphological, behavioral, and molecular characters with other reptilian species in general (synapomorphies originating in ancestor 2 e.g., β keratin), و they share many characters with crocodiles in particular (synapomorphies originating in ancestor 4 e.g., holes in the skull just in front of the eyes).

How to make the Reptilia monophyletic

Why is it important to have monophyletic groups? Say you wanted to figure out how red hair appeared in your family. What would be your chances of tracking down your original red-haired ancestor if no records were kept about the union between your great-great-great-great grandfather Sven and his Irish bride Maggie? Missing information creates problems for any research, be it genealogical or evolutionary, and paraphyletic groups are missing information. In evolutionary terms, monophyletic groups are “real” biological units that is, they are the product of descent with modification (an ancestor and all of its descendants) and as such can be used to study the evolutionary processes that produced them. Paraphyletic groups, on the other hand, are the product of “human error” arising from incomplete or flawed information (e.g., poor descriptions of characters). Using such groups to study evolutionary processes will direct us along misleading and confusing pathways.

Why do we use phylogenetic trees? There are many ways to answer this question (and many papers/books written about it), but the most general answer is that trees summarize valuable information about the evolution of organisms that allows us to understand them better. For example, here’s the family tree for the Hominoidea, the group that includes us and all of our closest relatives (Fig. 16). When you look at the distribution of characters on this tree you can see that a number of traits we associate only with human beings, such as hunting, infanticide, tool making, self-awareness, and language, originated long before الانسان العاقل. In other words, human beings are not as unique as you might think. If we want to understand how and why those traits evolved, we must study their expression and function in ourselves and in our relatives. So much information from just one phylogenetic tree!


Phylogenetic Trees Tutorial

Investigate the evolutionary origins of HIV

ملحوظة: To complete the tutorial with the referenced data please download the tutorial above and install in Geneious Prime.

In this tutorial, you will use Geneious Prime to investigate the evolutionary origins of human immunodeficiency viruses (HIVs) using molecular phylogenetic tools. You will learn how to align sequences and build a phylogenetic tree, as well as how to view and manipulate the tree to answer questions on the origins of HIV-1.

Introduction: Human and Simian Immunodeficiency Viruses

HIVs, the causes of acquired immune deficiency syndrome (AIDS), are closely related to simian (monkey and ape) immunodeficiency viruses (SIVs). These and other similar viruses are retroviruses. Retroviruses are characterised by their RNA genomes, which once inside a host cell, are reverse transcribed into DNA and then integrated into the host cell’s genome. The integrated viral genome is known as a provirus. You will be working with proviral DNA sequences.

The origins of HIVs were mysterious when these viruses were first discovered in the early 1980s. There are two types of HIVs. HIV type 1 (HIV-1) is more widespread and causes more severe disease than HIV type 2 (HIV-2). HIV-1 is also far more diverse than HIV-2. HIV-1 is classified into three major groups: M, N, and O. The viruses causing the AIDS pandemic (widespread epidemic) belong to Group M. Group M is subdivided into several subtypes. You will be analysing sequences from HIV-1 Group M Subtypes A, B, C, D, F, G, H, J, K. The HIV-1 viruses infecting people in North America, Europe and Australia are mostly from Group M Subtype B. All groups and subtypes of HIV-1 and HIV-2 are found in Africa.

Both HIV-1 and HIV-2 are closely related to SIVs found in a variety of African primate species. This lead early on to researchers hypothesising that HIVs had jumped to humans from one or more African primate species. It was suggested that close contact between humans and monkeys that were kept as pets or hunted for food had allowed the SIVs to jump hosts.

More information on HIV can be found on this Wikipedia page.

In this tutorial you will use molecular phylogenetics to determine the evolutionary relationships of HIVs and SIVs, and so determine from which African primates HIVs originated. في التمرين 1 you will build an alignment of the HIV and SIV sequences, then in تمرين 2 you will learn to build a basic phylogenetic tree. Exercises 3 and 4 provide questions and answers to further your understanding on interpreting phylogenetic trees.

SIV sequences and primate taxa

The sequences in this tutorial come from various African primate species known to be infected with different SIVs. There are also three non-African species, all from Asia, that have been infected with SIVs in captivity: the pig-tailed macaque, the rhesus macaque and the stump-tailed macaque. The SIVs from all of these primate species are referred to by the three-letter code given with each picture. For example, the SIV from the sooty mangabey is called SIVSMM and the sequence in the alignment or tree is labelled SIV-SMM.

Mona monkey
Cercopithecus mona mona [denti]
MON [DEN]

de Brazza’s monkey
Cercopithecus neglectus
DEB

Tantalus monkey
Chlorocebus tantalus
TAN

Syke’s monkey
Cercopithecus albogularis
SYK

Greater spot-nosed monkey
Cercopithecus nictitans
GSN

Green monkey
Chlorocebus sabaeus
SAB

Mustached guenon
Cercopithecus cephus
MUS

Vervet monkey
Chlorocebus pygerythrus
VER

Grivet
Chlorocebus aethiops
GRV

L’Hoest’s monkey
Cercopithecus lhoest
LST

Sooty mangabey
Cercocebus atys
SMM

Red-capped mangabey
Cercocebus torquatus
RCM

Sun-tailed monkey
Cercopithecus solatus
الشمس

Mandrill
Mandrillu sphinx
MND

تدريبات
Mandrillus leucophaeus
DRL

Pig-tailed macaque
Macaca nemestrina
MNE

Stump-tailed macaque
Macaca arctoides
STM

Rhesus macaque
Macaca mulatta
MAC

Common chimpanzee
الكهوف عموم
CPZ

Exercise 1: Multiple alignment of HIV and SIV sequences

Before a phylogeny can be constructed, the sequences must be aligned. The objective of sequence alignment is to maximize the similarity between sequences, inserting gaps in sequences where necessary to improve the overall alignment.

Multiple alignment algorithms use a scoring system where sequence matches and mismatches for each site are assigned a value, and gaps are penalized. The insertion of gaps in an alignment can increase the similarity of the surrounding bases, so the overall alignment score is a trade-off between the increased match/mismatches scores and the cost of opening and extending a gap.

In this exercise you will construct an alignment of 62 الحسد sequences of HIV-1, HIV-2, and various SIVs. The SIV sequences come from various African and non-African primate species.

ال الحسد gene is found in all retroviruses. It codes for two viral envelope glycoproteins that are positioned on the virion surface and interact with host cell-surface receptors.

Click on ‘HIV_sequences’ to view the sequences.

The sequences are labelled in the format: virus type followed by the common name of the primate species for the SIV sequences, or the group or subtype for HIV-1 and HIV-2 sequences finally followed by the accession number.

To align these sequences, go to Align/Assemble -> Multiple Align. Geneious has 3 different alignment programs built in (Geneious aligner, MUSCLE, and Clustal Omega), plus a plugin for the MAFFT aligner is available. For further information on these aligners please see this article. We will use the MUSCLE aligner for this example, as it is suitable for a medium sized dataset.

يختار MUSCLE alignment from the alignment options. We will use the default parameters, so click on the settings cog in the bottom left of the window and choose Reset to defaults (if it is greyed out, the default parameters are already set). انقر على More Options button to view the parameters if you wish. انقر OK to start the alignment – it may take several minutes to complete.

Once the alignment has completed, click on it to view it and zoom in to see the bases. Note that there are many large gaps, which is characteristic of an alignment of a rapidly evolving gene in divergent species.

Exercise 2: Build a Phylogeny of HIVs and SIVs

In this exercise you will construct a phylogeny using the Neighbour-Joining tree building method and the Tamura-Nei model. Models of evolution describe expected frequencies of each nucleotide and the rate of change between nucleotides. The Tamura-Nei model assumes each base has a different equilibrium frequency and allows transitions and transversions to occur at different rates. It allows the two types of transitions (A ↔ G and C ↔ T) to have different rates. This is useful when analysing HIV sequences because HIV exhibits hyper G-to-A mutation caused by a host enzyme (APOBEC3G). You will use the Neighbour-Joining method because these sequences do not, in general, evolve in a clock-like manner.

Select the alignment you created in Exercise 1.

To construct a Neighbour-Joining tree using the Tamura-Nei model, with bootstrapping, click the شجرة button and select the Geneious Tree Builder. Check that the default parameters are initially set by clicking Reset to Defaults.

For the genetic distance model select Tamura-Nei and for the tree build method select Neighbor-Joining. Set the outgroup to “SIV-MON Mona monkey AY340701”. This sequence will be used to root the tree.

To calculate support values for the tree use bootstrapping. To do this, tick the box next to Resample tree واختر Bootstrap in the dropdown box next to resampling method. Set number of replicates to 100 and the support threshold to 0.

The tree building options should now look similar to this:

انقر OK to build the tree.

Once the tree builder completes, the tree document will appear in the document table in Geneious and should open automatically.

Viewing and Manipulating Phylogenetic Trees

A phylogenetic tree is a branching diagram of evolutionary relationships. It contains information about the order of evolutionary divergences within, and hence about the relationships among, a group of organisms. It can also contain information about the amount of evolutionary change which occurred between any two branching events. The lines on the the tree are called branches and the intersections of these lines are called nodes. A node represents a branching event in the tree. The branching pattern of a tree is called its topology. The topology shows how organisms are related to one another.

Depending on the size of your screen and the size of the tree, it may not be physically possible to display all of the sequence names on the tree, so Geneious will only display some of the sequence names. To zoom in on the tree, use the تكبير slider under “General” in the panel on the right hand side of the tree view. To expand the distance between the branches of the tree, use the توسع slider. As the amount of space between the branches increases, more sequence names will be displayed on the tree.

As this tree was created using an alignment in Geneious, the alignment is attached to the tree. Click on the “Alignment View” tab to view the alignment.

The sequences in the alignment are sorted according to the topology of the tree. On the left hand side of the sequence names, you can see the tree topology (this may not be visible if you are working with large trees). Select the “SIV-MON Mona monkey AY340701” sequence in the alignment then return to the “Tree View”. This sequence is now selected in the tree as well.

The sequences used to build this alignment and tree have additional meta-data associated with them (this is the data found in the “Properties” field in the “Info” tab in the individual sequence documents). This information can be displayed on the tips of the trees. To display the organism on the tips of the tree, select “Organism” from the box next to “Display” under “Show Tip Labels”.

To display the organism and host organism, hold Ctrl (on Windows) or Cmd (on Macs) and select “Organism” and “Host Organism”. Now the host organism and organism are displayed on the tips of the tree, separated by a comma. To display the sequence names on the tree, select “Names”.

Just as a sentence can be printed using different fonts, or colors of ink, without any change in meaning, so too can trees be represented in different shapes and orientations. The information encoded in the tree remains unchanged, even as the appearance changes. For example, the appearance of the tree can be changed by rotating groups of branches. To rotate the branches, select an internal node in the tree and click the Swap Siblings button at the top of the window. This will rotate the branches in that subtree however, the degree of relatedness is not altered by rotating branches in a tree. Simply having two names close together in a tree does not imply any close relationship.

Try this with the tree you have created. Select the node in the tree containing the Grivet monkey and the four Vervet monkeys and click the Swap Siblings زر.

The order of these samples will change in the tree, but the relationship between the sample from the Grivet monkey and those from the four Vervet monkeys has not changed.

Rooted Trees

Trees may be unrooted or rooted. To view the HIV tree as an unrooted tree, click one of the unrooted views under the “General” options in the panel on the right hand side of the tree view.

Unrooted trees do not tell us much about evolutionary relationships. We cannot tell which node is the ancestor and which are the descendent nodes on the tree. To establish ancestor-descendent relationships we need to identify a suitable outgroup and then root the tree on the branch separating the outgroup from the remainder of the tree (the ingroup). We can specify the root before the building the tree to produce a rooted tree, or we can specify the root after the tree is built to change an unrooted tree to a rooted tree.

When you built the tree of HIV and SIV sequences you specified an outgroup (“SIV-MON Mona monkey AY340701”) so Geneious has produced a rooted tree. To view the tree as a rooted tree, click the rooted view under the “General” options in the panel on the right hand side of the tree view.

Rooted phylogenetic trees may be oriented horizontally, as above, or vertically. Here the time axis is implicit, running from left to right. The node at the left end of the tree is the root node, which represents the oldest point on the tree. As we move from the root node, we can identify nodes which are ancestral to their descendent clades. Working in from the tips of the tree enables us to identify close and distant relatives. The degree of relatedness of any two organisms is given by how far back on a rooted tree you must go to find their common ancestor. If, in tracing back to the common ancestor of A and B, you pass the common ancestor of A and C, then you can say that A and C are more closely related than A and B.

On a rooted tree, each node and all of its descendent nodes form a clade. This is what we would commonly refer to as a “branch” on a real tree – the physical branch and all the little branches and leaves attached to it. Because an unrooted tree lacks the time axis described above, it is inappropriate to discuss clades in that context.

Phylograms and cladograms

The lengths of the branches of a tree may be arbitrary (eg. cladogram) or can represent the amount of the evolutionary change (phylogram).

In a phylogram, the lengths of the branches are proportional to the amount of change which occurred between those branching events. As the tree you built was estimated using a distance (1 – similarity) measure (i.e. NJ), the proximity of nodes represents their overall degree of similarity.

To display the lengths of the branches of the tree, in the panel on the right hand side of the tree view, select “Substitutions per site” from the dropdown box next to “Display” under “Show Branch Labels”.

On your tree, find “SIV-MAC Rhesus macaque M33262” and “SIV-MNE Pig-tailed macaque U79412” and look at the length of the branches separating these two taxa. Now find “SIV-RCM Red-capped mangabey AF382829” and “SIV-RCM Red-capped mangabey AF349680” and look at the length of these branches. The length of the branches separating the SIV-MAC and SIV-MNE sequences is shorter than the length of the branches separating the two SIV-RCM sequences. From this you can conclude that SIV-MAC is more similar to SIV-MNE, than the two SIV-RCM sequences are to each other.

If an optimality method (e.g., MP or ML) was used to estimate the tree then the proximity of two nodes reflects the number of evolutionary changes in character states estimated to have occurred between them. If the total branch length from the root of a tree to organism A at one tip is much greater than from the root to organism B at another tip, then you can say that evolution has been faster in the A lineage than in the B lineage for the characters on which the tree was based.

To transform the tree to a cladogram, tick the Transform branches box in the “Formatting” options. In the dropdown box next to Transform تحديد Cladogram

Notice how the branch lengths of the tree change and all of the tips of the tree are aligned on the right hand side of the tree view. With this transformation the lengths of the branches are meaningless. If you now look at “SIV-MAC Rhesus macaque M33262” and “SIV-MNE Pig-tailed macaque U79412” and then look at “SIV-RCM Red-capped mangabey AF349680” and “SIV-RCM Red-capped mangabey AF382829” you can see that the branch lengths separating SIV-MAC from SIV-MNE are the same lengths as the branches separating the two SIV-RCM sequences. With the transformed branches you can not draw any conclusions about how similar the sequences are to each other.

To convert the tree back to a phylogram, untick the option Transform branches. To hide the branch lengths, untick the box next to “Show Branch Labels”.

Displaying support values

In addition to the information conveyed by the topology of the tree and the branch lengths of the tree, further information can also be written on the nodes and/or branches of the tree. The information that is available to display will depend on the tree building method and the options used. Often, support values are displayed on the tree.

Tree building methods produce the tree which best explains the information in the alignment however, it is unlikely this tree will explain all of the variation in the alignment. Not all of the sites in the alignment will support this tree and not all of the clades in the tree will necessarily be strongly supported by the alignment. For example, with rapid speciation events, there may be insufficient information in the alignment to determine the branching pattern of a group of species, and some of the clades in the tree may have only marginally more support than alternative possible clades.

If you look at the tree you have built it is difficult to tell which clades are strongly supported and which are not. For example, does the clade containing “SIV-RCM Red-capped mangabey AF382829” and “SIV-RCM Red-capped mangabey AF349680” have the same support from the alignment as the clade containing “SIV-MND Mandrill AY159322” and “SIV-MND Mandrill AF367411”?

To find out how strongly the alignment supports each of the clades in the tree, we can calculate support values. In the tree building options you selected the “Bootstrap” resampling method. The bootstrap statistic for a clade in the tree is the percentage of times that clade appeared in the set of bootstrap replicate trees. This percentage ranges from 0% (the clade did not appear in any of the bootstrap trees) to 100% (the clade appeared in all of the bootstrap trees). A bootstrap replicate tree is generated by randomly sampling sites, with replacement, from the alignment, to create a new randomised alignment and then building a tree from this sampled alignment. This process is repeated for the specified number of bootstrap replicates (in your case, this was 100).

To show the bootstrap values on the tree, tick the box next to Show Branch Labels واختر Consensus Support (%) from the dropdown box next to “Display”.

The bootstrap value for a clade will appears to the left of the most recent common ancestral node for that clade.

Now the bootstrap values are displayed on the tree, you can see that there is strong support (100%) for the clade containing the SIV-RCM sequences. However the clade containing the two mandrill sequences has less support (55%). Note that due to the nature of the bootstrapping process, the support values on your tree may be slightly different.

Sometimes it is useful to collapse nodes that have little bootstrap support so that these do not contribute to the topology of the tree. This can be done in the bootstrapping options when the tree is built by changing the Support threshold القيمة. If this is set on 50%, nodes with bootstrap support of less than 50% will be collapsed into polytomies. The screenshot below shows an example where the nodes with 38% and 36% bootstrap support in (A) are collapsed when the support threshold is set to 50% (B).


PHYLOGENETIC TREE CONSTRUCTION NOTES

A speculatively rooted tree for rRNA genes, showing the three life domains Bacteria, Archaea, and Eucaryota, and linking the three branches of living organisms to the LUCA (the black trunk at the bottom of the tree) cf. next graphic.

A rooted phylogenetic tree, illustrating how Eukaryota and Archaea are more closely related to each other than to Bacteria (based on Cavalier-Smith‘s theory of bacterial evolution). Neomura is a clade composed of two life domains, Archaea and Eukaryota. LUCA, a variant of LUA, stands for last universal common ancestor.

أ شجرة النشوء والتطور أو evolutionary tree is a branching diagram or “tree” showing the inferred evolutionary relationships among various biological species or other entities—their علم تطور السلالات—based upon similarities and differences in their physical or genetic characteristics. The taxa joined together in the tree are implied to have descended from a common ancestor. Phylogenetic trees are central to the field of phylogenetics.

في متجذرة phylogenetic tree, each node with descendants represents the inferred most recent common ancestor of the descendants, and the edge lengths in some trees may be interpreted as time estimates. Each node is called a taxonomic unit. Internal nodes are generally called hypothetical taxonomic units, as they cannot be directly observed. Trees are useful in fields of biology such as bioinformatics, systematics, and phylogenetic comparative methods.

Unrooted trees illustrate only the relatedness of the leaf nodes and do not require the ancestral root to be known or inferred.

The idea of a “tree of life” arose from ancient notions of a ladder-like progression from lower to higher forms of life (such as in the Great Chain of Being). Early representations of “branching” phylogenetic trees include a “paleontological chart” showing the geological relationships among plants and animals in the book Elementary Geology, by Edward Hitchcock (first edition: 1840).

Charles Darwin (1859) also produced one of the first illustrations and crucially popularized the notion of an evolutionary “tree” in his seminal book أصل الأنواع. Over a century later, evolutionary biologists still use tree diagrams to depict evolution because such diagrams effectively convey the concept that speciation occurs through the adaptive and semirandom splitting of lineages. Over time, species classification has become less static and more dynamic.

Rooted tree

A rooted phylogenetic tree (see two graphics at top) is a directed tree with a unique node corresponding to the (usually imputed) most recent common ancestor of all the entities at the leaves of the tree. The most common method for rooting trees is the use of an uncontroversial outgroup—close enough to allow inference from trait data or molecular sequencing, but far enough to be a clear outgroup.

Unrooted tree

An unrooted phylogenetic tree for myosin, a superfamily of proteins. [1]

Unrooted trees illustrate the relatedness of the leaf nodes without making assumptions about ancestry. They do not require the ancestral root to be known or inferred. [2] Unrooted trees can always be generated from rooted ones by simply omitting the root. By contrast, inferring the root of an unrooted tree requires some means of identifying ancestry. This is normally done by including an outgroup in the input data so that the root is necessarily between the outgroup and the rest of the taxa in the tree, or by introducing additional assumptions about the relative rates of evolution on each branch, such as an application of the molecular clock hypothesis. [3]

Bifurcating tree

Both rooted and unrooted phylogenetic trees can be either bifurcating or multifurcating, and either labeled or unlabeled. A rooted bifurcating tree has exactly two descendants arising from each interior node (that is, it forms a binary tree), and an unrooted bifurcating tree takes the form of an unrooted binary tree, a free tree with exactly three neighbors at each internal node. In contrast, a rooted multifurcating tree may have more than two children at some nodes and an unrooted multifurcating tree may have more than three neighbors at some nodes. A labeled tree has specific values assigned to its leaves, while an unlabeled tree, sometimes called a tree shape, defines a topology only. The number of possible trees for a given number of leaf nodes depends on the specific type of tree, but there are always more multifurcating than bifurcating trees, more labeled than unlabeled trees, and more rooted than unrooted trees. The last distinction is the most biologically relevant it arises because there are many places on an unrooted tree to put the root. For labeled bifurcating trees, there are:

total unrooted trees, where n represents the number of leaf nodes. Among labeled bifurcating trees, the number of unrooted trees with n leaves is equal to the number of rooted trees with n − 1 leaves. [4]

Special tree types

This section لا استشهد أي مصادر. Please help improve this section by adding citations to reliable sources. مواد لم تنسبه الى مصدر يجوز الطعن وإزالتها. (October 2012) (Learn how and when to remove this template message)

A spindle diagram, showing the evolution of the vertebrates at class level, width of spindles indicating number of families. Spindle diagrams are often used in evolutionary taxonomy.

A highly resolved, automatically generated tree of life, based on completely sequenced genomes. [5] [6]

  • A dendrogram is a broad term for the diagrammatic representation of a phylogenetic tree.
  • A cladogram is a phylogenetic tree formed using cladistic methods. This type of tree only represents a branching pattern i.e., its branch spans do not represent time or relative amount of character change.
  • A phylogram is a phylogenetic tree that has branch spans proportional to the amount of character change.
  • A chronogram is a phylogenetic tree that explicitly represents evolutionary time through its branch spans.
  • A spindle diagram (often called a Romerogram after the American palaeontologist Alfred Romer) is the representation of the evolution and abundance of the various taxa through time.
  • A Dahlgrenogram is a diagram representing a cross section of a phylogenetic tree
  • A phylogenetic network is not strictly speaking a tree, but rather a more general graph, or a directed acyclic graph in the case of rooted networks. They are used to overcome some of the limitations inherent to trees.

بناء

Phylogenetic trees composed with a nontrivial number of input sequences are constructed using computational phylogenetics methods. Distance-matrix methods such as neighbor-joining or UPGMA, which calculate genetic distance from multiple sequence alignments, are simplest to implement, but do not invoke an evolutionary model. Many sequence alignment methods such as ClustalW also create trees by using the simpler algorithms (i.e. those based on distance) of tree construction. Maximum parsimony is another simple method of estimating phylogenetic trees, but implies an implicit model of evolution (i.e. parsimony). More advanced methods use the optimality criterion of maximum likelihood, often within a Bayesian Framework, and apply an explicit model of evolution to phylogenetic tree estimation. [4] Identifying the optimal tree using many of these techniques is NP-hard, [4] so heuristic search and optimization methods are used in combination with tree-scoring functions to identify a reasonably good tree that fits the data.

Tree-building methods can be assessed on the basis of several criteria: [7]

  • efficiency (how long does it take to compute the answer, how much memory does it need?)
  • power (does it make good use of the data, or is information being wasted?)
  • consistency (will it converge on the same answer repeatedly, if each time given different data for the same model problem?)
  • robustness (does it cope well with violations of the assumptions of the underlying model?)
  • falsifiability (does it alert us when it is not good to use, i.e. when assumptions are violated?)

Tree-building techniques have also gained the attention of mathematicians. Trees can also be built using T-theory. [8]

Although phylogenetic trees produced on the basis of sequenced genes or genomic data in different species can provide evolutionary insight, they have important limitations. Most importantly, they do not necessarily accurately represent the evolutionary history of the included taxa. In fact, they are literally scientific hypotheses, subject to falsification by further study (e.g., gathering of additional data, analyzing the existing data with improved methods). The data on which they are based is noisy the analysis can be confounded by genetic recombination, [9] horizontal gene transfer, [10] hybridisation between species that were not nearest neighbors on the tree before hybridisation takes place, convergent evolution, and conserved sequences.

Also, there are problems in basing the analysis on a single type of character, such as a single gene or protein or only on morphological analysis, because such trees constructed from another unrelated data source often differ from the first, and therefore great care is needed in inferring phylogenetic relationships among species. This is most true of genetic material that is subject to lateral gene transfer and recombination, where different haplotype blocks can have different histories. In general, the output tree of a phylogenetic analysis is an estimate of the character’s phylogeny (i.e. a gene tree) and not the phylogeny of the taxa (i.e. species tree) from which these characters were sampled, though ideally, both should be very close. For this reason, serious phylogenetic studies generally use a combination of genes that come from different genomic sources (e.g., from mitochondrial or plastid vs. nuclear genomes), or genes that would be expected to evolve under different selective regimes, so that homoplasy (false homology) would be unlikely to result from natural selection.

When extinct species are included in a tree, they are terminal nodes, as it is unlikely that they are direct ancestors of any extant species. Skepticism might be applied when extinct species are included in trees that are wholly or partly based on DNA sequence data, because little useful “ancient DNA” is preserved for longer than 100,000 years, and except in the most unusual circumstances no DNA sequences long enough for use in phylogenetic analyses have yet been recovered from material over 1 million years old.

The range of useful DNA materials has expanded with advances in extraction and sequencing technologies. Development of technologies able to infer sequences from smaller fragments, or from spatial patterns of DNA degradation products, would further expand the range of DNA considered useful.

In some organisms, endosymbionts have an independent genetic history from the host.

Phylogenetic networks are used when bifurcating trees are not suitable, due to these complications which suggest a more reticulate evolutionary history of the organisms sampled.


Rooting

Evolutionary trees are (almost) always starting with an ancestor and then dividing, so you can always identify the root (if there is one) as the point where all the branches converge. Historically, it was drawn at the bottom like a real tree (as with the great Molluscan tree in OUMNH and the OneZoom Tree of Life Explorer). These days, it is usually drawn on the left as in these diagrams but I have seen trees with the root at the top, bottom or even on the right. (The latter is usually only used when mirroring another tree.) I have posted before on how to root a phylogenetic tree, so I won't go over that again here. The rooting method يجب be given in the methods but, when it is missing, you can often guess from the shape of the tree and using the root-to-tip branch lengths again:
Unrooted trees are pretty obvious when shown in the "radiation" style. If the tree is rooted, it is almost certainly either midpoint rooted or outgroup rooted (see "how to root a phylogenetic tree"). Midpoint rooting can be identified by virtue of the fact that the two longest root-to-tip distances will (a) be the same length and (b) be either side of the root. If either of these conditions is broken, it is not midpoint rooted and is probably outgroup rooted. (Note that if both conditions نكون met, it is still possible that the tree is outgroup rooted. Indeed, if the evolutionary rates are fairly consistent, outgroup rooting and midpoint rooting should be the same.)

Ideally, a rooted tree should have the root marked. Sometimes, however, it is left off, as in the bottom left. This can be confusing as tree visualising programs will often display trees in the "traditional" style even when they are not rooted. This is particularly a problem when branch lengths are ليس shown as it will not be at all obvious when the tree is rooted or not. The time that I see this catch people out most is when making a Maximum Parsimony tree using the popular software, MEGA - these trees are displayed randomly rooted and without branch lengths by default.


Phylogenetic Tools for Comparative Biology

باستخدام function drop.tip() we can easily excise a single taxon or a list of taxa from our "phylo" tree object in R. However, it is not immediately obvious how to prune the tree to يشمل, rather than exclude, a specific list of tips. Trina Roberts (now at NESCent) shared a trick to do this with me some time ago, and I thought I'd pass it along to the readers of this blog.

First, let's start with a tree of 10 species:

> tree write.tree(tree)
[1] "(t8:0.22,((((t3:0.9,(t7:0.48,t2:0.5):0.12):0.47,t6:0.55):0.08,(t5:0.49,(t9:0.71,t10:0.13):0.15):0.7):0.87,(t1:0.72,t4:0.62):0.55):0.47)"

Now, say we want to keep the species t2 , t4 , t6 , t8 , and t10 in our pruned tree, we just put these tip names into a vector:

[More commonly, this vector will probably come from the row names in our data matrix, or we might read it from a text file.]

We create the pruned tree with one command:

Now we have our pruned tree, as desired:

28 comments:

If there are tips in the "species" vector that are not in the tree, match(species,tree$tip.label) will one or mulitple NAs, and the procedure will fail. To avoid this problem, one can just do:
> pruned.tree<-drop.tip(tree, tree$tip.label[-na.omit(match(species, tree$tip.label))])

Even less code than the -match trick:

pruned.tree<-drop.tip(tree, setdiff(tree$tip.label, species))

setdiff is very handy. (as is intersect and %in%)

Dan's method will also work even if some of the labels in "species" are not in "tree."


شاهد الفيديو: كيف نستغل إيجابيا الاوراق المتساقطة من شجرة الافوكادو (شهر نوفمبر 2022).