معلومة

الترميز الشريطي للحمض النووي ، الاستعلام المتعلق بالطرق القائمة على الأشجار (العنقودية) لتحديد الأنواع

الترميز الشريطي للحمض النووي ، الاستعلام المتعلق بالطرق القائمة على الأشجار (العنقودية) لتحديد الأنواع


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أعمل على معدل نجاح تشفير الحمض النووي الشريطي في تحديد الأنواع باستخدام الطرق القائمة على المسافة والأشجار.

فيما يتعلق بالطريقة القائمة على المسافة ، فقد استخدمت معرف Adhoc والأنواع وتأكدت من تحديد الأنواع باستخدام أفضل معايير المطابقة الأقرب (BCM).

يرجى اقتراح برنامج / برنامج / طريقة لتحديد الهوية على أساس الأشجار (باستخدام نيوجيرسي ، البخل ، الخلجان) ، عرض المجموعات (عدد المجموعات التي تشكلت لأنواع معينة) التي ستقترح أنواعًا فردية (= غير متوقعة).

(لمزيد من التفاصيل: الصورة المرفقة) (يرجى ملاحظة: لا يمكن القيام بذلك يدويًا حيث أن لدي أكثر من 4000 عينة)

الإجابات بالتفصيل عن الأساليب أو البرامج المقدرة! شكرا لك!


تشفير الحمض النووي الشريطي طائر فريد من نوعه: أداة مهمة للتطور والنظاميات والحفظ

يستخدم ترميز الحمض النووي الشريطي منطقة معيارية من السيتوكروم ج أوكسيديز 1 (COI) لتحديد العينات على مستوى الأنواع. وقد ثبت أنه أداة فعالة لتحديد عينات الطيور. تتميز جزيرة نيوزيلندا الفريدة من نوعها بأنها متميزة من الناحية التصنيفية والتطورية. قمنا بتحليل بيانات تسلسل COI من أجل تحديد ما إذا كان الترميز الشريطي للحمض النووي يمكن أن يحدد الطيور النيوزيلندية بدقة.

نتائج

قمنا بتسلسل 928 عينة من 180 نوعًا. وسعت تسلسلات Genbank الإضافية مجموعة البيانات إلى 1416 تسلسلًا من 211 نوعًا من أصل 236 نوعًا في نيوزيلندا. علاوة على ذلك ، لتحسين تقييم التباين الجيني في الأنواع غير المستوطنة ، ولتقييم الدقة الشاملة لنهجنا ، تم أيضًا تضمين تسلسلات من 404 عينة تم جمعها خارج نيوزيلندا في تحليلاتنا. من بين 191 نوعًا ممثلة بتسلسلات متعددة ، يمكن التعرف على 88.5 ٪ بنجاح بواسطة أكواد الحمض النووي الخاصة بهم. من المحتمل أن يكون هذا تقديرًا متحفظًا لقوة تشفير الحمض النووي الشريطي في نيوزيلندا ، نظرًا لأخذ عينات جغرافية واسعة النطاق. تحتوي غالبية المجموعات الـ 13 التي لا يمكن تمييزها على أصناف متباعدة حديثًا ، مما يشير إلى فرز غير كامل للسلالة وفي بعض الحالات تهجين. في المقابل ، أظهر 16 نوعًا دليلاً على وجود سلالات متميزة داخل الأنواع ، بعضها يتوافق مع سلالات معترف بها. لأغراض تحديد الأنواع ، كانت الطريقة القائمة على الشخصية أكثر نجاحًا من الطرق القائمة على المسافة والتطور القائم على الأشجار.

الاستنتاجات

تحدد أكواد DNA الشريطية بدقة معظم أنواع الطيور النيوزيلندية. ومع ذلك ، فإن المستويات المنخفضة من اختلاف تسلسل COI في بعض الأصناف المتباينة مؤخرًا تحد من قوة تحديد تشفير الحمض النووي الشريطي. قد يستفيد عدد قليل من الأنواع المعترف بها حاليًا من مزيد من التحقيقات المنهجية. ستوفر قاعدة البيانات المرجعية والتحليلات المقدمة رؤى قيمة حول تطور الطيور النيوزيلندية ونظامها وحفظها.


مقدمة

تضم المناطق المدارية الجديدة ما يقدر بـ 78800 نوع من النباتات المزهرة ، أي أكثر من ثلث الإجمالي العالمي [1]. ومع ذلك ، فإن الغابات الاستوائية تتدهور بوتيرة سريعة [2] ، [3] ، وأكثر من نصف الأنواع المقدرة من الأشجار الأمازونية البالغ عددها 11000 قد تواجه خطر الانقراض المباشر [4]. وبالتالي هناك حاجة ماسة إلى قوائم جرد واسعة النطاق للتنوع البيولوجي من أجل تطوير استراتيجيات حفظ مستنيرة لهذه النظم الإيكولوجية المتنوعة [5] ، [6]. تم تحقيق تقدم كبير في رسم خرائط توزيع النباتات المدارية على مدى العقود الماضية [7] & # x02013 [11] ، ولكن لا تزال العديد من المناطق غير مجمعة بشكل كافٍ ولا يزال تحديد الأنواع يمثل مهمة صعبة في العديد من عائلات النباتات. قدم بيتمان مثالاً مؤخرًا وآخرون. (2008) ، الذي أجرى دراسة استقصائية عن تنوع أنواع الأشجار على طول مقطع عرضي طوله 700 كيلومتر يقطع أحد أكثر أجزاء الأمازون تنوعًا ، بين الإكوادور والبرازيل [12]. استنادًا إلى أخذ العينات النباتية التقليدية ، تمكنوا من تحديد 97 & # x00025 من السيقان التي تم أخذ عينات منها للجنس ، وإحصاء ما مجموعه 435 جنسًا من الأشجار. ومع ذلك ، في تحليلاتهم الإحصائية ، قرروا استبعاد الأجناس التي كان من الصعب تحديدها في الميدان عندما كانت المواد المعقمة فقط متاحة. أدى اختيارهم لاستبعاد ما لا يقل عن 20.7 & # x00025 من الأجناس و 15.7 & # x00025 من السيقان التي تم أخذ عينات منها إلى فقدان المعلومات ، وتأثير ذلك على استنتاجاتهم غير معروف.

مع ظهور تسلسل الحمض النووي عالي الإنتاجية ، فقد تم اقتراح أن علامات الحمض النووي المكبرة عالميًا والقصيرة والمتغيرة للغاية (الرموز الشريطية للحمض النووي) قد تساعد في تحديد الكائنات الحية للأنواع ذات الثقة العالية ، والتي ستكون مفيدة في مجموعة واسعة من التطبيقات ، بما في ذلك مسوحات التنوع البيولوجي [13] & # x02013 [15]. يجب أن تكون الرموز الشريطية للحمض النووي متغيرة بدرجة كافية للتمييز بين الأنواع وثيقة الصلة ومع ذلك تمتلك مناطق محمية للغاية بحيث يمكن تسلسلها بسهولة باستخدام البروتوكولات القياسية. علامة الميتوكوندريا أوكسيديز السيتوكروم ج أنا لاقى (CO1) بعض النجاح لمجموعات الحيوانات [13] ، [16] ، لكن انظر [17] & # x02013 [19]. في النباتات ، ثبت أن البحث عن مناطق جينومية مناسبة أكثر صعوبة. عدة مناطق في جينوم البلاستيد (على سبيل المثال rbcL ، rpoC1 ، rpoB ، ycf5 ، psbA-trnH ، trnL ، atpF-atpH ، psbK-psbI) وكذلك الفاصل المكتوب الداخلي (إنه) من الحمض النووي الريبوزومي كمرشحين جيدين للترميز الشريطي للحمض النووي للنبات [20] & # x02013 [27]. ظهر إجماع مؤخرًا بين أعضاء مجموعة عمل مصنع كونسورتيوم للتشفير الشريطي للحياة (CBoL) على استخدام اثنتين فقط من هذه العلامات لمصانع الباركود البرية ، وهما: rbcL و ماتك [28] ، ومع ذلك يشير هؤلاء المؤلفون إلى أن هذا المزيج سيؤدي إلى تحديد مستوى الأنواع في 72 & # x00025 من الحالات فقط ، ومن غير المرجح أن يتم توزيع هذا القرار بالتساوي عبر أنواع النباتات البرية.

صدى تشيس وآخرون. (2007) [29] ، أشارت مجموعة عمل النباتات CBoL إلى أن الترميز الشريطي للحمض النووي DNA للنبات يجب أن يكون مفيدًا في التمييز بين شتلات الغابات ، أو إجراء مسوحات للتنوع البيولوجي على نطاق واسع في المواقف التي تكون فيها الخبرة التصنيفية محدودة. ومع ذلك ، فإننا لسنا على علم بأي تطبيق في هذا المجال البحثي حتى الآن ، والعمل الحالي يملأ هذه الفجوة. تمثل النباتات الاستوائية تحديات أمام تشفير الحمض النووي الشريطي والتي تكون أكثر وضوحًا من تلك التي تواجهها عند تشفير النباتات المعتدلة ، ولا تزال تطبيقات ترميز الحمض النووي للنبات في المناطق المدارية أرضًا غير مأهولة (الاستثناءات الوحيدة هي التطبيقات على الجنس كومبسونيورا في Myristicaceae ، انظر Newmaster وآخرون. جنس 2008 إنجا في الفصيلة البقولية [30] وعائلة الأوركيد [26]). من المتوقع أن يكون استخراج الحمض النووي أكثر صعوبة في النباتات الاستوائية ، بسبب الوفرة الأكبر من المستقلبات الثانوية [31] ، وهذا قد يضر بالأداء العام لتشفير الحمض النووي الشريطي [32]. بالإضافة إلى ذلك ، غالبًا ما يكون معدل تنوع النسب مرتفعًا في المناطق المدارية ، مما يؤدي إلى تكرار حدوث إشعاعات متفجرة [33] & # x02013 [34]. بالنسبة إلى السلالات الحديثة التي تحتوي على أعداد كبيرة من الأنواع ، فإننا نتوقع أن يكون تشفير الحمض النووي الشريطي أقل كفاءة ، لأن الأنواع تميل إلى أن يكون لها الكثير من الأقارب ، مما يقلل من مستويات التباعد بين الأنواع ، كما تم تأكيده مؤخرًا في الجنس إنجا [35] ، وكما هو متوقع في المجموعات الأخرى [36]. أخيرًا ، لقد تم إثبات أن سلالات النباتات الخشبية تظهر باستمرار معدلات أقل من التطور الجزيئي مقارنة مع سلالات النباتات العشبية [37] ، مما يشير إلى أن تطبيق مفاهيم الترميز الشريطي للحمض النووي يجب أن يكون أكثر صعوبة بالنسبة لنباتات الأشجار مقارنة بالنباتات غير الخشبية. ، [38].

في هذه الدراسة ، نستخدم استراتيجية أخذ العينات القائمة على المؤامرة لاختبار قابلية تطبيق مخطط الترميز الشريطي للحمض النووي المقترح حاليًا. على وجه التحديد ، ندرس ما إذا كانت الرموز الشريطية المتفق عليها متغيرة وعالمية بشكل كافٍ لتحديد أنواع الأشجار الأمازونية المتزامنة بشكل موثوق ، وننفذ هذا المخطط لتحديد نباتات الأحداث الاستوائية.


نتائج

تحليل تسلسل الحمض النووي المرجعي

وصف البيانات وملخص المسافة

كشف تحليل بيانات النمط الفرداني عن 170 نمط فرداني فريد في مكتبات مرجع الحمض النووي (الجدول 1). كان متوسط ​​تكرارات النوكليوتيدات لجميع الأنواع 42 كما يلي: A (أدينين) ، 28٪ T (ثايمين) ، 40٪ G (جوانين) ، 15.2٪ C (سيتوزين) ، 16.8٪. كشف التحليل أن الاختلاف الجيني كيمورا -2 المحدد (K2P) تراوح بين 0.045-0.201 بمتوسط ​​جيني (MGD) يبلغ 0.133 تباعد جيني K2P داخل النوعي يتراوح بين 0-0.107 بمتوسط ​​0.009 (الجدول 1).

معدلات نجاح تحديد الهوية

في عمليات المحاكاة ، أعاد نهج الجار الأقرب (NN) 97.39٪ تعريفات صحيحة و 2.61٪ تعريفات غير صحيحة (الشكل 1). أرجع تحليل العتبة (TA) نفس النتائج كأفضل مطابقة قريبة (BCM) عند القيمة الحدية 0.01 (79.56٪ صحيح و 20.44٪ تعريفات غير صحيحة). مع عتبة 0.039 محسوبة بالدالة محلي في SPIDER ، قدمت TA و BCM 94.68٪ تعريفات صحيحة و 5.32٪ غير صحيحة. بحد 0.044 (ملف إضافي 1: الشكل S1) تم إنشاؤه بواسطة الوظيفة عتبة في SPIDER ، قدمت TA و BCM 95.21٪ تعريفات صحيحة و 4.79٪ غير صحيحة. أظهرت نسبة monophyly على نهج شجرة الانضمام (NJ) المجاورة (Mono) معدل نجاح بنسبة 100٪ (الشكل 1).

Barplots من مقاييس النجاح في تحديد الهوية. الاختصارات: NN ، أقرب الجيران TA ، تحليل العتبة مع 1٪ عتبة TAthreshVal ، تحليل العتبة مع عتبة 4.4٪ TAlocalMinima ، تحليل العتبة مع عتبة 3.59٪ BCM ، أفضل تطابق وثيق (1٪ عتبة) BCM.threshVal ، أفضل إغلاق تتطابق مع عتبة 4.4٪ BCM.localMinima ، تحليل العتبة مع عتبة 3.59٪ Mono ، نسبة monophyly على شجرة NJ

تحليل فجوة الباركود

في تسلسل الحمض النووي المرجعي لدينا ، قمنا بحساب عدد المرات التي تجاوزت فيها المسافة القصوى بين الأنواع الحد الأدنى للمسافة بين الأنواع. استخدام الطول و أي وظائف في SPIDER للاستعلام عن عدد المرات التي حدث فيها ذلك في تسلسل الحمض النووي المرجعي لدينا ، وجدنا أن هذا هو الحال في 14 مناسبة (ملف إضافي 2: الشكل S2).

التعريف الجزيئي ل كوليكويدس يرقات

تسلسل الحمض النووي كوليكويدس تم الحصول على يرقات تم جمعها في منطقة Niayes في السنغال بنجاح لـ 958 من أصل 1632 يرقة (58.6٪). فشل تضخيم PCR لـ 99 من أصل 773 عينة من المراحل L1-L2 ، بينما تم تضخيم جميع العينات المختارة من المرحلة L3-L4 بنجاح (859/859 عينة). يمكن تفسير ذلك بالحجم المادي لمراحل اليرقات المختلفة (المراحل L1 و L2 هي & lt 2 مم). تم تحرير التسلسلات في Geneious R11 [19] و 933 كوكستم استخدام متواليات واحدة ذات جودة أفضل في هذه الدراسة. المعدل العام لـ كوكس1 متواليات تمت مطابقتها بنجاح ضمن تسلسلات الحمض النووي المرجعية المستخدمة كمجموعة بحث في بحث بلاست كانت 97.1٪. وهكذا 906 من 933 كوكستم تحديد 1 تسلسل من اليرقات بنجاح كوليكويدس محيط. ومع ذلك ، 27 كوكس1 تسلسل لا مثيل له داخل مكتبات مراجع الباركود DNA الخاصة بنا. من أجل العثور على تطابق ، هؤلاء كوكستم استخدام تسلسل 1 كاستعلام في NCBI (https://blast.ncbi.nlm.nih.gov/Blast.cgi). ومع ذلك ، لم يتم العثور على مطابقات لهذه التسلسلات.

التسلسلات المتطابقة تقابل ثمانية كوليكويدس الأنواع (الجدول 2). من هذه الأنواع ، ورم مؤكسد كوليكويدس حصلت Kieffer على أعلى نسبة (66.8٪) ، تليها كوليكويدس نيفوسوس دي ميلون (21.5٪) ، Culicoides مميزة التنس أوستن و كوليكويدس سيميليس كارتر وإنجرام وأمبير ماكفي (كلاهما أعلى قليلاً من 3٪) (الجدول 2).

تحليلات قاعدة بيانات الترميز الشريطي للحمض النووي

ما مجموعه 1131 كوكستم تقديم تسلسل واحد إلى قاعدة بيانات BOLD تحت رمز المشروع "AFCUL" (انظر التفاصيل الملف الإضافي 3: الجدول S1). لوحظت زيادة هرمية في متوسط ​​الاختلاف وفقًا لمستويين تصنيفيين: داخل الأنواع (المتوسط ​​= 1.92٪ ، SE = 0.00) وداخل الجنس (المتوسط ​​= 17.82٪ ، SE = 0.00). في تحليل فجوة الباركود باستخدام نظام إدارة وتحليل BOLD ، تمت مصادفة المواقف التي تكون فيها المسافة إلى أقرب جار أقل من أقصى مسافة داخل محددة في سبعة أنواع (ملف إضافي 4: الجدول S2). كشف تحليل بيانات النمط الفرداني عن 360 نمط فرداني في 1131 كوكس1 تسلسل لـ 40 Afrotropical كوليكويدس محيط.


ترميز الحمض النووي الشريطي وتحديد أنواع الفراشات (Lepidoptera) من نيجيريا

يعد التحديد الدقيق للأنواع شرطًا أساسيًا للإدارة الناجحة للتنوع البيولوجي والمزيد من الدراسات الجينية. غالبًا ما تتطلب تقنيات تحديد الأنواع التشخيص المورفولوجي والأدوات الجزيئية ، مثل الترميز الشريطي للحمض النووي ، من أجل التحديد الصحيح. على وجه الخصوص ، استخدام الوحدة الفرعية I للميتوكوندريا أوكسيديز السيتوكروم ج أثبت الجين (COI) الخاص بتشفير الحمض النووي الشريطي أنه مفيد في تحديد الأنواع للحشرات. ومع ذلك ، حتى الآن ، لم يتم إجراء أي دراسات حول تشفير الحمض النووي للفراشات النيجيرية. قمنا بتقييم فائدة تشفير الحمض النووي الشريطي المطبق لأول مرة على 735 عينة فراشة من جنوب نيجيريا. في المجموع ، تم إنشاء 699 رمزًا شريطيًا للحمض النووي ، مما أدى إلى تسجيل 116 نوعًا تنتمي إلى 57 جنسًا. تتألف عينة دراستنا من 807 من الرموز الشريطية للحمض النووي استنادًا إلى التسلسلات الناتجة عن دراستنا الحالية و 108 رموز أخرى تم استردادها من BOLD. تم إجراء تحليلات جزيئية مختلفة ، بما في ذلك التقييم الجيني القائم على المسافة (الالتحاق بالجوار ، والاحتمالية القصوى ، وأشجار بايزي) واختبارات تحديد الأنواع (TaxonDNA ، واكتشاف فجوة الباركود الآلي ، وعمليات Yule-Coalescent المختلطة العامة ، وعمليات Bayesian Poisson Tree) لتحديد دقيق والأنواع المحددة. نتج عن التحليلات الجينية القائمة على المسافة 163 مجموعة منفصلة جيدًا تتكون من 147 نوعًا موصوفًا و 16 نوعًا غير محدد. تشير النتائج التي توصلنا إليها إلى أن حوالي 90.20٪ من أنواع الفراشات تم تمييزها صراحةً باستخدام الرموز الشريطية للحمض النووي. أيضًا ، أبلغت مجموعاتنا الميدانية عن أول سجلات قطرية لعشرة أنواع من الفراشات -أكريا سيرينا, أماوريس راجع دانفيلتي, أتريكا جالينا إكستينسا, Axione tjoane rubescens, الشراكسيس galleyanus, بابيليو لورميري لورميري, بنتيلا ألبا, الدقة, بريسيس توجيلا ، و تاجيادس. علاوة على ذلك ، كشفت الرموز الشريطية للحمض النووي عن وجود تباعد عالٍ داخل نوع الميتوكوندريا بأكثر من 3٪ في Bicyclus vulgaris vulgaris و كولوتيس ايفاجور. علاوة على ذلك ، كشفت نتيجتنا عن تنوع إجمالي في النمط الفرداني (الجيني) (0.9764) ، مما يشير إلى أن تشفير الحمض النووي الشريطي يمكن أن يوفر معلومات على مستوى السكان للفراشات النيجيرية. تؤكد الدراسة الحالية كفاءة الترميز الشريطي للحمض النووي في تحديد الفراشات من نيجيريا. لاكتساب فهم أفضل للتنوع الإقليمي في أكواد الحمض النووي الشريطية لهذه المنطقة المعقدة جغرافيًا حيويًا ، يجب أن يوسع العمل المستقبلي مكتبة مرجع الباركود DNA لتشمل جميع أنواع الفراشات من نيجيريا وكذلك البلدان المحيطة. أيضًا ، هناك حاجة إلى مزيد من الدراسات ، التي تتضمن مجموعات البيانات الجينية والبيئية المورفولوجية ذات الصلة ، لفهم العمليات التي تحكم الاختلافات داخل نوع الميتوكوندريا المبلغ عنها في بعض مجمعات الأنواع.


مناقشة

الحجج الأخيرة حول فائدة كوكس1 تمت مناقشة الترميز الشريطي للحمض النووي في الذباب الأسود بواسطة [22 ، 23 ، 24 ، 35]. في دراستنا ، تجمعت الأنواع المعروفة معًا في شجرة نيوجيرسي بناءً على كوكس1 تسلسلات الباركود DNA (الشكل 2) ، والتي توضح فائدة هذه المنهجية في دعم تحديد الأنواع. تم وضع معظم الأفراد من نوع معين بشكل صحيح في شجرة نيوجيرسي. ومع ذلك ، تم تحديد العينات المورفولوجية باسم S. أرجيريتوم, S. monticola و S. varegatum تم تعيينها في نفس المجموعة ، مما يعني أنها قد تكون محددة. لم تكن هذه النتيجة مفاجئة لأن البالغين من الأنواع الثلاثة متشابهة جدًا من الناحية الشكلية. ومع ذلك ، يمكن تحديد الأصناف الثلاثة بسهولة بناءً على تكوين الخيشوم الخيشومي. Simulium varegatum يمكن التعرف عليه بسهولة من خلال وجود درنات بارزة 1 + 1 في قاعدة الخياشيم [26] ، بينما الدرنات غائبة في S. أرجيريتوم و S. monticola. في S. monticola، والخيوط الخيشومية البطنية تنشأ مباشرة من القاعدة ، وجميع الخيوط منحنية بشكل بارز عند منتصف الطول ، ويغطي الرأس الصدري مناطق من درنات صغيرة [26]. في S. أرجيريوم، الخيشوم مغطى بدرنات موزعة بشكل متجانس [26]. وبالتالي ، فإننا ندعو إلى أن الواسمات الجينية المختلفة مثل جين البروتين 1 المركب المستطيل (ECP1) أو ITS2 [36،37،38،39] لاستكشاف حالتها التصنيفية.

توقعنا مستويات أعلى من الاختلاف الجيني بين أعضاء مجمعات الأنواع المعروفة ، على الرغم من عدم إجراء الدراسات الخلوية في دراستنا [3 ، 22 ، 23 ، 24 ، 40]. في هذا الصدد ، تم تجميع معظم العينات معًا ، ولم يتم تحديد مستويات عالية من التنوع الجيني بين مجمعات الأنواع. بالإضافة إلى ذلك ، لا توجد انقسامات عميقة في شجرة نيوجيرسي كما لوحظ في الدراسات السابقة [3 ، 22 ، 24]. من المحتمل أن يكون هذا بسبب حقيقة أن معظم العينات نشأت من نفس المواقع ، أو القريبة نسبيًا. ومع ذلك ، لم يتم تجميع كل الأنواع المعروفة كما توقعنا. بشكل عام ، كشفنا عن تباعد جيني عالي داخل النوع ليس فقط في P. لاتيموكرو (م.) بنسبة 2.77٪ ، ولكن أيضًا في P. tomosvaryi بنسبة 2.93٪ و S. وسيط بنسبة 3.96٪. خاصه، S. وسيط تم تقسيمها إلى مجموعتين متميزتين ، سميت هنا I و II (الشكل 2). قد يكون هذا مؤشرا على وجود معقد الأنواع ، ولكن هناك حاجة إلى مزيد من دراسات التحليل الخلوي للتحقق من صحة هذه الفرضية. في هذه الدراسة ، القيم التي تم الحصول عليها للاختلافات الجينية بين الأنواع وكذلك الاختلافات الجينية بين الأنواع هي ضمن القيم التي حصل عليها المؤلفون الآخرون [22 ، 23 ، 24 ، 40 ، 41 ، 42].

ذكر العديد من المؤلفين (على سبيل المثال ، [34 ، 35]) أن التطابق الموجود بين الأنواع المعترف بها شكليًا و BINs يمكن أن يبرهن على وجود تنوع جيني غامض. لذلك ، تم اكتشاف المجموعات الفرعية في S. وسيط قد يكون مؤشرا على هذا التنوع. في المقابل ، فإن وجود نفس BINs في الأنواع الأخرى المعترف بها مثل S. أرجيريوم, S. monticola و S. varegatum، قد يكون من الصعب شرح ذلك. لذلك ، نحن ندعو إلى مزيد من الدراسات البيولوجية النظامية في هذه الأصناف ليس فقط في إسبانيا ، ولكن عبر نطاق توزيعها.


المواد والأساليب

التسلسلات والمحاذاة والمسافات الزوجية

مشابه لنهج Barrett and Hebert (2005) و Hebert et al. (2003b) ، استخدمنا 1443 تسلسلًا من GenBank وقمنا بمواءمتها باستخدام ClustalX. لقد أزلنا التسلسلات التي كانت (1) قصيرة جدًا (& lt 300 نقطة أساس ، 57 تسلسلًا) ، (2) لم يتم تحديدها للأنواع (49 تسلسلًا) ، (3) جاءت من تجارب تهجين الأنواع (ذبابة الفاكهة الفرعية GI: 25990046) ، و (4) لا يمكن محاذاته و / أو ترجمته إلى بروتينات أو كان لديه تباعد تسلسلي بنسبة 30 ٪ لجميع متواليات COI الأخرى لـ Diptera (خلل النطق روبوستا GI: 19879668 ذبابة الفاكهة بوسكي GI: 27657151 ذبابة الفاكهة GI: 27657153). تمت إعادة تسمية التسلسلات مع أسماء GenBank المرادفات وفقًا لقاعدة البيانات Biosystematic لـ World Diptera (Thompson ، 2005) باستخدام الاسم الصالح (Anopheles arabiensis هو مرادف مبتدئ لـ أنوفيليس غامبيا 3 متواليات). جاءت تسلسلات COI المتبقية 1333 من 449 نوعًا من Diptera ، منها 127 نوعًا تم تمثيلها بـ 1011 تسلسل (انظر المواد التكميلية المتاحة على الإنترنت في http://systematicbiology.org). تمت إزالة التسلسلات التي لا تنتمي إلى COI وتم تصحيح الفجوات في غير محلها للحصول على محاذاة خالية من الفجوات بمقدار 1539 نقطة أساس تفتقر إلى أكواد الإيقاف (انظر المواد التكميلية المتاحة عبر الإنترنت على http://systematicbiology.org). تم إجراء معظم التحليلات باستخدام برنامج تم تطويره لهذا الغرض ("TaxonDNA" متوفر على الموقع http://taxondna.sf.net/). أجرينا تحليلات منفصلة لجميع التسلسلات بحد أدنى من التداخل 300 و 400 و 500 و 600. بسبب المسافات الكبيرة بين الأنواع في جنس محدد للغاية ذبابة الفاكهة، تعاملنا مع ذبابة الفاكهة الأجناس الفرعية كأجناس منفصلة.

من أجل اختبار التداخل بين التباين الوراثي غير المحدد مع التباين الوراثي بين الأنواع ، قمنا برسم جميع المسافات الزوجية غير المصححة لتسلسلات محددة وجميع المسافات للتسلسلات المتجانسة متعددة النوعية. من أجل اختبار ما إذا كانت جميع الأنواع لديها رموز شريطية فريدة من نوعها للحمض النووي ، قمنا أولاً باختبار ما إذا كانت التسلسلات المتطابقة قد تمت مشاركتها من قبل أفراد من أنواع مختلفة. قمنا بعد ذلك ببناء الرموز الشريطية للأنواع كتسلسل إجماعي لجميع التسلسلات المحددة واختبرنا مرة أخرى تفرد هذه الرموز الشريطية. تم تلخيص التباين التسلسلي غير المحدد باستخدام رموز IUPAC وكان يجب أن يعتمد تسلسل الإجماع على تسلسلين على الأقل.

ترميز الحمض النووي الشريطي: تحديد الاستعلام المستند إلى الشجرة

باستخدام PAUP * (Swofford ، 2002 Kimura نموذج 2-معلمة كما هو موصى به في Barrett and Hebert ، 2005 مقطوعة بشكل عشوائي) ، قمنا بحساب الأشجار المرتبطة بالجوار وأشجار التمهيد لأكبر مجموعات من التسلسلات المتجانسة مع تداخل 300 نقطة أساس على الأقل. تم تحليل مجموعات البيانات نفسها باستخدام البخل كما تم تنفيذ TNT (Goloboff et al. ، 2003) باستخدام New Technology Search = 15 find min. length = 3 bootstrap 250 مكررات) ، وتحليلات Bayesian كما تم تنفيذها في MrBayes 3.1 (Huelsenbeck and Ronquist ، 2003). بدأت جميع عمليات البحث البايزية من أشجار البداية العشوائية. بالنسبة لجميع مجموعات البيانات ذات التسلسلات المتجانسة ، تم تفضيل نموذج GTR + I + G بواسطة معيار معلومات Akaike واختبار نسبة الاحتمالية الهرمية كما هو مطبق في MrModelTest الإصدار 2.2 (Nylander ، 2004). تم تشغيل مجموعة البيانات لـ 3،000،000 جيل وتم أخذ عينات من شجرة كل 300 جيل ، مما أدى إلى 10000 شجرة. تم تحقيق استقرار السلسلة لجميع مجموعات البيانات بعد 1200000 جيل (احتراق) وتم التخلص من 4000 شجرة لاحقًا. نتج عن ثلاثة تحليلات متكررة بشكل مستقل طبولوجيا شجرية متشابهة واحتمالات متشابهة ومعلمات نموذج الاستبدال.

بالنسبة لجميع الأشجار ، تم تقييم نجاح تحديد الهوية في البداية كما هو موضح في Hebert et al. (2003 أ) والجدول 1 ، أي التسلسلات التي تم تحديدها بنجاح طالما أنها تشكل مجموعات خاصة بالأنواع. تم اعتبار الأنواع ذات التسلسلات في مواقع متعددة في الشجرة فاشلة وتم اعتبار تلك الأنواع ذات التسلسل الفردي غامضة. ثانيًا ، استخدمنا معايير التعريف المنقحة الموضحة في المقدمة. لقد نظرنا فقط في الاستعلامات التي يتم تحديدها بشكل صحيح إذا تم العثور عليها في تعدد أنواع معين أو عقدة واحدة على الأقل في كليد يتكون حصريًا من متواليات من نوع واحد. كانت جميع الاستعلامات الغامضة تنتمي إلى أنواع ذات تسلسل واحد أو تسلسلين وتلك التي شكلت مجموعة شقيقة لمجموعة من المتواليات المحددة. قمنا بحساب تلك التسلسلات على أنها خاطئة في تحديدها والتي تم تعيين اسم محدد ولكن غير صحيح (على سبيل المثال ، استعلام داخل مجموعة تسلسل محدد). حالة خاصة هي تعدد المتواليات من نوعين. إذا كان الاستعلام من نوع مختلف عن جميع التسلسلات المتبقية في polytomy ، فقد حسبنا الاستعلام باعتباره تحديدًا خاطئًا لأن المعرّف سيفترض أن الاستعلام محدد مع التسلسلات المتبقية. ومع ذلك ، إذا كان polytomy يحتوي على متتابعين على الأقل من نوعين مختلفين ، فإن الاستعلام في polytomy يعتبر غامضًا ، لأن المعرف سيكون على دراية بأنه لا يمكن تحديد الاستعلام في مثل هذا الشلل بشكل لا لبس فيه.

تشفير الحمض النووي الشريطي: تحديد الأنواع بناءً على المسافات (انظر الجدول 1)

"افضل مباراة." استخدمنا TaxonDNA للبحث عن أقرب تطابق رمز شريطي لكل استعلام. إذا كان كلا التسلسلين من نفس النوع ، فسيتم اعتبار التحديد ناجحًا ، في حين تم حساب الأسماء غير المتطابقة على أنها حالات فشل. تم اعتبار العديد من أفضل التطابقات الجيدة من أنواع مختلفة غامضة.

"أفضل مباراة متقاربة." استخدمنا TaxonDNA لرسم التكرار النسبي للمسافات غير المحددة من أجل تحديد قيمة العتبة التي تقل عن 95٪ من جميع المسافات غير المحددة. ظلت جميع الاستعلامات بدون تطابق الرمز الشريطي أقل من قيمة العتبة مجهولة الهوية. بالنسبة للاستعلامات المتبقية ، تمت مقارنة هويتها بهوية الأنواع لأقرب رمز شريطي لها. إذا كان الاسم مطابقًا ، فسيتم اعتبار الاستعلام نجاحًا في تحديد الهوية. تم اعتبار التحديد فاشلاً عندما كانت الأسماء غير متطابقة واعتبرت غامضة عندما تم العثور على العديد من أفضل التطابقات الجيدة التي تنتمي إلى نوعين على الأقل.

"جميع أنواع الرموز الشريطية". لقد جمعنا لكل استعلام قائمة بجميع الرموز الشريطية مرتبة حسب التشابه مع الاستعلام باستخدام نفس الحد الأدنى للحصول على أفضل تطابق وثيق. تم اعتبار الاستعلامات ناجحة عندما تم اتباعها من قبل جميع الرموز الشريطية المحددة طالما كان هناك رمزان شريطيان على الأقل للأنواع. تم اعتبار الاستعلامات غامضة عندما تم اتباعها بواسطة رمز شريطي واحد محدد أو بعض التسلسلات المحددة فقط. تم اعتبار الاستفسارات التي تتبعها جميع التسلسلات المحددة من الأنواع "الخاطئة" خطأ في التعرف عليها.

تصنيف الحمض النووي: ملفات تعريف تستند إلى عتبات المسافة

اختبرنا جدوى قيم العتبة للتمييز بين التباين بين التباين النوعي لعتبات 2٪ و 3٪ و 4٪ و 5٪ و 6٪. لهذا الغرض ، تجد TaxonDNA لكل استعلام مجموعة من الرموز الشريطية التي يكون لكل تسلسل في المجموعة تسلسل آخر واحد على الأقل ضمن مسافة العتبة. بالنسبة لجميع المجموعات ، حددنا ما إذا كانت أكبر مسافة لوحظت تجاوزت مسافة العتبة وما إذا كانت تتوافق مع الأنواع المقبولة حاليًا (= تحتوي على جميع التسلسلات لنوع واحد). إذا لم يكن الأمر كذلك ، فقد حددنا ما إذا كانت تحتوي على تسلسلات لعدة أنواع (الخطأ 1) و / أو لا تحتوي على جميع التسلسلات لنفس الأنواع (الخطأ 2).


5. الخلاصة

في الختام ، كشفت دراستنا أن تشفير الحمض النووي المستند إلى جين COI هو طريقة فعالة لتوضيح حدود الأنواع وتقييم تنوع الأنواع كميًا (على سبيل المثال ، وفرة الأصناف والأنواع المشفرة). يُعزى التمايز السكاني للافقاريات القاعية في أربعة أنهار عابرة للحدود إلى العزلة الجغرافية. تعتبر أحداث العزلة الجغرافية والتنويع عاملين رئيسيين لتطور مجموعات سكانية مختلفة في اتجاهات مختلفة وبالتالي تؤدي إلى زيادة كبيرة في تنوع اللافقاريات القاعية. ومع ذلك ، يمكن استكمال تشفير الحمض النووي الشريطي في دراسات علم الوراثة السكانية ، بالحمض النووي النووي المورفولوجي والبيئي ، وغيرها من البيانات غير الجزيئية المتعلقة بوجود أنواع مشفرة وتقييم الاختلاف بين الأنواع.


نتائج

أسفرت الدراسات الاستقصائية لثلاثة بلدان (الشكل 1) عن مجموع 2801 سلسلة من الرخويات في شمال غرب المحيط الهادئ ، تنتمي إلى 91 عائلة و 240 جنسًا و 569 نوعًا. التصنيف وأرقام الانضمام وموقع المجموعة متاحان في الجدول التكميلي S1. بالنسبة لمعظم الأنواع ، تم تحليل عينات متعددة (متوسط ​​= 4.9 عينة لكل نوع) لتوثيق التباين داخل النوع. تم تمثيل 182 نوعًا من خلال عينة واحدة ، ونوع واحد (سيلانا نيجرولينييتا) تم تمثيله بـ 62 عينة. متوسط ​​ترددات النوكليوتيدات لجميع الأنواع 573 هي كما يلي: A = 22.97٪ ، T = 39.41٪ ، G = 20.96٪ و C = 16.66٪. بلغ متوسط ​​محتوى GC 37.62٪ (SE = 0.06) ، لكنه أظهر تباينًا كبيرًا (النطاق 29.94-52.02٪). أظهر اختبار مربع كاي للتجانس تباينًا كبيرًا في ترددات النوكليوتيدات بين الأنواع في كل فئة من فئات الرخويات الخمسة (ص & lt 0.001). أظهر متوسط ​​مسافات الجوار الأقرب بين الأنواع المتجانسة وجودًا كبيرًا (ص & lt 0.001 ص 2 = 0.167) ارتباط إيجابي بمتوسط ​​محتوى GC (الشكل التكميلي 1).

خريطة توزيع لجميع مواقع أخذ العينات (دوائر أرجوانية) في منطقة شمال غرب المحيط الهادئ.

الدول المحيطة بمنطقة الدراسة: الصين الكبرى واليابان وكوريا. تتوفر تفاصيل الموقع وقائمة بعدد العينات التي تم جمعها لكل موقع في الجدول التكميلي S1. تم تقديم كل من خريطة العالم وخريطة شمال غرب المحيط الهادئ مع الصين الكبرى واليابان وكوريا باستخدام ODV v4.7.3 63 (متاح على http://odv.awi.de) وتم تعديلها في Microsoft Office.

ملخص المسافة

لاحظنا زيادة هرمية في متوسط ​​الاختلاف وفقًا لمستويات تصنيفية مختلفة ، داخل الأنواع (المتوسط ​​= 0.97٪ ، SE = 0.023) ، داخل المتجانسات (المتوسط ​​= 18.67٪ ، SE = 0.004) ، داخل العائلات (المتوسط ​​= 22.47٪ ، SE = 0.003) ، ضمن الطلبات (المتوسط ​​= 25.3٪ ، SE = 0.002) وداخل الفصول (المتوسط ​​= 30.60٪ ، SE = 0.012) (الجدول 1). لذلك ، كان هناك كاليفورنيا 19.25 × تباين أكبر بين الأنواع المتجانسة مقارنة بأفراد معينين. أظهر تحليل الانحدار أن متوسط ​​الاختلاف بين الأنواع يبدو أنه يزداد مع عدد الأنواع التي تم تحليلها من الجنس ، لكن الانحدار لم يكن كبيرًا (الشكل 2 أ). ص = 0.049 ص 2 = 0.138). ولم يختلف الاختلاف بين الأنواع اختلافًا كبيرًا مع عدد الأفراد الذين تم تحليلهم لكل نوع (الشكل 2 ب). ص = 0.27 ص = 0.56).

(أ) العلاقة بين الاختلاف بين الأنواع وحجم العينة داخل الأجناس. متوسط ​​التباعد بين الأنواع (٪ K2P) في COI تم رسمه مقابل عدد الأنواع المأخوذة من كل جنس من الرخويات البحرية مع 2 نوع (ن = 123). كان الارتباط ضئيلًا (ص = 0.052 ص 2 = 0.08). (ب) العلاقة بين الاختلافات داخل النوعية وحجم العينة داخل الأنواع. تم رسم التباينات المتوسطة والقصوى داخل النوعية (٪ K2P) في COI مقابل عدد الأفراد الذين تم تحليلهم لـ 393 نوعًا من الرخويات شمال غرب المحيط الهادئ. العلاقة بين حجم العينة ومتوسط ​​الاختلاف داخل النوع غير مهم (ص = 0.27 ص 2 = 0.024) وكذلك الحد الأقصى للاختلاف بين الأنواع (ص = 0.56 ص 2 = 0.085).

تحليل فجوة الباركود

قمنا بحساب عدد المرات التي يتجاوز فيها الحد الأقصى للتباعد في التسلسل بين أفراد نوع ما الحد الأدنى من اختلاف التسلسل عن الأنواع الأخرى المتجانسة. تمت مصادفة هذه المواقف ، التي قد تربك التخصيصات التصنيفية القائمة على الباركود ، في 70 نوعًا (12.30٪) (الشكل 3 ، الجدول التكميلي S2). في هذه الأنواع ، يتداخل الحد الأقصى للتباين غير المحدد مع مسافة NN (الجار الأقرب) ، مما يؤدي إلى عدم وجود فجوة في الرمز الشريطي وفي 36 حالة ، كانت مسافات NN صفرًا. 91 نوعًا تظهر مسافة منخفضة إلى NN (& lt = 2 ٪) ، لكنها لا تزال تتجاوز الحد الأقصى للقيمة غير المحددة.

النتائج الإحصائية لأداء الترميز الشريطي للحمض النووي.

(أ) أقصى تباعد بين الأنواع مقارنة بأقرب مسافة للجار بالنسبة للرخويات شمال غرب المحيط الهادئ. يتم عرض الأنواع ذات التسلسلات المتعددة فقط. تشير النقاط الموجودة فوق الخط إلى الأنواع التي بها فجوة في الرمز الشريطي. (ب) يعتمد الأداء على تجميع الأصناف في تحليل ضم الجوار.

نجاح تقنيات تحديد العينات القائمة على التسلسل

في عمليات المحاكاة ، أعاد نهج BM 89.15٪ من التعريفات الحقيقية و 10.92٪ من التعريفات الخاطئة (الجدول 2). عندما تمت إزالة المفردات ، انخفضت التعريفات الزائفة إلى 4.73٪. تتوفر تفاصيل نتائج المحاكاة كجدول إضافي S3. مع عتبة 0.01 ، قدم تحليل BCM 68.62٪ من الهوية الحقيقية و 1.14٪ من التعريفات الزائفة. بالنسبة إلى 14.28٪ من الاستفسارات ، كانت النتيجة غامضة (تم العثور على أكثر من تطابق مماثل أقل من عتبة 0.01). 15.96٪ من الاستفسارات لا تحتوي على مطابقات محددة أقل من عتبة 0.01 ، وكان نصفها تقريبًا (40.72٪) منفردين بدون تسلسل محدد متاح. أبلغت طريقة تحسين العتبة (وظيفة "العتبة" في SPIDER) عن عتبة بين 0.0135 و 0.0260 (الشكل التكميلي 2). تم اختيار متوسط ​​القيمة 0.02 باعتباره الحد الأمثل للتحليلات. تحت هذا الحد ، قدم نهج BCM 74.94٪ من true ، 1.75٪ من التعريفات الخاطئة ، وكانت الاستعلامات الغامضة 15.42٪. وكانت نسبة 7.89٪ من الاستفسارات المتبقية غير محددة. The ‘localMinima’ function in SPIDER returned the threshold of 0.053 as possible transition between intra- and interspecific distances (Supplementary Fig. 3). With this threshold, the BCM approach provided 76.29% of true, 2.46% of false and 15.49% of ambiguous identifications, while 5.75% had no identification. When singletons were excluded, the false and unidentified queries decreased under each threshold. The ASB analysis returned the same results as BCM at the threshold value 0.01. While the BCM approach returned a slightly higher success rate than that of ASB approache from threshold value 0.021 and 0.053.

BIN discordance report and the nearest neighbour analysis

The BIN analysis included 2591 of the 2801 records and generated 582 different BINs. A number of 387 BIN clusters was found to be taxonomically concordant with other barcode data on BOLD assigned to the same species name (Supplementary Table S4). Five records was indicated as singleton, which means that this BIN only refers to one specimen (Supplementary Table S5). BIN discordance analysis returned 190 BINs as discordant respect to our prior taxonomic assignments (Supplementary Table S6). The external (incl. BOLD data) incongruence occurred at different taxonomic levels: the highest rank of conflict was found at one phylum level, followed by five at order, as well as nine family level. At the genus level, 62 BINs were found to be discordant, which means that specimens belonging to different genera of the same family were grouped together in one BIN. Finally, 113 BINs incorporate specimens of at least two congeneric species. Within BNPM data, 72.2% of BINs was found to be concordantly with morphology-based identifications. The discrepancies include two groups: (i) 45 discordant BINs caused by haplotype sharing and low between-species divergence (Table 3), and (ii) 68 species clusters were assigned to two or more BINs (Table 4).

The nearest neighbour (NN) of each BIN according to the data available in BOLD is available as Supplementary Table S3. The NN comparison evidenced the under-representation of mollusc species on BOLD and the need for taxonomic reassessment of some species: 65% of BINs generated by our entries had a congeneric NN, 20% had a NN from the same family or a higher taxonomic rank, and 14% had a NN represented by an unidentified specimen.

Neighbour-joining analysis

The neighbour joining (NJ) tree profile showed that sequence records for 2,320 (83.0%) queries representing 355 (62.4%) of all species formed distinct barcode clusters allowing their successful identification. 299 sequences involve 31 cases of paraphyly or shared barcodes between closely related species pairs, making their misidentification. Due to the lack of conspecific sequences in the data set, 31.9% of species are ambiguous and remain unidentified (Supplementary Fig. 4). Therefore, a large proportion of sequences (83.0%) and species (62.4%) were unambiguously distinguishable using the criterion of barcode clusters.

Thirteen of these 31 problematic cases involved species that formed paraphyletic clusters (Supplementary Fig. 4, groups highlighted in yellow e.g., Patelloida pygmaea Fig. 4A). ل P. pygmaea, some of the taxa exhibiting deep intraspecific divergence values were recovered as paraphyletic in phylogenetic trees nevertheless, the haplotype networks of the paraphyletic species demonstrated that no shared haplotype was found between each pair of the species (e.g., Patelloida النيابة. Fig. 4B).

The phylogenetic analysis of four species of the genus Patelloida.

(أ) Neighbour-Joining (NJ) tree shows the relationships of the Patelloida النيابة. based on the K2P parameter model with bootstrap values more than 50% indicated. (ب) The network connecting the haplotypes documented in the Patelloida النيابة. Haplotypes are represented by circles. The numbers on the internodes indicate mutation steps, and the other numbers are the frequencies of each haplotype. Color-coding represents distinct species. The black solid circle indicates missing intermediate steps between observed haplotypes.

Members of six species pairs and two species trioes showed cases of barcode sharing, producing a mixed-species cluster in the NJ tree (Supplementary Fig. 4, framed clusters e.g., Meretrix spp Fig. 5A). ل Meretrix spp., the sharing of COI haplotypes was found in the haplotype networks of the closely related species (Fig. 5B). Overall, all these eighteen species with undifferentiated barcodes formed only fifteen clusters in phylogenetic trees.

The phylogenetic analysis of five species of the genus Meretrix.

(أ) Neighbour-Joining (NJ) tree of barcodes from individuals of the genus Meretrix based on the K2P parameter model with bootstrap values more than 50% indicated. (ب) Haplotype networks of Meretrix محيط. Haplotypes are represented by circles. The numbers on the internodes indicate mutation steps, and the other numbers are the frequencies of each haplotype. The haplotypes have a size proportional to the number of analyzed specimens with this haplotype. Color-coding represents distinct species. The black solid circle indicates missing intermediate steps between observed haplotypes.

Deeply divergent intraspecific clusters were found within 62 of the 569 analyzed species (10.9%), indicating the occurrence of cryptic diversity (Table 5, Supplementary Fig. 4, groups highlighted in magenta). Those divergent intraspecific clusters, which correspond to divergent evolutionary lineages, were restricted to 32 of the 91 analyzed families (Table 5). The number of lineages by species varied from 2 to 4, for a total of 137 divergent lineages among 62 named species, which suggests a 13% increase in species diversity. Deeply divergent intraspecific lineages (>2%) were always (19/62) found in different geographical locations (e.g Echinolittorina vidua و Serratina capsoides Fig. 6A–D). Notably, the inflated geographical coverage changed the clustering pattern of conspecific individuals. In our data set, 3 species (Patelloida pygmaea, Thais luteostoma و Conus sanguinolentus) moved from monophyletic to paraphyletic after inclusion of additional populations. Consequently, we concentrated the study on how does the inclusion of geographically separated populations influence DNA barcoding. As expected, expansion of geographical coverage significantly increased intraspecific variation. The mean value of maximum intraspecific genetic distance increased eight-fold: from x ± S.E. = 1.02 ± 0.06% (when one population species was considered) to x ± S.E. = 8.77 ± 0.17% (when individuals from distinct populations were included).

Examples of taxa with deep intraspecific divergence.

(أ) Sampling sites of the two COI lineages found in Echinolittorina vidua. The specimens of both lineages were present (scale bar, 400 km). (ب) Neighbour-Joining (NJ) tree of COI barcodes of E. vidua with bootstrap values more than 50% indicated. (ج) Sampling sites of the two COI lineages found in Serratina capsoides. The specimens of one of the lineages were allopatric (scale bar, 400 km). (د) Neighbour-Joining (NJ) tree of COI barcodes of S. capsoides with bootstrap values more than 50% indicated. The map of northwestern Pacific with Greater China, Japan, and Korea was rendered with ODV v4.7.3 63 (available at http://odv.awi.de) and modified in Microsoft Office.


Complete example of application

In this section, we report a complete example of the BarcodingR software application.

File formats: input and output

Most of functions in BarcodingR take objects of DNAbin class as inputs. To obtain DNAbin objects, users should prepare two fasta format files, corresponding to reference and query sequences, respectively, and these two data sets are read into r using function read.dna in r package ape (Paradis, Claude & Strimmer 2004 ) or another r function fasta2DNAbin in package adegenet (http://adegenet.r-forge.r-project.org/). Please note that the reference data set must contain taxon information with a special format like ‘>seqID, species_names’, for instance, ‘>seq1, Dendrolimus_punctatus’, or ‘>seq1, Lasiocampidae_Dendrolimus_punctatus’, whereas query data set can be in general fasta format. The main species identification functions in BarcodingR return a list, containing queIDs, identified species, and bp.probilities/FMF values, outputs can be written into a file using the function save.ids, which takes object of ‘BarcodingR’ class as inputs.

How to run

Here, we provide examples of utilities of the main functions in BarcodingR using included data sets. First, one should load the package and example data.


شاهد الفيديو: Select by Location in ArcMap - التحديد حسب الموقع الإستعلام المكاني بـ Intersect (ديسمبر 2022).