معلومة

تسلسل الجيل القادم سلبي كاذب

تسلسل الجيل القادم سلبي كاذب


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

في اكتشاف المتغير ، وتسلسل الحمض النووي الريبي ، وتسلسل ChIP ، أظهرنا كيف نطابق ، أو نحاذي ، قراءة NGS القصيرة للجينوم ، ثم نستنتج باستخدام القراءات التي تجمع أو "تتراكم" في منطقة معينة: إما العثور على SNP ، لتحديد كمية الرنا المرسال ، أو تحديد كمية البروتين المرتبط بالحمض النووي. حدد "إيجابيًا حقيقيًا" على أنه اكتشاف SNP ، أو اكتشاف تعبير mRNA ، أو اكتشاف بروتين مرتبط بالحمض النووي. أي مما يلي (يمكنك اختيار أكثر من واحد) يمكن أن يؤدي إلى نتيجة سلبية خاطئة ، على سبيل المثال لم نكتشف وجود SNP حقيقي ، أو تعبير mRNA ، أو بروتين مرتبط في موقع / منطقة؟

أي واحد هو الجواب الصحيح؟ لماذا ا؟ (يمكننا اختيار أكثر من واحد)

1- المنطقة التي نهتم بها ليست في الجينوم المرجعي

2- المنطقة التي نهتم بها تحدث آلاف المرات في الجينوم ، ونحن نتجاهل القراءات التي تتوافق مع العديد من الأماكن

3- بالنسبة للمنطقة التي نهتم بها ، يختلف جينوم الكائن الحي كثيرًا عن الجينوم المرجعي بحيث يتعذر على برنامج المحاذاة العثور على تطابق

4- لا توجد ايجابيات كاذبة


مثال على 1) قد يكون إذا كنت تبحث عن طفرة في الكروموسوم Y ، لكن التسلسل المرجعي الخاص بك يحتوي فقط على جسيمات جسمية.

اقرأ # 2 بعناية أكثر. إذا كانت هناك منطقة تتكرر 1000 مرة في الجينوم ، فإن الكثير من المصففات يرمي هذه القراءات بعيدًا ، على أساس أنه لا يمكنك تعلم أي شيء مفيد منها ، وسوف ينفخون ملفات الإخراج بلا فائدة. سيحدث تخفيف التغطية عن طريق تقسيم تغطية القراءة مع بعض التقويمات إذا كان هناك عدد قليل من الأماكن لقراءة القراءة ، ولكن ليس 1000.

يحرر. اسمحوا لي أن أحاول أن أجعل مثالا أفضل.

لديك عينة من سلالة مقاومة للمضادات الحيوية لبعض البكتيريا السيئة. تحتوي هذه البكتيريا على بعض الجينات الموجودة على البلازميد. قام بعض المختبرات الأخرى بتسلسل هذه البكتيريا وبلازميدها. هذا هو مرجعك.

تقوم بمحاذاة قراءاتك إلى سلالة البكتيريا المرجعية الخاصة بك ، ولكن عفوًا ، لقد حذفت البلازميد عن طريق الخطأ. لذلك لم يلاحظ المتصل المتغير أي اختلافات موجودة في البلازميد. إذا كنت متسرعًا ولم تتحقق لرؤية تغطية القراءة على البلازميد ، فقد تفترض أن بلازميد عينتك يطابق المرجع ، لكنك لم تتحقق من ذلك بالصدفة.

بعد ذلك تحصل على عينة أخرى مقاومة للمضادات الحيوية. أنت تحاذيها مع المرجع الخاص بك ، ولا ترى أي متغيرات. حسنًا ، إذن ، هذا هو ... باستثناء أن السبب في عدم رؤيتك للمتغيرات هو أن الأشخاص الذين أعطوك العينة أخطأوا في تصنيفها ؛ إنه حقًا نوع فرعي مختلف ، وبعض المناطق المرجعية الخاصة بك مختلفة جدًا عن عينتك بحيث لا تتماشى القراءات.

بشكل عام ، عليك فقط أن تتذكر أنه إذا قال المتصل المتغير الخاص بك لا يوجد متغير في مكان ما ... فقد يعني ذلك أيضًا عدم وجود قراءات هناك. في الحياة الواقعية ، سيقوم الأشخاص ببعض مراقبة الجودة في إحصائيات محاذاة القراءة لمحاولة التقاط ذلك.


يمكن أن تحدث الخيارات الثلاثة الأولى في علم الجينوم. للحصول على أمثلة لكل: جينومات الخلايا السرطانية تتضمن انتقالات ، والتي يمكن أن تخلق مناطق من الجينوم لا تحدث في الجينوم المرجعي. هناك مناطق تحدث آلاف المرات في الجينوم تسمى الينقولات. تتجاهل العديد من خطوط أنابيب البرامج عمليات القراءة التي ترسم خريطة للعديد من المواقع ، ثم يتم تجاهل البيولوجيا الحقيقية (مثل البروتين المرتبط) التي يمكن أن تحدث في تلك المناطق. أيضًا ، في تسلسل الحمض النووي الريبي أو الحمض النووي من الخلايا السرطانية ، يمكن أن يكون هناك العديد من الطفرات التي تواجه برامج المحاذاة صعوبة في العثور على التطابق في الجينوم المرجعي. أو ، يمكن أن يحدث هذا إذا قمنا بمحاذاة القراءات من نوع واحد إلى جينوم نوع آخر (والذي لم يتم بعد إنشاء جينوم مرجعي له).


ما هي فوائد تسلسل الجيل القادم من Metagenomic؟

تتمثل أكبر قوة لـ mNGS في أنها طريقة تشخيص غير متحيزة خالية من الفرضيات ، على عكس طرق تفاعل البوليميراز المتسلسل المستهدفة (PCR) التي تعتمد على البادئات لتحديد أهداف محددة ليتم تضخيمها واكتشافها. حتى طرق PCR الشاملة أو واسعة النطاق ليست واسعة بما يكفي لاعتبارها ميتاجينومية ، لأنها تستخدم بادئات محددة من الجين المحفوظ من الحمض النووي الريبوزي 16S (rRNA) وتسلسلات المباعدة الداخلية المنسوخة (ITS) لتضخيم متواليات الحمض النووي المميزة التي يمكن تصنيفها بيولوجيًا. في البكتيريا / العتائق ، أو الفطريات على التوالي.

تشكل البادئات العالمية مشكلة أيضًا عند تشخيص العدوى متعددة الميكروبات بالاختبارات الجزيئية. إذا كانت المجموعات متعددة الميكروبات موجودة عند استخدام تسلسل 16S ، فسيتم إجراء مكالمات أساسية متعددة لكل نيوكليوتيد ، مما ينتج عنه مخطط كروماتوجرام نيوكليوتيد مختلط لا يمكن تفسيره. في حين أن هناك طرقًا حسابية غير تلافيفية متاحة للتنبؤ بالكائنات التي تم تحديدها ، إلا أنها ليست في الاستخدام القياسي للعديد من المختبرات ، والتي غالبًا ما تنعكس على تسلسل الجيل التالي من جين 16S للعينات متعددة الميكروبات.


تسلسل الجيل التالي لمراقبة SARS-CoV-2

يمكن أن يتطور SARS-CoV-2 ويتطور بمرور الوقت ، مما يؤدي إلى ظهور متغيرات مثل B.1.1.7 و B.1.351 و P.1. في كثير من الحالات ، تكون الطفرات غير مهمة ، ولكن قد يكون لبعضها القدرة على زيادة قابلية الانتقال وشدة المرض ، فضلاً عن التأثير سلبًا على أداء التشخيص والعلاجات واللقاحات. تساعد المراقبة التي أجرتها منظمة الصحة العالمية مجموعة عمل تطور فيروس SARS-CoV-2 والعديد من السلطات الوطنية على تحديد الطفرات بسرعة وفهم أهميتها.

للحصول على بعض الأفكار حول دور تسلسل الجيل التالي (NGS) في المراقبة العالمية لـ SARS-CoV-2 ، شبكات التكنولوجيا تحدثت إلى ميشيل فريزر ، المدير العام ، NGS ل PerkinElmer. تشرح ميشيل أيضًا كيف يمكن للمختبرات التي تعمل في هذا المجال زيادة إنتاجيتها وتقليل التكاليف المرتبطة وتبسيط تحليل بيانات NGS التي تم جمعها.

آنا ماكدونالد (AM): هل يمكنك إخبارنا ببعض أحدث التطورات في تكنولوجيا NGS؟

ميشيل فريزر (مف):
تم استخدام NGS بانتظام في البحث منذ تقديمه في عام 2005. وفي الآونة الأخيرة ، تم تطوير NGS للتشخيص السريري للأمراض الوراثية والتحري عن مخاطر الإصابة بأمراض متأخرة الظهور. هذا التحول من البحث الاستقصائي إلى التشخيصات المُسددة يجلب معه نضجًا للأدوات والأطقم وبرامج التحليل وإعداد التقارير لإنشاء عينة كاملة للإجابة على سير العمل الذي يمكن الموافقة عليه من قبل الهيئات التنظيمية.

أدى التطور المستمر والتقدم في NGS أيضًا إلى زيادة قوة تطبيقات NGS. تعد تحليلات الميتاجينوميات والتعدد الوراثي وتحليلات الخلية الواحدة أمثلة على المجالات التي تتقدم فيها NGS بسرعة.

صباحا: كيف يتم تطبيق NGS لمراقبة SARS-CoV-2؟

مف:
عندما تظهر عينة مريض أو عينة بيئية إيجابية لـ SARS-CoV-2 بواسطة تفاعل البوليميراز المتسلسل ، فإن السؤال التالي هو "من أين أتت؟" عندما ينتقل الفيروس من شخص إلى آخر ، سيكون الجينوم الفيروسي متطابقًا أو قريبًا جدًا منه. يتحور جينوم SARS-CoV-2 عند طفرات نقطتين تقريبًا شهريًا ، لذا فإن تتبع الفيروس مرة أخرى إلى المصدر وتحديد الأشخاص الآخرين الذين كانوا على اتصال وثيق وربما لم يتم فحصهم حتى الآن يمكن أن يساعد في السيطرة على الانتشار.

حدد مركز السيطرة على الأمراض (CDC) ثلاث فئات من المتغيرات ذات الاهتمام والتي ، بناءً على تسلسلها الجينومي ، قد لا يتم تحييدها بنجاح بواسطة اللقاحات أو العلاجات الحالية ويتم مراقبتها ، المتغيرات المثيرة للقلق التي تم ربطها بزيادة الانتقال ، وشدة المرض ، انخفاض المعادلة أو فشل الكشف التشخيصي (الاختبارات السلبية الكاذبة) والمتغيرات ذات النتائج العالية التي ستتطلب تشخيصات وعلاجات جديدة ومن المتوقع أن تؤدي إلى مرض إكلينيكي أكثر شدة وزيادة الاستشفاء. على سبيل المثال ، ارتبط المتغير B.1.1.7 المثير للقلق بزيادة كبيرة في خطر انتقال العدوى.

صباحا: ما الذي يجب أن يعرفه طاقم المختبر اليوم بخصوص أحدث متغيرات SARS-CoV-2؟

مف:
تعتبر طفرات السارس- CoV-2 انتهازية. تظهر متغيرات جديدة من خلال البقاء للأصلح. المعدل الحالي للطفرة هو نصف معدل الإنفلونزا ، لكنه لا يزال جينومًا يتغير باستمرار. يمكن أن يؤثر ذلك على دقة اختبارات تفاعل البوليميراز المتسلسل ، لذا فإن اليقظة المستمرة ضرورية. في البداية ، ركزت المعامل بشكل كامل على مراقبة معدل العدوى من خلال الكشف الإيجابي أو السلبي عن SARS-CoV-2. لقد كان فيروسًا جديدًا لم نعرف عنه سوى القليل جدًا ، بخلاف أنه انتشر بسرعة وفرض ضغطًا هائلاً على الخدمات الصحية العالمية. مع تحرك الوباء نحو الوباء ، سيكون هناك تركيز أقل على تشخيص COVID ، والمزيد من التركيز على فهم الفيروس. من المتوقع أن يؤدي هذا إلى زيادة الاهتمام بعلم الجينوم وتحديد المتغيرات الجديدة عند ظهورها.

صباحا: يختلف معدل تسلسل عينات SARS-CoV-2 اختلافًا كبيرًا عبر البلدان وداخلها ، كيف يمكن للمجتمع العلمي العالمي العمل ضد هذه التحديات لمواكبة الطفرات الفيروسية؟

مف:
لم يكن من الممكن السيطرة على وباء SARS-CoV-2 العالمي إلا بقدر ضئيل من السيطرة لأن المجتمع العلمي العالمي عمل معًا. تم إتاحة أول بنية جينومية للجمهور ، مما سمح لمطوري الاختبارات التشخيصية بإنشاء حلول اختبار ومطوري الأدوية لإنشاء لقاحات في وقت قياسي. سيستمر التسلسل في تحسين فهمنا لـ SARS-CoV-2. كلما كان برنامج التسلسل أكثر انتشارًا ، زاد عدد المتغيرات التي سنكتشفها وفهمنا العدوى بشكل أفضل. إذا كانت هناك مناطق لا توجد بها معلومات تسلسلية ، فسيكون من الصعب تتبع المتغيرات وفهم كيفية تأثير الطفرات الفيروسية على الانتقال وشدة العدوى وفعالية العلاجات.

صباحا: كيف يمكن للمختبرات زيادة إنتاجيتها و / أو تقليل التكاليف المرتبطة بالمراقبة الجينية لطفرات SARS-Cov-2 باستخدام NGS؟

مف:
يؤدي التخلص من الخطوات ، مثل عزل الحمض النووي الثانوي والتطبيع ، إلى تقليل التكاليف والسماح للمختبرات بزيادة إنتاجيتها. يمكن للأتمتة تحرير الموارد البشرية للتركيز على المهام الأكثر تعقيدًا ، والسماح بتجميع أعداد متزايدة من العينات ، وبالتالي تقليل التكلفة لكل عينة لتسلسل الكواشف. بالإضافة إلى ذلك ، تسمح قدرات مضاعفة الإرسال المتزايدة للمختبرات بتقليل تكاليف التسلسل ، وزيادة الإنتاجية ، وتقديم النتائج بشكل أسرع.

صباحا: كيف يمكن للمختبرات تبسيط تحليل بيانات NGS التي تم جمعها؟

مف:
شمل التعاون العالمي لفهم SARS-CoV-2 أيضًا مطوري برامج تحليل بيانات NGS ومستودعات التسلسل الجيني التي تعمل بشكل وثيق مع مجموعات البحث الأكاديمية والصناعية لتبسيط تحليل البيانات وتوحيده. لقد كان هذا جانبًا مهمًا لأنه يعني أن جميع المعامل تنشئ بيانات متشابهة جدًا يمكن مقارنتها بسهولة بين المعامل في جميع أنحاء العالم. يجب أن يكون خط أنابيب التحليل متوافقًا مع متطلبات CDC لتتبع المتغيرات ويمكن إرساله بسهولة إلى قاعدتي بيانات NCBI و GISAID.

صباحا: ما هي مزايا وعيوب استخدام RT-PCR لتحديد طفرات SARS-CoV-2؟

مف:
لا يزال RT-PCR هو الاختبار التشخيصي الأساسي القياسي الذهبي للكشف عن SARS-CoV-2 نظرًا لوقت الدوران السريع والتكلفة والتفسير البسيط للنتائج الإيجابية / السلبية. ومع ذلك ، فإن اختبارات RT-PCR لا توفر جينومًا كاملاً لتحليله. يتم تحديد المتغيرات باستخدام الجينوم بأكمله ، لذلك بينما يمكن تعديل اختبارات RT-PCR وتكييفها لاكتشاف المتغيرات الجديدة ، يجب تحديد المتغيرات أولاً عن طريق التسلسل. نحتاج إلى تسلسل نسبة من العينات الإيجابية لـ SARS-CoV-2 RT-PCR للتحقق من المتغيرات ، خاصةً إذا كانت هناك زيادة في معدل الإصابة أو شدة الأعراض أو مؤشر آخر يشير إلى وجود متغير جديد يحتاج إلى أن تكون مفهومة بشكل أفضل وأن يتم تتبعها عن كثب.

كانت ميشيل فريزر تتحدث إلى آنا ماكدونالد ، كاتبة العلوم لشبكات التكنولوجيا.


أساليب

تم اختيار فريق خبراء (يشار إليه فيما بعد باسم الفريق) مؤلف من أطباء وعلماء أحياء إيطاليين لخبراتهم الفردية في البحث والممارسة السريرية في إدارة سرطان الدم النخاعي المزمن وتم تجميعه في مايو 2018. خلال الاجتماع الأولي الذي عقد في الشهر التالي ، تم تحديد المخطط التفصيلي تمت مناقشة المشروع ، وتم تحديد الموضوعات التي تشكل هيكل هذه الوثيقة. تم اختيار الأسئلة الرئيسية من خلال سلسلة من الاستبيانات ، وقام كل عضو بصياغة بيانات تناولت سؤالًا واحدًا أو أكثر ، بينما سجل باقي أعضاء اللجنة موافقتهم على تلك البيانات وقدموا اقتراحات لإجراء تعديلات. أخيرًا ، عقدت الهيئة مؤتمرًا إجماعيًا عُقد في ميلانو ، إيطاليا ، في نوفمبر 2018. في هذا المؤتمر ، تم تقديم المقترحات النهائية باستخدام تقنية المجموعة الاسمية [23] ، والتي طُلب من المشاركين أولاً التعليق عليها في جولة- robin fashion على خلافاتهم مع القضايا المقترحة ثم التصويت على البيان الختامي.


Lo YM ، Corbetta N ، Chamberlain PF ، et al. وجود الحمض النووي للجنين في بلازما الأم ومصلها. لانسيت 1997350:485–7.

Bianchi DW ، Platt LD ، Goldberg JD ، Abuhamad AZ ، Sehnert AJ ، Rava RP MatErnal BLood هو مصدر لتشخيص اختلال الصيغة الصبغية الجنيني (ميليسا) بدقة. الكشف عن اختلال الصيغة الصبغية للجنين على نطاق الجينوم عن طريق تسلسل الحمض النووي للبلازما الأم. Obstet Gynecol 2012119:890–901.

Chiu RW ، Akolekar R ، Zheng YW ، وآخرون. تقييم ما قبل الولادة غير الجراحي للتثلث الصبغي 21 عن طريق تسلسل الحمض النووي لبلازما الأم المتعدد: دراسة مصداقية على نطاق واسع. BMJ 2011342: c7401.

Verweij EJ ، Jacobsson B ، van Scheltema PA ، et al. دراسة تقييم التثلث الصبغي الأوروبي غير الغازي (EU-NITE): دراسة استباقية متعددة المراكز لاختبار التثلث الصبغي 21 للجنين غير الغازي. التشخيص برينات 201322:1–6.

صموئيل أ ، بونانو سي ، أوليفانت أ ، باتي أ ، رايت دينار. جزء من الحمض النووي للجنين الخالي من الخلايا في مصل الأم كمتنبئ لغزو المشيمة غير الطبيعي - دراسة تجريبية. التشخيص برينات 201333:1–4.

Tjoa ML ، Cindrova-Davies T ، Spasic-Boskovic O ، Bianchi DW ، Burton GJ. الإجهاد التأكسدي الأرومة الغاذية وإطلاق الحمض النووي المشيمي الخالي من الخلايا. أنا J باتول 2006169:400–4.

Flori E و Doray B و Gautier E et al. يبدو أن الحمض النووي للجنين الخالي من الخلايا في مصل الأم ينشأ من الخلايا الأرومة الغاذية الخلوية والمخلقة. تقرير الحالة. همهمة ريبرود 200419:723–4.

Faas BH و de Ligt J و Janssen I et al. التشخيص غير الجراحي قبل الولادة لاختلال الصيغة الصبغية الجنينية باستخدام التسلسل الموازي على نطاق واسع ، وإثبات أن الحمض النووي للجنين الخالي من الخلايا في بلازما الأم ينشأ من الخلايا الأرومية الخلوية. خبير Opin بيول هناك 201212 ملحق 1: S19–26.

مورين إس ، جرين إم إف ، ميلو إم إم. حقبة جديدة في اختبارات ما قبل الولادة غير الباضعة. إن إنجل جي ميد 2013369:499–501.

Mennuti MT ، Cherry AM ، Morrissette JJ ، Dugoff L. هل حان الوقت لدق ناقوس الخطر بشأن اختبار الحمض النووي الخالي من الخلايا الإيجابية الزائفة لاختلال الصيغة الصبغية لدى الجنين؟ أنا J Obstet Gynecol 2013209:415–9.

Mozersky J ، Mennuti MT. اختبار الحمض النووي للجنين الخالي من الخلايا: من يقود التنفيذ؟ جينيه ميد 201315:433–4.

جاو واي ، ستيجسكال د ، جيانغ ف ، وانغ دبليو. نتيجة T18 سلبية خاطئة بواسطة NIPT في حالة XXX ، T18 بسبب الفسيفساء المشيمية. الموجات فوق الصوتية التوليد Gynecol 2013. دوى: 10.1002 / uog.13240.

بان إم ، لي فت ، لي واي ، وآخرون. نتائج متضاربة بين التنميط النووي للجنين واختبار ما قبل الولادة غير الجراحي عن طريق تسلسل بلازما الأم في حالة تشوه أحادي الوالدين 21 بسبب الإنقاذ ثلاثي الصيغ. التشخيص برينات 201333:598–601.

Grati FR ، Grimi B ، Frascoli G ، et al. تأكيد الفسيفساء والاضطراب أحادي الوالدين في الخلايا السلوية ، بعد الكشف عن تشوهات الكروموسومات الفسيفسائية في الزغابات المشيمية. Eur J Hum Genet 200614:282–8.

Grati FR ، Malvestiti F ، Grimi B ، et al. QF-PCR كبديل للتنميط النووي للأرومة الغاذية الخلوية لتحليل الزغابات المشيمية: المزايا والقيود من التدقيق الاستعادي الخلوي لـ 44727 تشخيصًا قبل الولادة في الثلث الأول من الحمل. التشخيص برينات 201333:502–8.

Simoni G و Brambati B و Danesino C et al. تحليلات فعالة مباشرة للكروموسوم وتحديد الإنزيمات المأخوذة من عينات الزغابات المشيمية في الأشهر الثلاثة الأولى من الحمل. همهمة جينيه 198363:349–57.

فيرما آر إس ، بابو أ. مبادئ وتقنيات الكروموسومات البشرية . McGraw-Hill، Inc، 1995: 24-6 (البروتوكول 2.16).

McKinlay Gardner RJ، Sutherland GR، Shaffer LG: تشوهات الكروموسومات والاستشارات الجينية (دراسات أكسفورد في علم الوراثة الطبية) ، الطبعة الرابعة ، الفصل 27. مطبعة جامعة أكسفورد: نيويورك ، 2012: 439-85.

دعوات صعبة لاختبارات ما قبل الولادة. صحيفة وول ستريت جورنال. http://online.wsj.com/news/articles/SB10001424127887324883604578398791568615644. تم الوصول إليه في 23 أغسطس 2013.

Hui L ، Bianchi DW. أحماض نووية جنينية خالية من الخلايا في السائل الأمنيوسي. همهمة ريبرود تحديث 201117:362–71.

بنينجتون جيه إل. تطور وهيكلة المشيمة. في: علم أمراض المشيمة (المشاكل الرئيسية في علم الأمراض) , المجلد. 8. سعودرز: لندن ، 1978: 1–37.

سيبليس لوس أنجلوس. نمو زغابات المشيمة في الثلث الأول من الحمل. J ريبرود ميد 19681:377–387.

كوفمان ب. تطوير وتمايز شجرة الزغابات المشيمية البشرية. ببل عنات 198222:29–39.

Futch T و Spinosa J و Bhatt S و de Feo E و Rava RP و Sehnert AJ. الخبرة المعملية السريرية الأولية في اختبار ما قبل الولادة غير الباضع لاختلال الصيغة الصبغية الجنينية من عينات الحمض النووي لبلازما الأم. التشخيص برينات 201333:569–74.

ياو إتش ، تشانغ إل ، تشانغ إتش وآخرون. يكتشف الاختبار الجيني غير الباضع قبل الولادة لاختلال الصيغة الصبغية الجنيني التثلث الصبغي X للأم. التشخيص برينات 201232:1114–6.

Osborne CM و Hardisty E و Devers P et al. ينتج عن الاختبارات غير الباضعة غير المتوغلة السابقة للولادة مريضة تم تشخيصها لاحقًا بمرض نقيلي. التشخيص برينات 201333:609–11.

كانيك جا ، بالوماكي جنرال إلكتريك ، كلوزا إم ، لامبرت-ميسيرليان مدير عام ، هادو جي. تأثير جزء الحمض النووي للجنين في بلازما الأم على اختبارات تسلسل الجيل التالي لاختلال الصيغة الصبغية الجنينية الشائعة. التشخيص برينات 201333:667–74.

بن ف ، كاكل ح ، بيرجامنت إي. اختبار ما قبل الولادة غير الجراحي لاختلال الصيغة الصبغية: الوضع الحالي والآفاق المستقبلية. الموجات فوق الصوتية التوليد Gynecol 201342:15–33.


الموجودات

خلفية

مع الاستخدام المتزايد لتقنيات التسلسل من الجيل التالي في مجموعات البحث في جميع أنحاء العالم ، هناك أيضًا حاجة متزايدة للأدوات التي يمكن أن تساعد في التحليلات النهائية للكميات الهائلة من بيانات التسلسل المنتجة. علاوة على ذلك ، مع استمرار انخفاض تكاليف التسلسل [1] ، يمكن لعدد متزايد من المجموعات تحمل تكاليف تسلسل الجيل التالي مما يزيد من الحاجة إلى المعالجة المسبقة الفعالة والدقيقة لبيانات التسلسل. وبالتالي ، يتعين على العديد من المجموعات التعامل مع نفس النوع من المشاكل مما يؤدي إلى التطوير الداخلي للأدوات الموجودة بالفعل.

إحدى المشكلات التي تمت مواجهتها في العديد من التجارب - خاصة مع استمرار اتساع أطوال القراءة - هي تسلسل أجزاء المحول. إذا كان طول القراءة ، إل ص، أطول من حجم الإدخال ، إل أنا، ثم ستشمل القراءة التي تنتجها آلة التسلسل إل أ = إل صإل أنا النيوكليوتيدات من تسلسل المحول. اعتمادًا على بروتوكول بناء المكتبة المستخدم ، ستكون أجزاء المحول موجودة في نهاية الجزء 3 من القراءة وربما أيضًا في نهاية 5. إذا لم تتم إزالة هذه الأجزاء - التي يُشار إليها بتلوث المحول في هذه الورقة - بشكل صحيح ، فيمكن أن تؤدي إما إلى المحاذاة الفائتة لأن البنية المتسلسلة لا تتطابق مع الجينوم ، أو إذا تم تعيين القراءة على الجينوم ، فقد يؤدي ذلك إلى زيادة مضللة في عدد حالات عدم التطابق في نهاية التعيين. يمكن أن تؤدي هذه القراءات التي تحتوي على تلوث المحول إلى التنميط الجيني الخاطئ واستدعاءات SNP في اتجاه آخر في التحليلات. إن حالات عدم التطابق في النهاية 5 بوصات بسبب تلوث المحول لها احتمالية أكبر للتخلص بشكل خاطئ من تطابق حقيقي نظرًا لأن معظم أدوات التعيين تعتمد على منطقة بذرة عالية التشابه في نهاية 5 بوصات من القراءات (مثل السلوك الافتراضي لـ Bowtie [2 ] ، BWA [3] ، SOAP [4] ، و SOAP2 [5] هو عدم السماح بأكثر من 2 عدم تطابق في منطقة البذور).

تصبح المشكلة أكثر دراماتيكية كلما كان الجزيء المعني أقصر - على سبيل المثال عند تسلسل الجزيئات الدقيقة ، أو في مجال الحمض النووي القديم - على الرغم من أن المشكلة ليست معزولة في مجالات البحث هذه. لذلك من الأهمية بمكان تنظيف القراءات عن طريق إزالة هذه التكرارات اللاحقة من أصل غير جينومي قبل تعيين الجينوم المرجعي أو إجراء من جديد تجميع القراءات. نظرًا لأن هذه مشكلة عامة ، توجد العديد من البرامج المختلفة التي تحاول حلها ، يُظهر كل منها نقاط القوة والضعف الخاصة به كما هو موضح في الجدول 1. تختلف هذه الطرق في الميزات التي تقدمها عند اقتطاع المحولات (على سبيل المثال ، التعامل مع البيانات أحادية الطرف أو ذات النهاية المزدوجة ، والعثور على محولات في نهاية القراءة 5 'أو 3' ، والبحث عن محولات مختلفة متعددة) ، والتحليلات الإضافية التي يمكن أن تكون يتم إجراؤها مثل تقليم النيوكليوتيدات منخفضة الجودة أو فرز القراءات بناءً على الرموز الشريطية لتعدد الإرسال.

نقدم أداة قائمة بذاتها ، AdaptorRemoval ، والتي تحل بفعالية معظم هذه المشكلات في وقت واحد دون الحاجة إلى استدعاء عدة برامج مختلفة. يمكن لـ AdaptorRemoval العثور على محولات في نهاية القراءات 5 'و 3' ، ويمكنه التعامل مع البيانات أحادية النهاية والنهاية المزدوجة ، ويمكنه إزالة المناطق منخفضة الجودة وتقليم Ns من القراءات ، ويمكنه طي التداخل المقترن يقرأ ، نهاية. تم تطوير AdaptorRemoval بشكل مستقل في مجموعتنا حيث تم استخدامه (على الرغم من أنه جزء غير مسمى من خط الأنابيب) في عدد من مشاريع التسلسل الكبيرة التي تركز بشكل أساسي على الحمض النووي القديم [28-30]. لذلك تم استخدام الأداة بشكل متكرر على مر السنين ولا تزال جزءًا لا يتجزأ من العمل في مركز التميز في GeoGenetics في كوبنهاغن. تم تحديث AdapterRemoval وتوسيع نطاقه بناءً على التعليقات والطلبات المقدمة من المستخدمين لحل المشكلات المختلفة التي واجهتها. إنها أداة متعددة الاستخدامات سهلة الاستخدام على أي نظام أساسي قائم على UNIX.

أساليب

يستخدم AdapterRemoval تباينًا من خوارزمية Needleman-Wunsch [31] التي تم تعديلها لأداء محاذاة شبه عالمية غير معطلة بحثًا عن التطابقات بين الطرف 3 للقراءة والنهاية 5 من تسلسل المحول. تعتمد خصوصيات الخوارزمية على البيانات (ذات النهاية الفردية أو المزدوجة) وعلى الإعدادات الأخرى كما هو موضح في ما يلي. يوضح الشكل 1 الوظيفة العامة للبرنامج.

رسم توضيحي للتركيبات المختلفة والقراءات المنتجة. البيانات أحادية الطرف في الأعلى ، والنهاية المزدوجة أدناه. يتم الإشارة إلى الإدخالات أنا، يقرأ نهاية واحدة ص ويقرأ نهاية مقترنة ص 1 و ص 2. طول القراءة المشار إليها إل ص، أدخل الطول المشار إليه إل أنا. أ) إل أناإل ص: لا تلوث محول. ب) إل أنا & lt إل ص: تلوث المحول يحدث في نهاية 3. ج) إل أنا ≥ 2· إل ص: لا تلوث محول ولا تداخل بين القراءات. د) إل ص & lt إل أنا & lt 2 · إل ص: لا تلوث المحول ولكن القراءات تتداخل. ه) إل أنا & lt إل ص: تلوث المحول في نهايات 3 'من كلتا القراءات ، تتداخل بين 5 نهايات من القراءة. يمكن استخدام هذه المعلومات لأداء المحاذاة الزوجية المطلوبة (بعد التكملة العكسية للموصل 2 من الزوج) لتحديد موقع تلوث المحول و / أو التداخل بين القراءات

إذا كان الإدخال الذي يتم تسلسله أقصر من طول القراءة ، فستتضمن القراءة جزءًا من تسلسل المحول في نهاية 3. في حالة قراءة أحادية الطرف ، يقوم AdapterRemoval بإجراء المحاذاة بين القراءات وتسلسل المحول المتوقع. عند معالجة قراءة أحادية الطرف ، يصبح تحديد جزء المحول أكثر صعوبة كلما كان أقصر.

عند تحليل البيانات ذات النهاية المزدوجة ، يتوفر الكثير من المعلومات: إذا كان لدينا تلوث بالمحول ، فسيكون متماثلًا في القرائتين (إذا لم يحدث indels ، انظر الشكل 1E) ويمكن للبرنامج التعرف بدقة حتى على نوكليوتيد واحد من المحولات. ستكون القراءةتان (مع إحداهما مكملة عكسيًا) متطابقة في المنطقة المتداخلة (أي إدراج الجينوم) وستتطابق نهايتي القراءة 5 و 3 ، على التوالي ، مع المحولات. حتى عند السماح بعدم التطابق ، فإن هذا يجعل الإجراء حساسًا للغاية لتلوث المحول في هذه الحالات.

يمكن تعيين معدل عدم التطابق المسموح به من قبل المستخدم ، ولكن بشكل افتراضي ، يتطلب البرنامج تطابقًا مثاليًا لمحاذاة تصل إلى 5 نيوكليوتيدات ، ويسمح بعدم تطابق واحد لمحاذاة تصل إلى 10 نيوكليوتيدات ، ويسمح بكسر (0.15 للنهاية المزدوجة و 0.33 للأحادية) end) من طول المحاذاة لتكون غير متطابقة لمحاذاة أطول. يستخدم البرنامج مخطط تسجيل بسيط ولكنه فعال: 1 للمباريات ، -1 لحالات عدم التطابق ، 0 لمحاذاة Ns. المحاذاة المختارة هي الأفضل من حيث إجمالي الدرجات حيث يكون عدد حالات عدم التطابق في النطاق المسموح به.

نظرًا لأن الفجوات أقل شيوعًا من عدم التطابق في بيانات Illumina [32] ، فإننا لا نقوم بتضمين محاذاة فجوات ، وبما أننا نحسب فقط المحاذاة بين الطرف الثالث للقراءة والنهاية 5 للمحول ، فإننا نحتاج فقط إلى النصف العلوي من مصفوفة البرمجة الديناميكية فوق القطر الرئيسي (الشكل 2 ، اللوحة 3). أظهرت الملاحظات أن القراءات في بعض الأحيان تفقد بعض القواعد في نهاية 5. يمكن أن يؤدي ذلك إلى فقدان تلوث المحول لأن المحاذاة محصورة في النصف العلوي من المصفوفة وبالتالي لا تتم محاذاة القرائتين بشكل صحيح (الشكل 2 ، اللوحة 1 و 2). لحل هذه المشكلة ، يمكن تمديد المحاذاة قليلاً مما يؤدي بشكل فعال إلى إزاحة قراءة واحدة نحو نهاية 3 س النيوكليوتيدات بالنسبة للقراءة الأخرى (الافتراضي هو س= 2). يؤدي هذا إلى إنشاء عبء في نهاية 5 'للمحول حيث يتم تجاهل النوكليوتيدات القليلة الأولى لأنها ليست في القراءة المتسلسلة. تكلفة هذا هو ذلك س يجب حساب أقطار فرعية إضافية في المصفوفة لتشمل هذه المحاذاة (الشكل 2 ، اللوحة 3).

الحاجة إلى تحويل المحاذاة بسبب فقدان النيوكليوتيدات. إذا كانت القراءة تفتقد إلى بعض النيوكليوتيدات في نهاية 5 ، فلن تكون المحاذاة الصحيحة قابلة للاسترداد إذا توقف الإجراء عند الموضع الأول. كما هو موضح في 1) ، يؤدي هذا إلى العديد من حالات عدم التطابق وربما تلوث المحول الفائت. إذا تم إزاحة المحاذاة بمقدار س النيوكليوتيدات كما هو موضح في 2) ، يمكن العثور على المحاذاة الصحيحة. توضح مصفوفة البرمجة الديناميكية في 3) المداخل في المصفوفة التي تؤدي إلى الحلين الموضحين هنا. الجزء الرمادي الفاتح هو النصف العلوي من المصفوفة الذي يتم حسابه افتراضيًا يوضح المدخلان الرماديان الداكنان المحاذاة الموضحة في 1) و 2)

يسمح AdapterRemoval بطي أزواج القراءات المتداخلة في قراءة واحدة سواء كان الاثنان يحتويان على تلوث بالمحول أم لا (انظر الشكل 1). كما تم متابعة هذه الفكرة بشكل مستقل في برنامج FLASH الذي تم نشره مؤخرًا [33]. إذا كان طول الإدخال ، إل أنا، أطول من طول القراءة ، إل ص، لكن أقصر من 2 · إل ص، إذن ليس لدينا تلوث للمحول ولكن القرائتان تتداخلان في نهاياتهما الثلاثة. في هذه الحالة ، يمكن دمج القراءتين في قراءة واحدة ويمكن إعادة تقدير خصائص التداخل بناءً على سلسلتي الجودة. إذا كانت القراءات في زوج تحتوي على تسلسل محول ، فستكون الأجزاء المتراكبة المتبقية من الأصل الجيني من نفس التسلسل الأصلي ويمكن أيضًا طيها في قراءة واحدة وإعادة تقدير الصفات.

لطي قراءتين في واحدة ، يتعامل AdapterRemoval مع نقاط الجودة للمنطقة المتداخلة كمصفوفة تسجيل خاصة بالموقع (PSSM). لكل موضع في التداخل ، لدينا نيوكليوتيد ودرجة جودة من كلتا القراءات. يمكن تحويل نقاط الجودة Q إلى احتمال خطأ ، ص ه = 10 −س/ 10. هذا يعطي احتمالية وجود النيوكليوتيدات في القراءة ، ص1 = 1 −ص ه، واحتمال لكل من النيوكليوتيدات الثلاثة المتبقية ، ص2 = ص ه / 3. يتم الجمع بين هذه الاحتمالات للقراءتين لإعطاء توزيع احتمالي واحد معاد تقدير للمنطقة المتداخلة. أخيرًا ، يتم اختيار تسلسل النوكليوتيدات الأكثر احتمالًا بناءً على PSSM ، ويتم ترجمة الاحتمالات مرة أخرى إلى درجات جودة Phred المعاد تقديرها [34]. إذا قرر المستخدم القيام بذلك ، فسيقوم AdaptorRemoval باكتشاف هذه الحالات وإخراج تسلسل النوكليوتيدات الجديد وإعادة تقدير درجات الجودة. يمكن للمستخدم تحديد المدة التي يجب أن يستغرقها التداخل لدمج قراءتين (الافتراضي هو 11 نيوكليوتيد كما في [35]).

من المعروف أن جودة القراءة أقل في النهايات [32] ، مع ارتفاع معدلات الخطأ في كل من 5 و - على وجه الخصوص - 3 في نهاية القراءة. لذلك ، تم تصميم AdapterRemoval للتعامل مع هذا بطريقتين مختلفتين: من الممكن قطع الامتدادات المتتالية لحرف الغموض N من طرفي القراءات. نظرًا لأن وجود Ns يمكن أن يجعل رسم الخرائط صعبًا بسبب زيادة عدد الزيارات الزائفة ، فمن المهم عادةً إزالة هذه المواضع غير المفيدة. علاوة على ذلك ، يمكن لـ AdaptorRemoval تقليم القراءات بناءً على درجات الجودة عن طريق إزالة الامتدادات المتتالية من النيوكليوتيدات من طرفي القراءات حيث لا تتجاوز درجات الجودة حدًا معينًا (الافتراضي هو القطع 2 أو أقل). يمكن بالطبع استخدام خياري التشذيب هذين إما بمفردهما أو معًا. فيما يتعلق بهذا البرنامج أيضًا لديه خيار تجاهل القراءات التي تحتوي على عدد كبير جدًا من Ns حتى بعد التشذيب. يتم تحديد عدد Ns المسموح به من قبل المستخدم.

باستخدام AdapterRemoval ، من الممكن أيضًا العثور على المحولات وإزالتها من نهاية 5 'للقراءات. ومع ذلك ، نظرًا للاختلاف في الإعداد التجريبي ، يتم إجراء ذلك بطريقة مختلفة وأكثر صرامة من الطرف الثالث. أولاً ، يتم التسامح مع عدم تطابق واحد على الأكثر في الجزء المحاذي للقراءة والمحول. ثانيًا ، من المتوقع أن يكون تسلسل المحول 5 بوصات موجودًا بطول كامل تقريبًا. ومن ثم ، فإن التشذيب يسمح فقط للمحول بأن يكون قد انزلق في بعض المواضع المقابلة للنيوكليوتيدات القليلة الأولى للمحول غير الموجودة في القراءة. يمكن تحديد هذه المعلمة من قبل المستخدم ولكن الافتراضي هو ما يصل إلى اثنين من النيوكليوتيدات ، وهذه المواضع المنزلق لا تضيف إلى عدد حالات عدم التطابق.

عند استخدام AdapterRemoval ، فإنه يقرأ إما ملفًا واحدًا أو ملفين من ملفات FASTQ واعتمادًا على الإعدادات ، تتم كتابة الإخراج إلى عدد من الملفات. في الحالة أحادية النهاية ، يحتوي أحد الملفات على القراءات المقطوعة ، بينما يحتوي ملف آخر على قراءات مهملة (على سبيل المثال ، الطول أو مراقبة الجودة). في حالة النهاية المزدوجة ، تتم كتابة الأزواج المقطوعة في ملفين جديدين يحافظان على ترتيب الأزواج كما هو. إذا تم تجاهل رفيق واحد في الزوج ، تتم كتابة القراءة المتبقية في ملف فردي من أجل الاحتفاظ بأكبر قدر ممكن من البيانات المفيدة. يمكن بعد ذلك التعامل مع هذه القراءات على أنها قراءات أحادية النهاية. تتم كتابة جميع القراءات المهملة في ملف منفصل. يمكن لـ AdapterRemoval العمل مع الملفات المضغوطة باستخدام الأنابيب كما هو موضح في دليل المستخدم ، ويمكن للمستخدم تحديد قاعدة الجودة المستخدمة (إما Phred + 33 (افتراضي) أو Phred + 64) ، ويمكن للمستخدم تحديد الحد الأدنى لطول القراءة بعد القطع (الافتراضي هو 15 نيوكليوتيد).

تم إنشاء مجموعة اختبار محاكاة بناءً على مجموعة بيانات حديثة ذات نهايات مقترنة من يرسينيا بيستيس (انضمام SRA SRX028780). من مجموعة البيانات هذه ، تم استخراج 1،000،000 زوج قراءة مع كل قراءة بطول 75 نيوكليوتيد. لكل زوج ، تم أخذ عينات بطول إدراج محاكى بين 0 و 200 نيوكليوتيد. إذا كان طول الإدخال 150 نيوكليوتيد أو أكثر ، فلن تتداخل القراءات ولا يتم إجراء أي تغييرات على البيانات. إذا كان طول الإدخال بين 149 و 75 نيوكليوتيد ، فإن القرائتين تتداخلان ولكن ليس لدينا تلوث للمحول. في هذه الحالة ، تم أخذ نتيجة لاحقة بناءً على طول الإدخال من القراءة 1 ، مكملة عكسيًا وإدراجها في القراءة 2 ، ثم تم تغيير الجزء الجديد من القراءة 2 بشكل عشوائي بناءً على درجات الجودة لمحاكاة أخطاء القراءة. إذا كان طول الإدخال أقصر من 75 نيوكليوتيدات ، فسيتم نسخ النتيجة التالية للقراءة 1 لقراءة 2 على النحو الوارد أعلاه ، وعلاوة على ذلك تمت إضافة تسلسل المحول إلى كلتا القراءة من محولين مختلفين. أخيرًا ، تم تغيير التسلسلات الجديدة بناءً على درجات الجودة. ينتج عن ذلك 1،000،000 زوج قراءة مع تلوث محول معروف في 373،963 حالة وعدم وجود محول في 626،037 زوجًا المتبقية.

نتائج الإختبار

The performance of AdapterRemoval was tested on the simulated paired-end dataset described above and compared to another program that is able to handle both single-end and paired-end data, Trimmomatic version 0.20[27]. Trimmomatic was run as described on the website but changing the minimum read length to 15 after trimming to make it comparable to AdapterRemoval. For single-end analysis both programs were run on just the first read from each pair. In this test the programs were only used for trimming adapters and no filtering based on Ns or low-quality nucleotides was used.

After trimming, the output from each program was analyzed and five categories of cases were recorded:

How often did the program trim a read that did not contain adapter?

How often did the program trim only the adapter sequence?

How often did the program trim more than the adapter sequence?

How often did the program trim less than the adapter sequence?

How often did the program not trim anything from a read with adapter contamination?

The false positive rate is the sum of cases 1 and 3, i.e. the cases where the program trimmed nucleotides that were not from the adapter (even if the adapter sequence was also removed). The true positive rate is case 2 where only the adapter is removed. The sum of cases 4 and 5 is the false negative rate since, in both cases, the program failed to remove the full adapter sequence. The number of reads containing no adapter and not being trimmed at all is the true negative rate. From these numbers, positive predictive value, sensitivity, specificity and Matthew’s correlation coefficient were calculated for both programs:

The results are summarized in Table2 together with run times and maximum memory usage as reported by the UNIX time command. AdapterRemoval runs slower than Trimmomatic but uses less memory.

Trimmomatic performs equally good on both single-end and paired-end data performing the exact same trimming. It has perfect specificity and positive predictive value at a modest sensitivity, yielding a MCC of 0.48. However, when looking at the results it is clear that in the paired-end case Trimmomatic trims fewer of the reverse reads (86,043 reads are trimmed exactly) thus missing more adapters in those cases (287,920). It is not clear why it does not trim both members of a pair the same. For this test, the best numbers were used in the calculations, and the program was run with all combinations of adapter sequences (both original and reverse-complemented) to make sure that the correct sequences were tested.

In the single-end case, AdapterRemoval shows good performance with lower specificity and positive predictive value than Trimmomatic but also a much higher sensitivity and, hence, MCC of 0.71. AdapterRemoval trims many more adapters correctly but also wrongly trims more reads without adapters.

As expected, all the measures of accuracy go up when using AdapterRemoval on paired-end data compared to single-end data. The extra information available in having two reads that align in case of adapter contamination makes AdapterRemoval much better at removing only true adapter residues from the reads. This is especially clear from the false positive rate that drops by almost a factor 1000. The MCC is increased from 0.71 to 0.94.

As mentioned above, Trimmomatic was run using the the default parameters given on the website and only changing parameters to make it directly comparable to AdapterRemoval. It is likely that Trimmomatic would perform better if the parameters were tweaked which has not been done in this experiment. However, based on this test AdapterRemoval shows good performance on all measures. A test where both programs also trimmed Ns and low-quality nucleotides showed the same overall results as above. Future work on AdapterRemoval should focus on improving the run time and including an option for trimming multiple adapters simultaneously.


نتائج

Sample and patient characteristics

Demographic features of the patients were provided in Table 1. 87 males and 22 females participated in our study, whose average age was 61 years old, average length of stay was 17.5 days and the case fatality rate were 11.9%. Most (37/109, 33.9%) of our samples were from blood, 36 of 109 (33.0%) were from BALF, 12 of 109 (11.0%) were from tissue and 9 (8.3%) of 109 were from sputum, followed by pleural fluid (7, 6.4%), CSF (4, 3.7%), pus (2, 1.8%), bone marrow (1, 0.9%) and nasal swab (1, 0.9%) (Fig. 3a). In the study cohort, 92 (84.4%) patients diagnosed with confirmed pathogens by clinicians were assigned to ID group. The remaining specimens were subdivided into the NID (16/109, 14.7%) and unknown (1/109, 0.9%) groups (Fig. 3b). There were no statistical differences between ID group and NID group in age, gender, length of stay and case fatality rate (ص > 0.05 in all). Most patients were diagnosed with respiratory system infections (73/109, 67.0%), followed by bloodstream infections (10/109, 9.17%), pleural effusion (6/109, 5.50%) and central nervous system infections (6/109, 5.50%) as shown in Fig. 3c.

Patients composition and samples types. أ. In samples of this study, 33.9% were from blood which was the most, 33.0% from BALF, 11.0% from tissue and the others were from sputum (8.3%), pleural fluid (6.4%), CSF (3.7%), pus (1.8%), bone marrow (0.9%) and nasal swab (0.9%). ب. Patients were subdivided into ID (92/109, 84.4%), NID (16/109, 14.7%) and unknown (1/109, 0.9%) groups according to their diagnosis by conventional technique. ج. Infection sites of patients in ID group. Most were respiratory system infections (73/109, 67.0%) and followed by bloodstream infections (10/109, 9.17%), pleural effusion (6/109, 5.50%), central nervous system infections (6/109, 5.50%), cardiovascular system infection (2/109,1.83%), eye, ear, nose, throat, or mouth infection (2/109,1.83%), skin and soft tissue infection (1/109, 0.92%), multifocal infection (1/109, 0.92%), urinary system infection (1/109, 0.92%). Abbreviations: CSF, cerebrospinal fluid BALF, bronchoalveolar lavage fluid

Diagnostic performance comparison of mNGS and culture

Comparison of diagnostic performance for differentiating ID from NID

The cases of mNGS and culture tests in this study were illustrated in Fig. 4a. In the chi-square test of positive rate, there were statistical differences between mNGS and culture of all and of ID group, but no differences in NID and unknown group for the limited amounts. 105 samples were included for further study to compare the diagnostic efficiency for differentiating ID from NID. The positive predictive values and negative predictive values of diagnosing infectious disease by mNGS were 92.3 and 27.5%, respectively. The positive likelihood ratio and negative likelihood ratio being 2.16 and 0.47. The results showed that mNGS increased the sensitivity rate (positive number in ID/ID number) by approximately 44% compared with that of culture (67.4% vs 23.6% ص < 0.001) and decreased the specificity rate (negative number in NID /NID number) by 12.5% compared with that of culture (68.8% vs 81.3% ص = 0.41) (Fig. 4b).

Diagnostic Performance Comparison of mNGS and Culture. أ. Positive and negative cases in all, ID, NID and unknown group of mNGS and the culture, respectively. There were statistical differences between mNGS and culture of all (ص < 0.01) and of ID group (ف & لتر 0.01), but no differences in NID and unknown group for the limited amounts(ص & GT 0.05). ب. Contingency tables showed the sensitivity and specificity of mNGS were 67.4 and 68.8%, while those of culture were 23.6 and 81.3%. mNGS increased the sensitivity in comparison with that of culture (ف & لتر 0.001) while there were no differences in specificity between them (ص = 0.41). ج. Pie chart demonstrated the positivity distribution of mNGS and culture for all samples from 3 groups. 53.21% were positive by mNGS, 4.59% by culture, 19.27% by both and 22.94% were both negative. Abbreviations: NPV, negative predictive values PPV, positive predictive values

Concordance between mNGS and culture for pathogen detection

In this study, mNGS and culture were both positive in 21 of 109 (19.3%) cases and were both negative in 25 of 109 (22.9%) cases. There were 58 cases (53.2%) were positive by mNGS only and 5 (4.6%) were positive only by culture. The 2 results in double-positive cases were completely matched (overlapped of all pathogens) in 3 of 21 and totally mismatched (overlapped of no pathogen) in 3 of 21 (Fig. 4c). The remaining 15 cases were found to at least one but not all overlapped of pathogens in polymicrobial results, which defined as “partly matched”.

“False positives” and “false negatives” of mNGS

In the ID group, three culturable pathogens were missed by mNGS. Among the three “mNGS false-negative” samples, there were 2 culture results paradoxical with clinical diagnosis, the other 1 was completely unidentified by mNGS. At the same time, the possible reasons for the 7 cases of “mNGS false-positive” in the NID group included potential concomitant infection with NIDs (3/7), overinterpretation (3/7) and unknown (1/7) (Table 2).

Comparison of mNGS and culture testing by pathogens and samples

Comparison analysis at the pathogen-type level

Klebsiella (10/69) was the most commonly detected pathogen among the 69 microbes isolated in mNGS and culture testing, followed by bacteria without MTB/NTM (9/69), Aspergillus (6/69), Pseudomonas (6/69) and EBV (6/69) (Fig. 5a). The percentage of mNGS-positive samples observed to have a higher yield rate than that of culture, but the differences were not significant (ص > 0.05) in terms of Klebsiella, bacteria without MTB/NTM, EBV, CMV due to the small sample size. In Acinetobacter baumannii (ن = 2) and MTB (ن = 3), the number of mNGS-positive samples was equally with that of culture-positive samples. While only mNGS indicated positive results in NTM (ن = 4), Anaerobes (n = 4), خميرة الخميرة (n = 2), Proteus (n = 1), Pneumocystis carinii (n = 2), Abiotrophia (n = 1), Nocardia (n = 3), المكورات العنقودية الذهبية (n = 2), Enterococcu (n = 2) and الإشريكية القولونية (n = 1).

The overlap of positivity between mNGS and culture in pathogen and sample types. أ. 19 pathogens detected in ID group with their corresponding frequencies were showed in histograms. Klebsiella, bacteria without MTB/NTM, EBV, CMV, NTM, Anaerobes, Saccharomyces cerevisiae, Proteus, Pneumocystis carinii, Abiotrophia, Nocardia, المكورات العنقودية الذهبية, Enterococcu and الإشريكية القولونية demonstrated a trend of higher positivity rate in mNGS than that in culture with no statistical differences (ص & GT 0.05). Acinetobacter baumannii and MTB were found equally in two groups. ب. The overall sensitivity of mNGS in the different sample types were significantly different (ص = 0.03) while sample types did not affect the sensitivity of pathogens in culture. Interestingly, especially in the types of BALF, blood and sputum samples, mNGS had significantly higher sensitivity than the culture (ص = 0.002 for BALF, ف & لتر 0.001 for blood, ص = 0.037 for sputum). Abbreviations: BALF, bronchoalveolar lavage fluid CSF, cerebrospinal fluid mNGS, metagenomic next-generation sequencing HSV, herpes simplex virus CMV, cytomegalovirus EBV, Epstein-Barr virus MTB, السل الفطري NTM, nontuberculous mycobacteria ns, no significant difference

Comparison analysis at the sample-type level

In the types of BALF, tissue, blood and sputum samples, mNGS detection had significantly higher sensitivity than the culture method (ص = 0.002 for BALF, ص = 0.025 for tissue, ص < 0.001 for blood, ص = 0.018 for sputum), and the overall sensitivity of mNGS in the sample types was significantly different (ص = 0.03). In the types of pleural fluid, CSF, pus, bone marrow and nasal swab, there were no significant differences in sensitivity between two methods (ص & GT 0.05). In addition, in the culture method, the positive rate in BALF was higher than that in the whole blood (ص = 0.019), and there was no difference in the overall sensitivity of the culture method in the sample type, as shown in Fig. 5b.

Comparison of infection indexes in positive and negative group by mNGS in ID

Classification and counting of leukocyte and lymphocyte in positive and negative group by mNGS

In this study, complete blood count, CRP and PCT tests were examined on the day of examination of pathogenic microorganisms to determine the differences in the total number of white blood cells, lymphocytes and neutrophils between the positive group and the negative group by mNGS. The results showed (Table 3) that there were no statistically differences in leukocyte and lymphocyte between positive and negative groups by mNGS (ص & GT 0.05).

Comparison of cytokine concentrations in positive and negative group by mNGS

In order to explore the correlation between the status of immune function in patients and the positive results of pathogen examination, this study detected and analyzed the peripheral blood (TNF-a, IL-2, IL-4, IL-6, IL-8, IL-10, IL-17A and INF-r) in infected patients. The results indicated that the peripheral blood concentrations of IL-10 in the positive group was higher than that in the negative group, and the differences were statistically significant (ص = 0.044), while other cytokine showed no difference between groups as shown in Table 3.

Analysis of correlative factors for positive result of pathogen extraction by mNGS

In order to further explore the related risk factors of positive mNGS test in infected patients, this study used Logistic multivariate regression analysis to analyze the patients’ information and whether the pathogen was detected in the patients. After the confounding factors were removed, the variables that were significant for detection was age (ص = 0.037, OR:1.076, 95% CI:1.005–1.152), which promoted the detection of pathogens (Table 4).

Potential implications of clinical mNGS test

Potential inappropriate antibiotic usage for patients with virus isolates

There were 4 viruses identified by mNGS from 23 patients in this study, the majority of the identified viruses were herpes simplex virus (ن = 15), followed by Epstein-Barr virus/ herpes simplex virus (n = 5), Epstein-Barr virus (n = 1), Hepatitis A virus (n = 1) and torque teno virus (n = 1). Nearly 50% of patients were diagnosed with a hospital-acquired infection (12/23) and 17 of 23 patients were given broad-spectrum antibiotics based on symptoms, imaging. 10 of 23 patients were suspected of inappropriate antibiotic usage, which means after broad-spectrum antibiotic treatment, patients’ symptoms did not improve or even worsened and after identifying the real pathogen through mNGS and adjusting the antibiotic use based on that, patients’ condition improved. 7 of 23 were considered immunocompromised hosts characterized by deficiency of the immune system or immune response caused by infectious factors, mycotoxins, drugs and nutritional deficiencies. (Table 5).

The influence of positive by mNGS on the hospital days and survival of patients

As Table 6 showed, there were 67 samples in positive group with 57 males and 26 in negative group with 20 males. There was no significant difference in mean age between the two groups (59.70 yrs. vs 60.50 yrs., ص = 0.84). Positive group had a longer hospital day (HOD, 176.63 days vs 150.96 days, ص = 0.047) and a higher 28-day mortality (9.0% vs 0%, ص = 0.049) than those of negative group, but there were no statistical differences in 14-day mortality (4.5% vs 0%, ص = 0.278) and 90-day mortality (13.4% vs 3.9%, ص = 0.180) between groups. The average survival time of two groups were 176.64 days and 150.96 days, respectively, but ص value for t test between groups was 0.425, no statistical differences. The survival curves of the two groups were shown in Fig. 6. At the meantime, we analyzed the relationship between pathogens read number and HOD, 14-day-mortality, 28-day-mortality and 90-day-mortality, which showed that the higher pathogens read number, the higher 90-day-mortality and the longer HOD (Table 7).

The survival curves of positive and negative group of mNGS in ID. The survival curves suggested that the overall survival rate declined faster in the positive group, however, there was no statistically differences between the two groups


استنتاج

By utilizing MID tagging, NGS 454 pyrosequencing and bioinformatic recovery, the DNA barcodes of 190 specimens were recovered using 1/8th of a complete 454 pyrosequencing run with greater success as compared to conventional Sanger-based sequencing. Next-generation sequencing devices provide significantly lower cost per base as compared to Sanger sequencing hence, efficient use of MID tagging can result in more cost-effective DNA barcode analysis. Additional sequence information (e.g. heteroplasmy, contamination, Wolbachia) gained from parallel sequencing of each specimen, through NGS, is a unique feature that cannot be feasibly achieved through Sanger sequencing. The error rate of 454 pyrosequencing requires the exclusion, through bioinformatic filters, of a large number of the sequences produced. While base substitution is a rare occurrence, the most common pyrosequencing error in sequencing by synthesis with multiple nucleotide incorporation is the over or under base calling especially in homopolymeric regions (Margulies وآخرون. 2005 ). Several bioinformatic solutions are available to deal with such sequencing artefacts (e.g. Gilles وآخرون. 2011 ). For example, screening for nucleotides with low Phred scores within homopolymeric regions and using the amino acid reading frame in protein-coding markers can further overcome the negative impact of this issue (Shokralla وآخرون. 2011 ). Moreover, increased sequencing read length and depth can statistically alleviate the effect of the base calling errors. Both of these factors can contribute to a higher probability of obtaining high-quality sequences in the output sequences generated. In this respect, newer versions of 454 pyrosequencing or other NGS platforms have improved their sequencing output to decrease the probability of sequencing errors (Taberlet وآخرون. 2012 ).

The total number of sequences produced limits the number of specimens that can be included in a run if sufficient sequencing depth is to be maintained. A decreased error rate and increased sequencing throughput will further amplify the rate at which DNA barcodes can be produced with NGS technology. Our study provides a new example of the application of NGS in a realistic high-throughput DNA barcoding scenario and sets the stage for further use of NGS devices in routine single specimen DNA barcoding. Although we have tested our approach on a Roche-454 FLX model, the technique is not platform-specific and can be applied to other available NGS platforms. For example, desktop NGS devices (e.g. Illumina MiSeq, Roche-454 Junior, Ion Torrent PGM) are now feasible options for any laboratory (Table 1). However, prior to NGS-based DNA barcoding efforts, MID tags must be tested for different NGS platforms according to the specific chemistry and the sequencing errors associated with each.

454 GS FLX + 454 Junior Illumina HiSeq Illumina MiSeq Ion Torrent PGM Sanger ABI 3730xl
الأعلى. read length 700 bp 400 bp 2 × 150 bp 2 × 300 bp 400 bp 1–1.5 kb
الأعلى. output/run 450–700 Mb 35 Mb 150–180 Gb 13.2–15 Gb 1.2–2 Gb 96 Kb
الأعلى. reads/run 700 k–1 M S-R 70 K S-R 1.2 Billion PE-R 44–50 M PE-R 4–5.5 M S-R 96 S-R
Time per run 23 h 10 h 40 h 65 h 7.3 h 4 h
  • S-R, single reads PE-R, paired-end reads Information in this table was obtained from manufacturers' web pages accessed on 7 January 2014.

The number of specimens to be multiplexed in a single experiment depends on at least four factors: (i) the number of MID tags compatible with the adaptor sequences of each platform (ii) the possibility of sequencing the same MID tags in physically separated lanes of a single run (iii) the number of generated sequences per run and (iv) the required sequence depth needed per specimen. A single NGS device can be used for a wide range of applications from genome and transcriptome sequencing to environmental metagenomics and DNA metasystematics (Hajibabaei وآخرون. 2012 Shokralla وآخرون. 2012 Taberlet وآخرون. 2012 ). Here, we demonstrate the feasibility of NGS for single specimen DNA barcoding for library preparation or specimen identification. The application of NGS in specimen barcoding, however, should require standardized and rigorous platform-specific quality control steps to ensure the highest-quality DNA barcodes. When millions of DNA strands can be sequenced in parallel and many hundreds can be assigned to each component target amplicon, there is no need to generate a single DNA sequence.


This article is in the 15 th percentile (ranked 284,755 th ) of the 384,483 tracked articles of a similar age in all journals and the 17 th percentile (ranked 28 th ) of the 39 tracked articles of a similar age in مجلة الإنجاب المساعد وعلم الوراثة

Altmetric calculates a score based on the online attention an article receives. Each coloured thread in the circle represents a different type of online attention. The number in the centre is the Altmetric score. Social media and mainstream news media are the main sources that calculate the score. Reference managers such as Mendeley are also tracked but do not contribute to the score. Older articles often score higher because they have had more time to get noticed. To account for this, Altmetric has included the context data for other articles of a similar age.


شاهد الفيديو: Les 6 - Volgorde der bewerkingen (ديسمبر 2022).