معلومة

ما هو الفرق بين الجيل الثاني والثالث التسلسل

ما هو الفرق بين الجيل الثاني والثالث التسلسل


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أكتب قسمًا عن تاريخ تسلسل الحمض النووي في مقدمة الفصل وبعد قراءة عدد غير قليل من الأوراق البحثية ، ما زلت في حيرة من أمري بشأنها. أقوم هنا بتجميع بعض الأسئلة للتأكد من فهمي لها بشكل صحيح.

  1. هل تسلسل الجيل الثاني هو نفسه تسلسل الجيل التالي؟
  2. هل سانجر تسلسل الجيل الأول؟
  3. اعتبارًا من اليوم ، هل هناك أي تقنية تجارية من الجيل الثالث للتسلسل قيد الاستخدام (أم أنها لا تزال قيد التطوير)؟

إذا كان هناك أي مرجع ورقي يمكن أن يشرح كل ما سبق ، فسيكون رائعًا حقًا.


أفترض أنك تقصد تسلسل الحمض النووي (باستثناء أشياء مثل تسلسل الحمض النووي الريبي).

هل سانجر تسلسل الجيل الأول؟

من Metzker 2010:

تعتبر طريقة سانجر الأوتوماتيكية بمثابة تقنية "الجيل الأول"

بعض التقنيات التي كانت قيد التطوير عندما تمت كتابة هذه المراجعة لم تعد قيد التطوير ، ولكن هذا لا يزال مراجعة ممتازة ومكانًا رائعًا للبدء.

هل تسلسل الجيل الثاني هو نفسه تسلسل الجيل التالي؟

أيضا من Metzker 2010:

والطرق الأحدث يشار إليها باسم تسلسل الجيل التالي (NGS).

"الطرق الأحدث" في المراجعة هي:

  • مستحلب PCR يعتمد على Roche / 454
  • تضخيم المرحلة الصلبة مثل Illumina / Solexa
  • جزيء واحد مثل Helicos BioSciences و Pacific Biosciences

اعتبارًا من اليوم ، هل هناك أي تقنية تجارية من الجيل الثالث للتسلسل قيد الاستخدام (أم أنها لا تزال قيد التطوير)؟

لقد استغرق تطوير طرق الجزيء الفردي (العنصر الثالث في القائمة أعلاه) وقتًا أطول من النوعين الآخرين ، لذلك يشار إليها أحيانًا بالجيل الثالث. ومع ذلك ، لاحظ كيف يعتبرها Metzker أعلاه "الجيل التالي".

ورقة حديثة من PacBio نفسها تميز التوقف:

تسلسل الجيل الثاني (SGS): تسلسل مجموعة جزيئات الحمض النووي باستخدام تقنيات الغسيل والمسح الضوئي.

تسلسل الجيل الثالث (TGS): تسلسل جزيئات الحمض النووي المفردة دون الحاجة إلى التوقف بين خطوات القراءة (سواء كانت إنزيمية أو غير ذلك).

في النهاية ، أعتقد أن "الأجيال" أكثر فائدة في التمييز بين "سانجر مقابل لا سانجر". يختلف تسلسل Sanger تمامًا عن الجيل التالي من حيث نوع التجربة التي يمكنك القيام بها ونوع البيانات التي تحصل عليها.

بعد ذلك ، كان عدد جيل أكثر من مصطلح تسويقي. على سبيل المثال ، في الجزء السفلي من ورقة PacBio:

بيان تضارب المصالح. جميع المؤلفين هم موظفون في Pacific Biosciences ويملكون أسهمًا في الشركة.

من الناحية العملية ، يتنافس PacBio مع منصات الجيل الثاني. من مصلحتهم القول إن تقنيتهم ​​على "مستوى آخر" مقارنة بما هو متاح في السوق ، ولكن من الناحية العملية ، هذا أمر قابل للنقاش.

على كل حال للإجابة على سؤالك:

  • هناك تقنية قيد الاستخدام ومتاحة تجاريًا يشار إليها بالجيل الثالث (PacBio)
  • كانت هناك تقنية قيد التطوير تندرج تحت معظم تعريفات الجيل الثالث (Helicos) ، والتي أفلست في عام 2012
  • هناك تقنية قيد التطوير (ON MinION) تعتمد على جزيء واحد وتم تقديمها بعد PacBio ، لذلك إذا كان PacBio هو الأجيال الثالثة ، كذلك MinION (على الرغم من أن MinION يبدو مختلفًا تمامًا عن PacBio)

دليل Lentiviral

لزيادة أمان الفيروس البطيء ، يتم تقسيم المكونات الضرورية لإنتاج الفيروس عبر بلازميدات متعددة (3 لأنظمة الجيل الثاني ، و 4 لأنظمة الجيل الثالث). مكونات كلا النظامين هي كما يلي:

  • ترميز بلازميد نقل الفيروسة البطيئة إدراج اهتمامك. يُحاط تسلسل الجينات المحورة بتسلسلات التكرار الطرفي الطويلة (LTR) ، والتي تسهل تكامل تسلسل بلازميد النقل في جينوم المضيف. عادةً ما تكون التسلسلات بين وتضمين LTRs المدمجة في جينوم المضيف عند النقل الفيروسي. تعتمد العديد من بلازميدات النقل الفيروسي على فيروس HIV-1. لأسباب تتعلق بالسلامة ، تعتبر جميع بلازميدات النقل غير كفؤة وقد تحتوي على حذف إضافي في 3'LTR ، مما يجعل الفيروس "غير نشط ذاتيًا" (SIN) بعد التكامل.
  • بلازميد التعبئة والتغليف
  • مغلف البلازميد

عبوات Addgene ومغلف البلازميدات معممة ومناسبة لأنواع وأنظمة الخلايا المتنوعة. عند التخطيط لتجربتك ، فإن العنصر المهم الذي يجب مراعاته وتحسينه هو نقل البلازميد. يستخدم الجيل الثاني من بلازميدات الفيروسة البطيئة محفز LTR الفيروسي للتعبير الجيني ، بينما تستخدم بلازميدات النقل من الجيل الثالث محفز LTR هجينًا (مزيد من المعلومات حول هذا أدناه). يمكن أيضًا تضمين معززات إضافية أو متخصصة في بلازميد النقل: على سبيل المثال ، يتم تضمين مروج U6 في بلازميد pSico لدفع تعبير shRNA. تشمل الميزات الأخرى التي يمكن تضمينها في بلازميدات النقل: التنظيم القائم على Tet- أو Cre والاندماج الفلوري أو المراسلين.
تصفح بلازميدات الفيروسة البطيئة المتاحة من Addgene.


خلفية

لقد غيرت تقنيات تسلسل الجيل التالي (NGS) البحوث الجينومية بشكل كبير. تولد أدوات NGS ، أو ما يسمى بمسلسلات الجيل الثاني ، كميات كبيرة من البيانات مقارنةً بمسلسلات Sanger التقليدية. قبل عام 2010 ، على الرغم من أن تكلفة قراءة الجينوم بأكمله كانت تتناقص بسرعة ، إلا أن استخدام تقنيات NGS كان لا يزال مقصورًا على مراكز تسلسل الجينوم الكبيرة بسبب الصعوبات التقنية واللوجستية المرتبطة بتشغيل الأدوات ومتطلبات أجهزة الكمبيوتر وتحليل البيانات. أدى ظهور أجهزة التسلسل الفوقية إلى تسريع جهود التسلسل في المراكز والمختبرات الصغيرة. على سبيل المثال ، يستخدم جهاز 454 GS Junior (GS Jr) ، الذي أصدرته شركة Roche في أوائل عام 2010 كأول جهاز تسلسل على الطاولة ، نفس تقنية PCR للمستحلب [1] مثل Roche GS FLX. يستخدم جهاز التسلسل الفوقي لـ Life Technologies Ion PGM (Ion PGM) ، الذي تم إطلاقه في بداية عام 2011 ، تقنية أشباه الموصلات [2]. أصبح جهاز التسلسل المنضدي Illumina MiSeq (MiSeq) متاحًا في نهاية عام 2011 ويستخدم نفس تقنية التسلسل بالتوليف [3 ، 4] مثل متواليات Illumina GAII و HiSeq. مع الظهور السنوي لأدوات NGS الجديدة ، تتطلب الإجراءات التجريبية مثل إعداد المكتبة وطرق التحليل التحسين المستمر.

تنتج أجهزة التسلسل من الجيل الثاني كميات هائلة من القراءات القصيرة ، والتي تختلف في الإنتاجية والطول عن القراءات التي تنتجها أجهزة التسلسل Sanger. لتجميع كميات هائلة من القراءات القصيرة ، ازدهر نوع جديد من الخوارزميات باستخدام الرسوم البيانية لـ de Bruijn ، كما يتضح من سلسلة من مجمعات الجينوم بما في ذلك ABySS [5] و ALLPATHS-LG [6] و Velvet [7 و 8] و SOAPdenovo [9]. على الرغم من أن هذه الخوارزميات [5-9] قد تم تطويرها لإنتاج جينومات عالية الجودة من الدرجة النهائية ، إلا أنه لا يزال يمثل تحديًا لتجميع contigs الطويل الذي يمتد على جينوم بأكمله. أحد العوامل المهمة في الحصول على الجينوم النهائي بنجاح هو حل المناطق المتكررة المنتشرة عبر الجينوم. من الصعب إعادة بناء مناطق متكررة طويلة من خلال تجميع قراءات أقصر من المناطق المتكررة. تم استخدام النهايات المزدوجة وأزواج الشريك لمعالجة هذه المشكلة. حسنت أزواج Mate طول السقالة ، لكن النتائج باستخدام تجميع زوج الشريك كانت عادةً بعيدة عن الدرجة النهائية [10 ، 11].

لمعالجة هذه المشكلة ، قد توفر القراءة الأطول من المناطق المتكررة حلاً لمشكلة التجميع. يولد نظام تسلسل RS (PacBio) من الجيل الثالث الذي تم إطلاقه مؤخرًا (PacBio) قراءات طويلة بمتوسط ​​طول 4.5 كيلو بايت مع أخطاء تسلسلية موزعة عشوائيًا. تتطلب هذه التقنية التطورية خوارزمية جديدة لمعالجة تسلسل القراءات بسبب الطبيعة المختلفة لقراءاتها ، والتي تبلغ دقتها على مستوى النوكليوتيدات 85٪ فقط [12]. لذلك ، تقوم عدة خوارزميات أولاً بتصحيح أخطاء التسلسل في القراءات ثم تجميع القراءات المصححة للأخطاء [13-15]. يتمتع PacBio بميزة توليد قراءات طويلة ولكن بمعدل نقل أقل من الجيل الثاني من أجهزة التسلسل. تتمثل إحدى عيوب PacBio في أن التثبيت الأولي أغلى من التثبيت الخاص بأجهزة التسلسل من الجيل الثاني (ملف إضافي 1: الجدول S1). قد يكون الجمع بين بيانات التسلسل من الجيل الثاني والجيل الثالث خيارًا [13 ، 16] ومع ذلك ، فإن هذه الطرق الهجينة توفر كفاءة محدودة لأنها تتطلب المزيد من تكاليف العمالة والمواد الاستهلاكية لإعداد مكتبة إضافي.

بالنظر إلى أن أدوات وبرامج التسلسل المختلفة متاحة لتسلسل الجينوم وتتطور ، فإن اختيار أفضل واحد أو أفضل مجموعة أمر صعب. تم نشر مقارنات أداء أدوات NGS ، بما في ذلك جهاز التسلسل من الجيل الثالث ، [17-21] ومع ذلك ، بالنظر إلى التحسين السريع لتقنيات NGS ، تعتبر المقارنات المتكررة ذات قيمة لاختيار النظام الأساسي الذي يوفر أفضل النتائج. لذلك ، أجرينا دراسة مقارنة محدثة لمسلسلات الجيل الثاني والثالث باستخدام الجينوم البكتيري لـ فيبرايو بارايموليتيكوس، تتكون من اثنين من الكروموسومات. بسبب وجود اثنين من الكروموسومات مع عدد نسخ أعلى من أوبرات الرنا الريباسي مما هو موجود في البكتيريا الأخرى ، كان من الصعب إنهاء تسلسل الجينوم [21]. في هذه الدراسة ، أظهرنا إعادة بناء V. parhaemolyticus الجينوم باستخدام أجهزة التسلسل الحالية.


الاستخدامات المحتملة لـ NGS في الممارسة السريرية

علم الوراثة السريرية

هناك العديد من الفرص لاستخدام NGS في الممارسة السريرية لتحسين رعاية المرضى ، بما في ذلك:

NGS تلتقط طيفًا أوسع من الطفرات من تسلسل سانجر

يشتمل طيف تباين الحمض النووي في الجينوم البشري على تغييرات أساسية صغيرة (بدائل) ، وإدخال وحذف الحمض النووي ، وحذف جيني كبير للإكسونات أو جينات كاملة وإعادة ترتيب مثل الانقلابات والانتقالات. يقتصر تسلسل سانجر التقليدي على اكتشاف البدائل وعمليات الإدراج والحذف الصغيرة. بالنسبة للطفرات المتبقية ، يتم إجراء فحوصات مخصصة بشكل متكرر ، مثل التألق في التهجين الموضعي (FISH) من أجل التنميط النووي التقليدي ، أو المصفوفات الدقيقة للتهجين الجيني المقارن (CGH) للكشف عن تغيرات عدد النسخ الصبغية دون المجهرية مثل الحذف الدقيق. ومع ذلك ، يمكن أيضًا اشتقاق هذه البيانات من بيانات تسلسل NGS مباشرة ، مما يغني عن الحاجة إلى فحوصات مخصصة أثناء حصاد الطيف الكامل للتباين الجيني في تجربة واحدة. تكمن القيود الوحيدة في المناطق التي تتسلسل بشكل سيئ أو خريطة خاطئة بسبب محتوى الجوانين / السيتوزين الشديد (GC) أو تكرار الهندسة ، على سبيل المثال ، التوسعات المتكررة الكامنة وراء متلازمة X الهش ، أو مرض هنتنغتون.

يمكن استجواب الجينوم دون تحيز

يعتمد التسلسل الشعري على المعرفة المسبقة للجين أو الموقع قيد التحقيق. ومع ذلك ، فإن NGS غير انتقائية تمامًا وتستخدم لاستجواب الجينوم الكامل أو الإكسومات لاكتشاف طفرات جديدة تمامًا وجينات مسببة للأمراض. في طب الأطفال ، يمكن استغلال ذلك لكشف الأساس الجيني لمتلازمات غير مبررة. على سبيل المثال ، يهدف مشروع على الصعيد الوطني ، فك رموز اضطرابات النمو ، 1 الذي يعمل في معهد ويلكوم ترست سانجر بالتعاون مع خدمات علم الوراثة الإكلينيكية NHS إلى الكشف عن الأساس الجيني لتأخر النمو غير المبرر من خلال تسلسل الأطفال المتأثرين وأولياء أمورهم للكشف عن متغيرات دي نوفو الضارة. لقد نجح ربط هذه البيانات الجزيئية بمعلومات النمط الظاهري السريرية في تحديد الجينات الجديدة التي تحورت لدى الأطفال المصابين بسمات إكلينيكية مماثلة.

تسمح الحساسية المتزايدة لـ NGS باكتشاف طفرات الفسيفساء

يتم الحصول على طفرات الفسيفساء كحدث ما بعد الإخصاب وبالتالي تظهر بتردد متغير داخل الخلايا والأنسجة للفرد. قد يغيب التسلسل الشعري عن هذه المتغيرات لأنها تظهر في كثير من الأحيان بدقة تقل عن حساسية التكنولوجيا. يوفر تسلسل NGS قراءة أكثر حساسية وبالتالي يمكن استخدامه لتحديد المتغيرات الموجودة في نسبة قليلة فقط من الخلايا ، بما في ذلك تباين الفسيفساء. بالإضافة إلى ذلك ، يمكن زيادة حساسية تسلسل NGS ، ببساطة عن طريق زيادة عمق التسلسل. وقد أدى ذلك إلى استخدام NGS لإجراء تحقيقات حساسة للغاية مثل استجواب الحمض النووي للجنين من دم الأم 2 أو تتبع مستويات الخلايا السرطانية من الدورة الدموية لمرضى السرطان. 3


طريقة تسلسل سانجر

تعتمد طريقة تسلسل سانجر على ديوكسينيوكليوتيدات (ddNTPs) ، وهو نوع من ديوكسينوكليوزيد ثلاثي الفوسفات (dNTPs) ، الذي يفتقر إلى مجموعة هيدروكسيل 3 & # 8242 ولها ذرة هيدروجين بدلاً من ذلك. عندما ترتبط هذه القواعد بتسلسل الحمض النووي المتنامي ، فإنها تنهي التكرار لأنها لا تستطيع ربط القواعد الأخرى. لإجراء تسلسل Sanger ، أضف البادئات إلى محلول يحتوي على المعلومات الجينية المراد ترتيب تسلسلها ، ثم قسم المحلول إلى أربعة تفاعلات PCR. يحتوي كل تفاعل على مزيج مع dNTP مع أحد النيوكليوتيدات الأربعة المستبدلة بمجموعات ddNTP (مجموعات A و T و G و C ddNTP). في نهاية PCR ، ستنتج كل تفاعل من تفاعلاتك الأربعة منتجات PCR بأطوال مختلفة لأن النسخ المتماثل يتم إنهاؤه عشوائيًا. من خلال تشغيل العينات على هلام ذي 4 ممرات ، يمكنك تجميع التسلسل معًا حيث تم نسخ كل تسلسل من نفس المادة الأصلية. فيما يلي مثال حيث تكون ddNTPs بالخط العريض و dNTPs ليست كذلك:

تسلسلك هو ATGCTCAG.

تعطيك ردود أفعالك الأربعة:
رد فعل مع ddATP: أ، ATGCTCأ، ATGCTCAG
التفاعل مع ddGTP: ATجي، ATGCTCAجي
التفاعل مع ddCTP: ATGج، ATGCTج، ATGCTCAG
التفاعل مع ddTTP:تي، ATGCتي ، ATGCTCAG

ستبدو جميع ردود الفعل التي تم إجراؤها مرة واحدة على مادة هلامية مثل هذا (صورة Olwen Reina):

يشير كل نطاق إلى رمز الأطوال المختلفة. على سبيل المثال ، الشريط هو اليمين تحت “A” يرمز إلى التسلسل: “ATGCTCأ

لنتخيل لعبة جماعية. اللعبة عبارة عن لعبة تخمين. هنا كيف يتم لعبها:

أنت تفكر في رقم وعلي المجموعة تخمينه. الجزء الصعب هو أن العدد يتكون من 200 رقم في الطول. أنت تقرأ أرقام الرقم في رأسك دون إصدار صوت. في كثير من الأحيان يقاطعك شخص ما ، وتخبرهم بالرقم الفردي الذي كنت تفكر فيه للتو ومكانه في تسلسل 200. في كل مرة تتم مقاطعتك ، عليك أن تبدأ من جديد. تغادر بعد بضع ساعات ويتعين على المجموعة معرفة الرقم المكون من 200 رقم. يجب عليهم تجميع المعلومات التي قدمتها لهم ، على سبيل المثال ، كان الرقم 25 هو 5 ، والرقم 40 كان 0 ، وهكذا. باستخدام المعلومات من مقاطعاتهم ، يمكنهم تكرار الرقم الذي قدموه لك.

في حين أن هذه تبدو وكأنها أعرج لعبة في العالم ، إلا أنها تعمل بشكل جيد للغاية للتسلسل!

لسوء الحظ ، فهي بطيئة ومكلفة وتعتمد (سابقًا) على المواد المشعة. دفع هذا العلماء إلى تطوير أشكال جديدة وأفضل لتسلسل الجينوم.


تحديات تسلسل الجيل التالي

على مدى السنوات العشر الماضية ، نما تسلسل الجيل التالي (NGS) بسرعة فائقة. لقد ارتفعت النواتج ، وانخفضت التكاليف — على حد سواء من حيث الحجم. الرسم البياني للمعاهد الوطنية للصحة الذي يوضح هذا التقدم مبالغ فيه لدرجة أن فائدته الرئيسية الآن هي مساعدة الحاضرين الذين يشعرون بالملل في المؤتمر على ملء بطاقات "buzzword bingo" الخاصة بهم.

مع وجود أكثر من 10000 أداة مثبتة في جميع أنحاء العالم ، فإننا نواجه مفارقة: الجيل الحالي والجيل القادم هما نفس الشيء. "التالي" ، في سياق التسلسل ، فقد معناه بالكامل تقريبًا. قد نقبل أيضًا أن "تسلسل الجيل التالي" أصبح الآن مجرد "تسلسل".

أمضت شركات المنصات الكبرى العامين الماضيين في التركيز على تحسين سهولة الاستخدام. تعمل أنظمة سطح المكتب الأحدث من Illumina ، مثل NextSeq و MiSeq و MiniSeq ، جميعها من خلال استخدام خراطيش الكاشف ، مما يقلل من عدد عمليات التلاعب ووقت "التدريب العملي".

كانت منصات Ion Torrent من Thermo Fisher Scientific تاريخيًا أكثر صعوبة في الاستخدام من منصات Illumina. ومع ذلك ، فقد تم تصميم أحدث أنظمة Thermo ، وهو Ion S5 ، خصيصًا لتبسيط سير العمل بالكامل ، بدءًا من إعداد المكتبة وحتى إنشاء البيانات.

بعد سماع التحسينات العديدة للتسلسل - إنتاج أكبر وتكاليف أقل وسهولة أفضل في الاستخدام - قد يتخيل المراقب العرضي أن كل العمل الشاق قد تم إنجازه وأن جميع العوائق التي تحول دون التقدم قد أزيلت. لكن العمل الشاق قد بدأ للتو ، ولا تزال هناك تحديات كثيرة.

غالبًا ما يكون أحد المجالات الأولى التي يمكن أن تتسلل فيها المشكلات هو أكثر المجالات إغفالًا - جودة العينة. على الرغم من أن المنصات غالبًا ما يتم اختبارها ومقارنتها باستخدام عينات منسقة للغاية (مثل المواد المرجعية من Genome in a Bottle Consortium) ، غالبًا ما تمثل عينات العالم الحقيقي تحديًا أكبر بكثير.

بالنسبة للتسلسل البشري ، فإن أحد أكثر أنواع العينات شيوعًا هو FFPE (مضمّن ببارافين ثابت بالفورمالين). تحظى FFPE بشعبية لمجموعة متنوعة من الأسباب ، ليس أقلها الوفرة المطلقة لعينات FFPE. وفقًا لبعض التقديرات ، تم أرشفة أكثر من مليار عينة FFPE حول العالم. سيستمر هذا العدد في النمو الآن بعد أن أصبح تخزين العينات السريرية في كتل FFPE ممارسة قياسية على مستوى الصناعة.

إلى جانب كونها متاحة على نطاق واسع ، غالبًا ما تحتوي عينات FFPE على معلومات نمطية مفيدة بشكل لا يصدق. على سبيل المثال ، غالبًا ما ترتبط عينات FFPE بالعلاج الطبي وبيانات النتائج السريرية.

تكمن مشكلة عينات FFPE في أن كلاً من عملية التثبيت وظروف التخزين يمكن أن تسبب تلفًا واسعًا في الحمض النووي. "عند تقييم أكثر من 1000 عينة على منصة مراقبة الجودة في BioCule ، رأينا تنوعًا هائلاً في مقدار وأنواع الضرر في عينة الحمض النووي ، مثل الروابط المتقاطعة بين وداخل الخيوط ، وتراكم الحمض النووي أحادي الجديلة ، وفواصل الحمض النووي أحادية السلسلة ، "يقول هانز ج. ثورمار ، دكتوراه ، المؤسس المشارك والرئيس التنفيذي لشركة BioCule.

يمكن أن تؤثر كميات وأنواع الضرر المتغيرة ، في حالة تجاهلها ، سلبًا على النتائج النهائية. "يمكن أن يكون التأثير على التطبيقات النهائية مثل التسلسل عميقاً: من فشل المكتبات البسيطة إلى المكتبات التي تنتج بيانات زائفة ، مما يؤدي إلى سوء تفسير النتائج" ، يتابع الدكتور ثورمار. لذلك ، من الأهمية بمكان إجراء تقييم صحيح لجودة كل عينة في بداية مشروع التسلسل.


في عمليات سير عمل التسلسل من الجيل التالي ، يمكن أن تؤدي العينات ذات الجودة المنخفضة أو المتغيرة إلى إتلاف العمليات النهائية مثل إعداد المكتبة والتحليل المربك في نهاية المطاف. يجب تقييم العينات للروابط المتشابكة ، والكسر ، وتراكم الحمض النووي أحادي الجديلة ، والأشكال الأخرى من الضرر.

مكتبة الاعدادية

على الرغم من أن شركات منصات التسلسل الرئيسية قد أمضت سنوات في خفض تكلفة إنشاء التسلسل الأولي ، إلا أن الأمر نفسه لم يكن صحيحًا بالنسبة لإعداد المكتبات. لا يزال إعداد المكتبة لتسلسل الجينوم البشري بالكامل ، بحوالي 50 دولارًا لكل عينة ، جزءًا بسيطًا نسبيًا من التكلفة الإجمالية. ولكن بالنسبة للتطبيقات الأخرى ، مثل تسلسل الجينوم البكتيري أو تسلسل الحمض النووي الريبي منخفض العمق (RNA-seq) ، يمكن أن تمثل غالبية التكلفة.

تعمل العديد من المجموعات على حلول البيرة المنزلية متعددة الإرسال لخفض التكاليف الفعالة ، ولكن لم تكن هناك العديد من التطورات على الصعيد التجاري. تتمثل إحدى النقاط المضيئة في تطوير حلول التسلسل أحادية الخلية ، مثل نظام Chromium ™ من 10X Genomics ، والذي يستخدم نظامًا قائمًا على حبة لمعالجة مئات إلى آلاف العينات على التوازي.

يصر سيرج ساكسونوف ، دكتوراه ، المؤسس المشارك والرئيس التنفيذي لشركة 10X Genomics: "نحن نرى تسلسل الحمض النووي الريبي أحادي الخلية هو الطريقة الصحيحة للقيام بتحليل التعبير الجيني". "على مدى السنوات العديدة القادمة ، سينتقل الكثير من العالم إلى تحليل الخلية الواحدة لتجارب الحمض النووي الريبي ، ونحن متحمسون لمنصتنا لقيادة الطريق إلى هناك." بالنسبة للمشروعات الكبيرة ، مثل تلك المطلوبة لـ RNA-seq أحادية الخلية ، ستكون الحلول متعددة الإرسال بالغة الأهمية في الحفاظ على تكاليف كل عينة منخفضة بشكل معقول.

قراءات قصيرة مقابل قراءات طويلة

تعني هيمنة Illumina على سوق التسلسل أن الغالبية العظمى من البيانات التي تم إنشاؤها حتى الآن تستند إلى قراءات قصيرة. يعد الحصول على عدد كبير من القراءات القصيرة مناسبًا لعدد من التطبيقات ، مثل اكتشاف تعدد أشكال النوكليوتيدات المفردة في الحمض النووي الجيني وعد نسخ الحمض النووي الريبي. ومع ذلك ، فإن القراءات القصيرة وحدها غير كافية في عدد من التطبيقات ، مثل القراءة من خلال مناطق شديدة التكرار من الجينوم وتحديد الهياكل بعيدة المدى.

منصات القراءة الطويلة ، مثل RSII و Sequel من Pacific Biosciences و MinION من Oxford Nanopore Technologies ، قادرة بشكل روتيني على إنشاء قراءات في نطاق 15-20 كيلو بايت (kb) ، مع الإبلاغ عن قراءات فردية تزيد عن 100 كيلو بايت. حظيت مثل هذه المنصات باحترام العلماء مثل تشارلز جاسر ، دكتوراه ، أستاذ البيولوجيا الجزيئية والخلوية في جامعة كاليفورنيا ، ديفيس.

يعلق الدكتور جاسر قائلاً: "إنني معجب بالنجاح الذي حققه الأشخاص في استخدام طرق القراءة الطويلة لتجميع جينوم de novo ، خاصة في التجميعات الهجينة عند دمجها مع بيانات عالية الدقة قصيرة القراءة". "هذا المزيج من التقنيات يجعل من الممكن لمحقق واحد مع مجموعة صغيرة جدًا وميزانية ضئيلة لإنتاج مجموعة قابلة للاستخدام من جينوم كائن حي جديد."

لتحقيق أقصى استفادة من هذه المنصات طويلة القراءة ، من الضروري استخدام طرق جديدة لإعداد عينات الحمض النووي. لم يتم تحسين طرق البيولوجيا الجزيئية القياسية لعزل شظايا الحمض النووي الطويلة جدًا ، لذلك يجب توخي الحذر عند إعداد مكتبات قراءة طويلة.

على سبيل المثال ، قام البائعون بإنشاء مجموعات خاصة من "الوزن الجزيئي العالي" لعزل شظايا الحمض النووي & gt100 كيلو بايت ، وتم تعديل بروتوكولات الحمض النووي المستهدفة لإثراء الأجزاء الكبيرة من الحمض النووي بشكل انتقائي. يجب إتقان هذه الأساليب والتقنيات الجديدة لضمان أقصى قدر من القراءة الطويلة.

كبديل للقراءات الطويلة الحقيقية ، يتجه البعض إلى شكل متخصص من القراءات القصيرة يسمى القراءات المرتبطة ، مثل تلك الموجودة في 10X Genomics. يتم إنشاء القراءات المرتبطة عن طريق إضافة رمز شريطي فريد لكل قراءة قصيرة يتم إنشاؤها من جزء DNA طويل واحد ، والذي يبلغ بشكل عام & gt100 كيلو بايت. تُستخدم الرموز الشريطية الفريدة لربط القراءات الفردية القصيرة معًا أثناء عملية التحليل. يوفر هذا معلومات جينومية بعيدة المدى ، مما يتيح بناء كتل كبيرة من النمط الفرداني وتوضيح المعلومات الهيكلية المعقدة.

"تسلسل القراءة القصيرة ، على الرغم من قوته الهائلة بسبب الدقة العالية والإنتاجية ، لا يمكنه الوصول إلا إلى جزء بسيط من المحتوى الجيني" ، كما ينصح الدكتور ساكسونوف. "هذا لأن الجينومات متكررة إلى حد كبير وكثير من المعلومات في الجينوم مشفرة على نطاقات طويلة."


يمكن إدارة بعض تطبيقات التسلسل ، مثل اكتشاف تعدد أشكال النوكليوتيدات المفردة ، باستخدام تقنية القراءة القصيرة. قد تتطلب التطبيقات الأخرى ، مثل اكتشاف المتغيرات الهيكلية ، تقنية قراءة طويلة ، وقد تتطلب بعض التطبيقات ، مثل تجميع جينوم كائن حي جديد ، نهجًا مشتركًا ، مع قراءات قصيرة توفر الدقة والإنتاجية العالية ، حيثما أمكن ذلك ، وقراءات طويلة تتعامل مع المناطق الجينومية شديدة التكرار. [ktsimage / جيتي إيماجيس]

تحليل البيانات

التحدي الآخر الذي يواجه الباحثين هو الكم الهائل من البيانات التي يتم إنشاؤها. يبلغ حجم ملف BAM (ملف محاذاة نصف مضغوط) لعينة واحدة من الجينوم البشري بالكامل 30X حوالي 90 جيجابايت. مشروع متواضع نسبيًا من 100 عينة سيولد 9 تيرابايت من ملفات BAM.

مع جهاز Illumina HiSeq X واحد قادر على توليد أكثر من 130 تيرابايت من البيانات سنويًا ، يمكن أن يصبح التخزين مصدر قلق سريعًا. على سبيل المثال ، يقوم معهد Broad بإنتاج بيانات التسلسل بمعدل جينوم واحد 30X كل 12 دقيقة - ما يقرب من 4000 تيرابايت من ملفات BAM كل عام.

يمكن تحويل ملفات BAM إلى ملفات VCF (تنسيق استدعاء متغير) ، والتي تحتوي على معلومات فقط عن تلك القواعد التي تختلف عن التسلسل المرجعي. على الرغم من أن ملفات VCF أصغر بكثير وأسهل في العمل معها ، إلا أنه لا يزال من الضروري الاحتفاظ بملفات التسلسل الأولية إذا كان الباحث سيعيد معالجة البيانات في المستقبل.

مع انخفاض تكلفة التسلسل ، توصل البعض إلى استنتاج مفاده أن إعادة ترتيب العينات التي توجد بها مواد وفيرة أسهل وربما أرخص. وعندما يتعلق الأمر بتحليل هذه الكمية الكبيرة من البيانات ، فإن الباحثين مدللون للاختيار. في الواقع ، مع وجود أكثر من 3000 أداة لتحليل التسلسل مدرجة في OMICtools (دليل تديره omicX) ، يمكن للباحثين بسهولة أن يرهقوا عند محاولة العثور على الخيار الأفضل.

التفسير السريري والسداد

أخيرًا ، بالنسبة للعينات السريرية ، لا يزال هناك تحدٍ يتمثل في تقديم تفسير متسق وموثوق لمتغيرات التسلسل ، خاصةً فيما يتعلق برعاية المرضى. ستحتوي عينة exome النموذجية على ما بين 10000 إلى 20000 متغير ، بينما تحتوي عينة الجينوم الكامل بشكل عام على أكثر من 3 ملايين. لجعل الأمور أكثر قابلية للإدارة ، غالبًا ما يتم تصفية المتغيرات بناءً على احتمالية تسببها في المرض.

للمساعدة في توجيه الأطباء ، أنشأت الكلية الأمريكية لعلم الوراثة الطبية وعلم الجينوم ورابطة علم الأمراض الجزيئي وكلية علماء الأمراض الأمريكيين نظامًا لتصنيف المتغيرات. تشمل الفئات العوامل الممرضة ، والممرضة المحتملة ، والأهمية غير المؤكدة (والتي تشكل حاليًا الغالبية العظمى في عينات الإكسوم وعينات الجينوم الكامل) ، والتي يحتمل أن تكون حميدة وحميدة.

مثل هذه المخططات ، ومع ذلك ، لها حدودها. حتى عند استخدام مخطط تصنيف مشترك في مجموعات بيانات متطابقة ، قد تأتي مجموعات مختلفة بتفسيرات مختلفة. في دراسة تجريبية بموجب النظام الجديد ، وافقت المختبرات السريرية المشاركة على تصنيفاتها بنسبة 34٪ فقط من الوقت.

في الحالات التي يوجد فيها خلاف أو يلزم إجراء تحليل إضافي لتفسير النتائج ، تصبح مشكلة السداد عقبة في الطريق. يمكن أن يمثل سداد تكاليف الاختبارات المستندة إلى NGS تحديًا كبيرًا ، ولكن سداد تكاليف الترجمة يكاد يكون مستحيلًا.

تقول جينيفر فريدمان ، دكتوراه في الطب ، باحثة إكلينيكية في معهد رادي للأطفال للطب الجيني: "لا توجد طريقة للمختبرات لتقديم فاتورة للتفسير". "إنها خدمة قيّمة للغاية يمكن أن تكون متاحة ، لكن لا يوجد أحد في هذا المجال حقًا.

"لا توجد طريقة للفوترة - لن تدفع شركات التأمين مقابل ذلك. على الرغم من التركيز المتزايد على الطب الدقيق ، سواء كان التفسير من قبل الطبيب أو من قبل المختبر ، فإن هذا الجانب الأكثر أهمية لم يتم التعرف عليه أو تقديره من قبل دافعي الرعاية الصحية ".

حتى يتغير هذا ، يجب التعامل مع تحليل عينات المرضى هذه بشكل أساسي كمشروع بحثي ، وهو خيار متاح بشكل عام فقط في بيئة مستشفى أبحاث ، ولعدد محدود فقط من المرضى.

يتطلع

وبقدر التقدم الذي تم إحرازه على مدار السنوات العديدة الماضية ، لا تزال هناك العديد من التحديات عبر سير عمل NGS بأكمله ، بدءًا من إعداد العينات وحتى تحليل البيانات. ومع حدوث تطورات جديدة في التقنيات الأساسية ، ستستمر تحديات جديدة في الظهور. سيكون الارتقاء في مواجهة هذه التحديات أمرًا بالغ الأهمية لضمان التبني الواسع لهذه التقنيات الجينية وتعظيم تأثيرها على صحة الإنسان.

المتغيرات الهيكلية الطويلة والقصيرة

على الرغم من أن تسلسل الجيل التالي قد ساهم في إحراز تقدم سريع في قدرتنا على اكتشاف التباين الجيني أحادي القاعدة ، فقد تم استبعاد فئة كاملة أخرى من المتغيرات من الصورة بسبب طبيعة تسلسلات القراءة القصيرة التي تنتجها هذه المنصات. هذه المتغيرات صغيرة جدًا بحيث لا يمكن اكتشافها باستخدام الطرق الوراثية الخلوية ، ولكنها كبيرة جدًا بحيث لا يمكن اكتشافها بشكل موثوق باستخدام تسلسل القراءة القصيرة. هذه ليست مسألة تافهة: كل جينوم بشري يحتوي على حوالي 20000 متغير هيكلي ، وقد ثبت أن العديد منها يسبب المرض.

تعمل تقنية تسلسل الجزيء الفردي في الوقت الفعلي (SMRT) على حل التحدي المتمثل في تحديد المتغيرات الهيكلية ذات الحساسية العالية ، ويرجع ذلك جزئيًا إلى القراءات الطويلة الأساسية التي تنتجها. ينتج تسلسل SMRT قراءات يبلغ طولها العديد من كيلو بايت - مقارنة بـ 200 أو 300 قاعدة لمسلسلات القراءة القصيرة - بحيث يمكنها حل معظم المتغيرات الهيكلية بشكل كامل مثل عمليات الإدراج والحذف والتكرار والانعكاس والتوسعات المتكررة والمزيد.

تستخدم العديد من الدراسات الآن بيانات تسلسل SMRT طويلة القراءة لاكتشاف المتغير الهيكلي. في مشروع تم تقديمه العام الماضي في الجمعية الأمريكية لعلم الوراثة البشرية ، تم تسلسل العينة البشرية NA12878 لتغطي 10 أضعاف على نظام Sequel System التابع لشركة Pacific Biosciences ، وتم استدعاء المتغيرات الهيكلية باستخدام أداة PBHoney التابعة لكلية بايلور للطب.

وجد هذا النهج ما يقرب من 90 ٪ من المتغيرات الهيكلية في الجينوم ، بناءً على مقارنة مع مجموعة حقائق الجينوم في الزجاجة. علاوة على ذلك ، حددت تغطية القراءة الطويلة آلاف المتغيرات الجديدة غير الموجودة في مجموعات البيانات قصيرة القراءة ، والتي تم تأكيد معظمها من خلال تجميع de novo.

مع تحول الجهود إلى تحليل المتغيرات الهيكلية في مجموعات كبيرة ، من المهم تحقيق توازن بين الحساسية والتكلفة. إن تغطية تسلسل SMRT منخفضة الطي لديها القدرة على أن تكون حلاً فعالاً وبأسعار معقولة لاكتشاف المتغير الهيكلي في الجينوم البشري ، وتنطبق الفوائد على الجينومات المعقدة الأخرى أيضًا.


منذ مشروع الجينوم البشري ، انخفضت تكلفة تسلسل الجينوم بأكثر من ألف ضعف.

منذ مشروع الجينوم البشري ، أدى تطوير تقنيات تسلسل الحمض النووي الأحدث والأفضل إلى انخفاض تكلفة تسلسل الجينوم بأكثر من ألف ضعف. ما إن وصل الجيل التالي من التسلسل إلى السوق حتى تم تطوير جيل ثالث من التسلسل.

تمكن SMRT العلماء من "التنصت" بشكل فعال على بوليميراز الحمض النووي.

تم تطوير إحدى هذه التقنيات الجديدة بواسطة Pacific Biosciences وتسمى التسلسل أحادي الجزيء في الوقت الحقيقي (SMRT). يشتمل هذا النظام على جزيء أحادي السلسلة من الحمض النووي يرتبط بإنزيم بوليميريز DNA. يتم تسلسل الحمض النووي لأن بوليميراز الحمض النووي يضيف قواعد تكميلية ذات علامات الفلورسنت إلى حبلا DNA. عند إضافة كل قاعدة مصنفة ، يتم تسجيل اللون الفلوري للقاعدة قبل قطع ملصق الفلورسنت. يمكن بعد ذلك إضافة القاعدة التالية في سلسلة DNA وتسجيلها.

SMRT فعال للغاية مما يعني أنه يجب استخدام مواد كيميائية أقل تكلفة. كما أنها حساسة بشكل لا يصدق ، مما يمكّن العلماء من "التنصت" بشكل فعال على بوليميريز الحمض النووي ومراقبته وهو يصنع خيطًا من الحمض النووي.

تسلسل الجزيء المفرد في الوقت الحقيقي (SMRT) الذي طورته شركة باسيفيك بايوسينسز.
رصيد الصورة: Genome Research Limited

يمكن أن ينتج عن SMRT قراءات طويلة جدًا لتسلسل يتراوح طوله بين 10 و 15 كيلو قاعدة.

يمكن أن يولد SMRT قراءات طويلة جدًا من التسلسل (10-15 كيلو قاعدة طويلة) من جزيئات مفردة من الحمض النووي ، بسرعة كبيرة. يعد إنتاج قراءات طويلة أمرًا مهمًا للغاية لأنه من الأسهل تجميع الجينومات من أجزاء أطول من الحمض النووي. وهذا يعني أيضًا أنه بالنسبة للجينومات الصغيرة يمكن الحصول على التسلسل الكامل دون الحاجة إلى طرق سد الفجوة باهظة الثمن وتستغرق وقتًا طويلاً والتي تتطلبها التقنيات الأخرى.

مع الجيل الثالث من التسلسل ، يمكن للعلماء الآن البدء في إعادة تسلسل الجينوم لتحقيق مستوى أعلى من الدقة.

مع إدخال طرق التسلسل الحساسة والرخيصة ، يمكن للعلماء الآن البدء في إعادة تسلسل الجينومات التي تم ترتيبها بالفعل لتحقيق مستوى أعلى من الدقة. على سبيل المثال ، باستخدام SMRT ، الإشريكية القولونية تم الآن التسلسل بدقة تصل إلى 99.9999٪!

لن يكون تسلسل الجينوم البشري بهذه الطريقة ممكنًا لفترة من الوقت ، ولكن عندما يكون الأمر كذلك ، يتوقع العلماء أنه سيكون من الممكن ترتيب تسلسل الجينوم البشري بأكمله في غضون ساعة تقريبًا.

بعد عقد واحد فقط من مشروع الجينوم البشري ، يتم الآن تسلسل الحمض النووي بشكل أسرع وأكثر كفاءة.

رسم بياني يوضح كيفية زيادة سرعة تقنيات تسلسل الحمض النووي منذ التقنيات المبكرة في الثمانينيات.
رصيد الصورة: Genome Research Limited


مقارنة أنظمة تسلسل الجيل التالي

مع التطور السريع والتطبيقات الواسعة لتقنيات تسلسل الجيل التالي (NGS) ، أصبحت معلومات التسلسل الجيني في متناول اليد للمساعدة في تحقيق الأهداف لفك ألغاز الحياة ، وصنع محاصيل أفضل ، واكتشاف مسببات الأمراض ، وتحسين صفات الحياة. يتم تمثيل أنظمة NGS عادةً بواسطة SOLiD / Ion Torrent PGM من علوم الحياة ، محلل الجينوم / HiSeq 2000 / MiSeq من Illumina ، و GS FLX Titanium / GS Junior من Roche. يمتلك معهد جينومكس بكين (BGI) ، الذي يمتلك أكبر سعة للتسلسل في العالم ، أنظمة NGS متعددة بما في ذلك 137 HiSeq 2000 ، و 27 SOLiD ، وواحد Ion Torrent PGM ، و MiSeq ، و 454 Sequencer. لقد تراكمت لدينا خبرة واسعة في التعامل مع العينات ، والتسلسل ، وتحليل المعلوماتية الحيوية. في هذه الورقة ، تتم مراجعة تقنيات هذه الأنظمة ، ويتم تلخيص وتحليل البيانات المباشرة من الخبرة الواسعة لمناقشة المزايا والخصائص المرتبطة بكل نظام تسلسل. أخيرًا ، تم تلخيص تطبيقات NGS.

1 المقدمة

(حمض Deoxyribonucleic) تم عرض الحمض النووي على أنه المادة الوراثية بواسطة أوزوالد ثيودور أفيري في عام 1944. تم تحديد هيكلها المزدوج المكون من أربعة قواعد بواسطة جيمس د. واتسون وفرانسيس كريك في عام 1953 ، مما أدى إلى العقيدة المركزية للبيولوجيا الجزيئية. في معظم الحالات ، حدد الحمض النووي الجينومي الأنواع والأفراد ، مما يجعل تسلسل الحمض النووي أساسيًا للبحث في هياكل ووظائف الخلايا وفك رموز ألغاز الحياة [1]. يمكن أن تساعد تقنيات تسلسل الحمض النووي علماء الأحياء ومقدمي الرعاية الصحية في مجموعة واسعة من التطبيقات مثل الاستنساخ الجزيئي ، والتكاثر ، وإيجاد الجينات المسببة للأمراض ، والدراسات المقارنة والتطورية. يجب أن تكون تقنيات تسلسل الحمض النووي بشكل مثالي سريعة ودقيقة وسهلة التشغيل ورخيصة. في الثلاثين عامًا الماضية ، شهدت تقنيات وتطبيقات تسلسل الحمض النووي تطورًا هائلاً وعملت كمحرك لعصر الجينوم الذي يتميز بكمية هائلة من بيانات الجينوم وبالتالي مجموعة واسعة من مجالات البحث والتطبيقات المتعددة. من الضروري الرجوع إلى تاريخ تطوير تكنولوجيا التسلسل لمراجعة أنظمة NGS (454 و GA / HiSeq و SOLiD) ، لمقارنة مزاياها وعيوبها ، ومناقشة التطبيقات المختلفة ، وتقييم PGM التي تم تقديمها مؤخرًا ( آلات الجينوم الشخصية) وتقنيات وتطبيقات التسلسل من الجيل الثالث. سيتم وصف كل هذه الجوانب في هذه الورقة. معظم البيانات والاستنتاجات من مستخدمين مستقلين لديهم خبرة مباشرة واسعة في أنظمة NGS النموذجية في BGI (معهد بكين للجينوم).

قبل الحديث عن أنظمة NGS ، نود مراجعة تاريخ تسلسل الحمض النووي بإيجاز. في عام 1977 ، طور فريدريك سانجر تقنية تسلسل الحمض النووي التي تعتمد على طريقة إنهاء السلسلة (المعروفة أيضًا باسم تسلسل سانجر) ، وطور والتر جيلبرت تقنية تسلسل أخرى تعتمد على التعديل الكيميائي للحمض النووي والانقسام اللاحق في قواعد محددة. نظرًا لكفاءتها العالية ونشاطها الإشعاعي المنخفض ، تم اعتماد تسلسل Sanger كتكنولوجيا أولية في "الجيل الأول" من تطبيقات التسلسل المختبري والتجاري [2]. في ذلك الوقت ، كان تسلسل الحمض النووي شاقًا وكانت المواد المشعة مطلوبة. بعد سنوات من التحسين ، قدمت أبلايد بايوسيمز أول آلة تسلسل أوتوماتيكي (أي AB370) في عام 1987 ، باعتماد الرحلان الكهربائي الشعري الذي جعل التسلسل أسرع وأكثر دقة. يمكن أن يكتشف AB370 96 قاعدة مرة واحدة ، و 500 قاعدة كلفن يوميًا ، ويمكن أن يصل طول القراءة إلى 600 قاعدة. يمكن للطراز الحالي AB3730xl إنتاج 2.88 قاعدة في اليوم ويمكن أن يصل طول القراءة إلى 900 قاعدة منذ عام 1995. ظهرت في عام 1998 أدوات التسلسل التلقائي والبرامج المرتبطة باستخدام آلات التسلسل الشعري وأصبحت تقنية التسلسل Sanger الأدوات الرئيسية لإكمال الإنسان مشروع الجينوم عام 2001 [3]. حفز هذا المشروع بشكل كبير على تطوير أداة تسلسل جديدة قوية لزيادة السرعة والدقة ، مع تقليل التكلفة والقوى العاملة في نفس الوقت. ليس هذا فقط ، قامت X-prize أيضًا بتسريع تطوير تسلسل الجيل التالي (NGS) [4]. تختلف تقنيات NGS عن طريقة Sanger في جوانب التحليل المتوازي على نطاق واسع ، والإنتاجية العالية ، والتكلفة المنخفضة. على الرغم من أن NGS تجعل تسلسل الجينوم في متناول اليد ، إلا أن تحليل البيانات المتبع والتفسيرات البيولوجية لا تزال بمثابة عنق الزجاجة في فهم الجينوم.

بعد مشروع الجينوم البشري ، تم إطلاق 454 بواسطة 454 في عام 2005 ، وأصدرت Solexa محلل الجينوم في العام التالي ، متبوعًا بـ (التسلسل بواسطة Oligo Ligation Detection) SOLiD المقدمة من Agencourt ، وهي ثلاثة أنظمة تسلسل متوازية على نطاق واسع نموذجية في التالي- تسلسل التوليد (NGS) الذي يشترك في الأداء الجيد فيما يتعلق بالإنتاجية والدقة والتكلفة مقارنة بتسلسل Sanger (كما هو موضح في الجدول 1 (أ)). ثم تم شراء هذه الشركات المؤسسة من قبل شركات أخرى: في عام 2006 تم شراء Agencourt بواسطة Applied Biosystems ، وفي عام 2007 ، تم شراء 454 من قبل Roche ، في حين تم شراء Solexa بواسطة Illumina. بعد سنوات من التطور ، تعرض هذه الأنظمة الثلاثة أداءً أفضل ومزاياها الخاصة من حيث طول القراءة والدقة والتطبيقات والمواد الاستهلاكية ومتطلبات الطاقة البشرية والبنية التحتية للمعلومات وما إلى ذلك.سيتم التركيز على مقارنة هذه الأنظمة الثلاثة ومناقشتها في الجزء الأخير من هذه الورقة (انظر أيضًا الجداول 1 (أ) و 1 (ب) و 1 (ج)).

2. نظام روش 454

كان Roche 454 أول نظام جيل جديد ناجح تجاريًا. يستخدم جهاز التسلسل هذا تقنية التسلسل الحراري [5]. بدلاً من استخدام ديديوكسينوكليوتيدات لإنهاء تضخيم السلسلة ، تعتمد تقنية التسلسل الحراري على الكشف عن بيروفوسفات المنطلق أثناء دمج النيوكليوتيدات. يتم تغيير طبيعة مكتبة الحمض النووي التي تحتوي على 454 مهايئًا محددًا إلى حبلا مفردة ويتم التقاطها بواسطة خرزات تضخيم متبوعة بمستحلب PCR [6]. ثم على لوحة picotiter ، فإن أحد dNTP (dATP ، dGTP ، dCTP ، dTTP) سوف يكمل قواعد خيط القالب بمساعدة ATP سلفوريلاز, لوسيفيراز، لوسيفيرين ، الحمض النووي بوليميراز، والأدينوزين 5 فسفوسفات (APS) وإطلاق بيروفوسفات (PPi) الذي يعادل كمية النوكليوتيدات المدمجة. يحول ATP من PPi إلى luciferin إلى oxyluciferin ويولد ضوءًا مرئيًا [7]. في الوقت نفسه ، تتدهور القواعد التي لا مثيل لها بواسطة أبريز [8]. ثم يضاف dNTP آخر إلى نظام التفاعل ويتكرر تفاعل التسلسل الحراري.

كان طول قراءة Roche 454 في البداية 100-150 نقطة أساس في 2005 ، 200000+ قراءة ، ويمكن أن ينتج 20 ميجا بايت لكل تشغيل [9 ، 10]. في عام 2008 ، تم إطلاق نظام 454 GS FLX Titanium من خلال الترقية ، ويمكن أن يصل طول قراءته إلى 700 نقطة أساس بدقة 99.9٪ بعد تصفية وإخراج بيانات 0.7 جيجا لكل تشغيل خلال 24 ساعة. في أواخر عام 2009 ، جمعت شركة Roche نظام GS Junior وهو نظام أعلى مقعد في نظام التسلسل 454 الذي سهّل إعداد المكتبة ومعالجة البيانات ، وتمت ترقية المخرجات أيضًا إلى 14 جيجا لكل تشغيل [11 ، 12]. الميزة الأكثر بروزًا لـ Roche هي سرعتها: فهي تستغرق 10 ساعات فقط من بدء التسلسل حتى الانتهاء. طول القراءة هو أيضًا سمة مميزة مقارنة بأنظمة NGS الأخرى (موصوفة في الجزء الأخير من هذه الورقة). لكن التكلفة المرتفعة للكواشف لا تزال تمثل تحديًا لشركة Roche 454. وهي حوالي دولار

لكل قاعدة (عد استخدام الكاشف فقط). أحد أوجه القصور هو أنه يحتوي على معدل خطأ مرتفع نسبيًا من حيث القواعد المتعددة التي تزيد عن 6 نقاط أساس. ولكن يمكن أتمتة بناء مكتبتها ، ويمكن أن يكون مستحلب PCR شبه آلي مما قد يقلل من القوى العاملة إلى حد كبير. يتم سرد مزايا البنية التحتية المعلوماتية والتسلسل الأخرى ومقارنتها مع أنظمة HiSeq 2000 و SOLiD في الجداول 1 (أ) و 1 (ب) و 1 (ج).

2.1. 454 GS FLX Titanium Software

GS RunProcessor هو الجزء الرئيسي من نظام GS FLX Titanium. البرنامج مسؤول عن تطبيع خلفية الصورة ، وتصحيح موقع الإشارة ، وتصحيح الكلام المتقاطع ، وتحويل الإشارات ، وتوليد البيانات المتسلسلة. سينتج GS RunProcessor سلسلة من الملفات بما في ذلك ملفات SFF (تنسيق التدفق القياسي) في كل مرة بعد التشغيل. تحتوي ملفات SFF على التسلسلات التي تم استدعاؤها أساسًا ودرجات الجودة المقابلة لجميع القراءات الفردية عالية الجودة (قراءات تمت تصفيتها). ويمكن مشاهدته مباشرة من شاشة نظام GS FLX Titanium. باستخدام GS De Novo Assembler و GS Reference Mapper و GS Amplicon Variant Analyzer المقدم من نظام GS FLX Titanium ، يمكن تطبيق ملفات SFF في مجالات متعددة وتحويلها إلى تنسيق fastq لمزيد من تحليل البيانات.

3. نظام AB SOLiD

(التسلسل بواسطة Oligo Ligation Detection) تم شراء SOLiD بواسطة Applied Biosystems في عام 2006. يعتمد جهاز التسلسل تقنية التسلسل ثنائي القاعدة على أساس تسلسل الربط. على خلية تدفق SOLiD ، يمكن تسلسل المكتبات من خلال 8 ربط مسبار أساسي يحتوي على موقع الربط (القاعدة الأولى) ، وموقع الانقسام (القاعدة الخامسة) ، و 4 أصباغ فلورية مختلفة (مرتبطة بالقاعدة الأخيرة) [10]. سيتم تسجيل إشارة الفلورسنت خلال المجسات المكملة لقالب القالب وتختفي من خلال انقسام القواعد الثلاثة الأخيرة للمسبارات. ويمكن استنتاج تسلسل الجزء بعد 5 جولات من التسلسل باستخدام مجموعات السلم التمهيدي.

كان طول قراءة SOLiD في البداية 35 قراءة نقطة أساس وكان الناتج 3 جي بيانات لكل تشغيل. بسبب طريقة التسلسل ثنائي القاعدة ، يمكن أن تصل SOLiD إلى دقة عالية تصل إلى 99.85٪ بعد التصفية. في نهاية عام 2007 ، أصدرت ABI أول نظام SOLiD. في أواخر عام 2010 ، تم إصدار نظام التسلسل SOLiD 5500xl. من SOLiD إلى SOLiD 5500xl ، أصدرت ABI خمس ترقيات في ثلاث سنوات فقط. حقق SOLiD 5500xl طول قراءة ودقة وإخراج بيانات محسّن بمقدار 85 نقطة أساس ، و 99.99٪ ، و 30 غيغابايت لكل تشغيل ، على التوالي. يمكن الانتهاء من التشغيل الكامل في غضون 7 أيام. تكلفة التسلسل حوالي

لكل قاعدة مقدرة من استخدام الكاشف فقط من قبل مستخدمي BGI. لكن طول القراءة القصيرة وإعادة التسلسل فقط في التطبيقات لا يزالان أحد أوجه القصور الرئيسية فيه [13]. يتضمن تطبيق SOLiD إعادة تسلسل الجينوم بالكامل ، وإعادة التسلسل المستهدف ، وأبحاث النسخ (بما في ذلك تحديد ملامح التعبير الجيني ، وتحليل الحمض النووي الريبي الصغير ، وتحليل النسخ بالكامل) ، والإبيجينوم (مثل ChIP-Seq والميثيل). مثل أنظمة NGS الأخرى ، فإن البنية التحتية الحاسوبية لـ SOLiD باهظة الثمن وليست تافهة للاستخدام ، فهي تتطلب مركز بيانات مكيفًا ، ومجموعة حوسبة ، وموظفين مهرة في الحوسبة ، ومجموعة الذاكرة الموزعة ، والشبكات السريعة ، ونظام طابور الدُفعات. نظام التشغيل المستخدم من قبل معظم الباحثين هو GNU / LINUX. تستغرق كل عملية تشغيل لجهاز التسلسل الصلب 7 أيام وتنتج حوالي 4 تيرابايت من البيانات الأولية. سيتم إنشاء المزيد من البيانات بعد تحليل المعلوماتية الحيوية. يتم سرد هذه المعلومات ومقارنتها مع أنظمة NGS الأخرى في الجداول 1 (أ) و 1 (ب) و 1 (ج). يمكن استخدام الأتمتة في تحضيرات المكتبات ، على سبيل المثال ، نظام Tecan الذي دمج نظام Covaris A و Roche 454 REM e [14].

3.1. برنامج SOLiD

بعد التسلسل باستخدام SOLiD ، سيتم تجميع التسلسل الأصلي للترميز اللوني. وفقًا لمصفوفة التشفير مزدوجة القاعدة ، يمكن فك تشفير تسلسل الألوان الأصلي للحصول على التسلسل الأساسي إذا عرفنا الأنواع الأساسية لأحد أي موضع في التسلسل. نظرًا لوجود نوع من الألوان المقابلة لأربعة أزواج أساسية ، فإن الترميز اللوني للقاعدة سيؤثر بشكل مباشر على فك تشفير قاعدته التالية. قالت إن الترميز اللوني الخاطئ سيؤدي إلى أخطاء في فك تشفير السلسلة. BioScope عبارة عن حزمة تحليل بيانات SOLiD توفر إطارًا فرديًا تم التحقق من صحته لإعادة التسلسل ، و ChIP-Seq ، وتحليل النسخ بالكامل. يعتمد على المرجع لتحليل بيانات المتابعة. أولاً ، يحول البرنامج التسلسل الأساسي للمراجع إلى تسلسل ترميز لوني. ثانيًا ، تتم مقارنة تسلسل الترميز اللوني للمراجع بالتسلسل الأصلي للترميز اللوني للحصول على معلومات التعيين باستخدام خوارزمية الخرائط المطورة حديثًا MaxMapper.

4. نظام Illumina GA / HiSeq

في عام 2006 ، أصدرت Solexa محلل الجينوم (GA) ، وفي عام 2007 تم شراء الشركة من قبل شركة Illumina. يعتمد منظم التسلسل تقنية التسلسل عن طريق التوليف (SBS). يتم تغيير طبيعة المكتبة ذات المحولات الثابتة إلى خيوط مفردة وتطعيمها بخلية التدفق ، يليها تضخيم الجسر لتشكيل مجموعات تحتوي على شظايا DNA نسيلي. قبل التسلسل ، تنقسم المكتبة إلى خيوط مفردة بمساعدة إنزيم الخطي [10] ، ثم أربعة أنواع من النيوكليوتيدات (ddATP ، ddGTP ، ddCTP ، ddTTP) والتي تحتوي على صبغة فلورية مختلفة قابلة للكسر وستكمل مجموعة الحجب القابلة للإزالة القالب الأول. قاعدة في وقت واحد ، ويمكن التقاط الإشارة بواسطة CCD (جهاز مقترن بالشحن).

في البداية ، كان خرج solexa GA يبلغ 1 جيجا / تشغيل. من خلال التحسينات في البوليميراز ، والعازل ، وخلية التدفق ، والبرمجيات ، في عام 2009 ، زاد إنتاج GA إلى 20 جيجا / تشغيل في أغسطس (75PE) ، و 30 جيجا / تشغيل في أكتوبر (100PE) ، و 50 جيجا / تشغيل في ديسمبر (Truseq V3 ، 150PE) ، وأحدث سلسلة GAIIx يمكن أن تصل إلى 85 G / run. في أوائل عام 2010 ، أطلقت شركة Illumina HiSeq 2000 ، والتي تتبنى نفس استراتيجية التسلسل مع GA ، وكانت BGI من بين أوائل الشركات التي تبنت نظام HiSeq على مستوى العالم. كان إنتاجها 200 جيجا لكل شوط مبدئيًا ، وتحسن إلى 600 جيجا لكل شوط حاليًا والذي يمكن الانتهاء منه في 8 أيام. في المستقبل المنظور ، يمكن أن تصل إلى 1 تيرا / تشغيل عندما تنخفض تكلفة الجينوم الشخصي إلى أقل من 1 ك. ويمكن أن يكون معدل الخطأ 100PE أقل من 2٪ في المتوسط ​​بعد التصفية (بيانات BGI). بالمقارنة مع 454 و SOLiD ، فإن HiSeq 2000 هو الأرخص في التسلسل مع 0.02 / مليون قاعدة (الكاشف يحسب فقط بواسطة BGI). مع تعدد الإرسال المدمج في الاشعال والمحولات P5 / P7 ، يمكنه التعامل مع آلاف العينات في وقت واحد. يحتاج HiSeq 2000 (برنامج التحكم HiSeq) إلى HCS للتحكم في البرنامج ، (برنامج محلل الوقت الفعلي) RTA للقيام بالاتصال الأساسي على الجهاز ، و CASAVA للتحليل الثانوي. يوجد قرص صلب بسعة 3 تيرابايت في HiSeq 2000. بمساعدة كواشف Truseq v3 والبرامج المرتبطة بها ، تحسن HiSeq 2000 كثيرًا في تسلسل GC العالي. MiSeq ، جهاز التسلسل العلوي الذي تم إطلاقه في عام 2011 والذي يشترك في معظم التقنيات مع HiSeq ، مناسب بشكل خاص لتسلسل العينات البكتيرية والأمبليكون. يمكن أن تسلسل 150PE وتوليد 1.5 G / تشغيل في حوالي 10 ساعات بما في ذلك وقت إعداد العينة والمكتبة. يمكن أتمتة إعداد المكتبة وقياس تركيزها باستخدام أنظمة متوافقة مثل Agilent Bravo و Hamilton Banadu و Tecan و Apricot Designs.

4.1 برنامج HiSeq

تم اعتماد نظام التحكم HiSeq (HCS) والمحلل في الوقت الفعلي (RTA) بواسطة HiSeq 2000. يمكن أن يحسب هذان البرنامجان عدد المجموعات وموضعها بناءً على أول 20 قاعدة ، لذا فإن أول 20 قاعدة لكل تسلسل ستقرر كل تسلسل الإخراج والجودة. يستخدم HiSeq 2000 نوعين من الليزر وأربعة مرشحات لاكتشاف أربعة أنواع من النيوكليوتيدات (A و T و G و C). أطياف الانبعاث لهذه الأنواع الأربعة من النيوكليوتيدات لها نقاش متقاطع ، وبالتالي فإن صور أربعة نيوكليوتيدات ليست مستقلة وسيؤثر توزيع القواعد على جودة التسلسل. تتكون ملفات إخراج التسلسل القياسي لـ HiSeq 2000 من ملفات * bcl ، والتي تحتوي على المكالمات الأساسية ودرجات الجودة في كل دورة. ثم يتم تحويله إلى ملفات * _qseq.txt بواسطة BCL Converter. يتم استخدام برنامج ELAND الخاص بـ CASAVA (برنامج غير متصل بالإنترنت توفره شركة Illumina) لمطابقة عدد كبير من القراءات مع الجينوم.

في الختام ، من بين أنظمة NGS الثلاثة الموصوفة سابقًا ، يتميز Illumina HiSeq 2000 بأكبر إنتاج وأقل تكلفة كاشف ، ونظام SOLiD لديه أعلى دقة [11] ، ونظام Roche 454 لديه أطول طول قراءة. يتم سرد تفاصيل ثلاثة أنظمة تسلسل في الجداول 1 (أ) ، 1 (ب) ، و 1 (ج).

5. أجهزة التسلسل المدمجة PGM

تم إطلاق Ion Personal Genome Machine (PGM) و MiSeq بواسطة Ion Torrent و Illumina. كلاهما صغير الحجم ويتميزان بمعدلات دوران سريعة ولكن سعة نقل البيانات محدودة. هم مستهدفون للتطبيقات السريرية والمختبرات الصغيرة.

5.1 Ion PGM من Ion Torrent

تم إصدار Ion PGM بواسطة Ion Torrent في نهاية عام 2010. تستخدم PGM تقنية تسلسل أشباه الموصلات. عندما يتم دمج نوكليوتيد في جزيئات الحمض النووي بواسطة البوليميراز ، يتم إطلاق البروتون. من خلال الكشف عن التغيير في الرقم الهيدروجيني ، تعرف PGM على ما إذا كان النيوكليوتيد مضافًا أم لا. في كل مرة يتم فيها إغراق الرقاقة بالنيوكليوتيدات واحدة تلو الأخرى ، إذا لم تكن النيوكليوتيدات الصحيحة ، فلن يتم العثور على جهد إذا تمت إضافة 2 نيوكليوتيد ، يتم اكتشاف جهد مزدوج [15]. PGM هي أول آلة تسلسل تجارية لا تتطلب الفلورة والمسح الضوئي للكاميرا ، مما يؤدي إلى سرعة أعلى وتكلفة أقل وحجم أصغر للأداة. حاليًا ، تتيح قراءة 200 زوج قاعدي في ساعتين ووقت تحضير العينة أقل من 6 ساعات لـ 8 عينات بالتوازي.

التطبيق المثالي لمنظم Ion Torrent PGM هو تحديد مسببات الأمراض الميكروبية. في أيار / مايو وحزيران / يونيو 2011 ، كان هناك اندلاع مستمر لأنواع شديدة الضراوة من توكسين الشيجا (Stx). الإشريكية القولونية O104: H4 المتمركزة في ألمانيا [16 ، 17] ، كان هناك أكثر من 3000 شخص مصاب. ساعد تسلسل الجينوم الكامل على Ion Torrent PGM Sequencer و HiSeq 2000 العلماء على تحديد نوع بكتريا قولونية والتي من شأنها تطبيق الدليل مباشرة للعثور على مقاومة المضادات الحيوية. يبدو أن السلالة هي مزيج من اثنين بكتريا قولونية سلالات - تراكمية معوية بكتريا قولونية ونزيف معوي بكتريا قولونية- مما قد يساعد في تفسير سبب كونه مسببًا للأمراض بشكل خاص. من نتيجة التسلسل بكتريا قولونية TY2482 [18] ، يُظهر PGM إمكانية وجود مُسلسِل إنتاج سريع ولكن محدود عندما يكون هناك تفشي لمرض جديد.

من أجل دراسة جودة التسلسل ، ومعدل رسم الخرائط ، وتوزيع عمق GC لـ Ion Torrent ومقارنتها مع HiSeq 2000 ، وهو GC عالية رودوباكتر عينة ذات محتوى GC عالي (66٪) وجينوم 4.2 ميجا بايت تم تسلسلها في هذين التسلسلين المختلفين (الجدول 2). في تجربة أخرى ، بكتريا قولونية تم تسلسل K12 DH10B (NC_010473.1) مع GC 50.78 ٪ بواسطة Ion Torrent لتحليل قيمة الجودة وطول القراءة ودقة الموقف وتوزيع GC (الشكل 1).


(أ)
(ب)
(ج)
(أ)
(ب)
(ج) جودة تسلسل أيون سيل. بكتريا قولونية تم استخدام K12 DH10B (NC_010473.1) مع GC 50.78٪ لهذه التجربة. (أ) هي 314-200 نقطة أساس من Ion Torrent. الرقم الأيسر يمثل قيمة الجودة: يمثل النطاق الوردي قيم الحد الأدنى والحد الأقصى للجودة لكل موضع. تمثل المنطقة الخضراء الجزء العلوي والسفلي (1/4) من قراءات الجودة. يمثل الخط الأحمر متوسط ​​قيمة الجودة في الموضع. الشكل الصحيح هو تحليل طول القراءة: يمثل الرسم البياني الملون طول القراءة الحقيقي. يمثل الخط الأسود الطول المعين ، ولأنه يسمح بقطع ناعم بمقدار 3 درجات ، يختلف الطول عن طول القراءة الحقيقي. (ب) تحليل الدقة. في كل موضع ، يتم عرض نوع الدقة بما في ذلك عدم التطابق والإدراج والحذف على اليسار

-محور. يظهر متوسط ​​الدقة على اليمين

5.1.1. جودة التسلسل

تعد جودة Ion Torrent أكثر استقرارًا ، بينما تنخفض جودة HiSeq 2000 بشكل ملحوظ بعد 50 دورة ، والتي قد تكون ناجمة عن اضمحلال إشارة الفلورسنت مع زيادة طول القراءة (كما هو موضح في الشكل 1).

5.1.2. رسم الخرائط

كان حجم مكتبة Rhodobacter 350 نقطة أساس ، وتم الحصول على بيانات 0.5 جيجا بايت من HiSeq. كان عمق التسلسل أكثر من 100x ، وكان contig و scaffold N50 39530 نقطة أساس و 194344 نقطة أساس ، على التوالي. بناءً على نتيجة التجميع ، استخدمنا 33 ميجا بايت والتي تم الحصول عليها من أيون سيل مع 314 شريحة لتحليل معدل الخريطة. مقارنة المحاذاة هي الجدول 2.

معدل خريطة Ion Torrent أعلى من HiSeq 2000 ، لكنه لا يضاهى بسبب طرق المحاذاة المختلفة المستخدمة في أجهزة التسلسل المختلفة. إلى جانب الاختلاف الكبير في البيانات بما في ذلك معدل عدم التطابق ومعدل الإدراج ومعدل الحذف ، كان HiSeq 2000 و Ion Torrent لا يزالان غير قابلين للمقارنة بسبب مبادئ التسلسل المختلفة. على سبيل المثال ، لا يمكن تحديد موقع عديد النوكليوتيد بسهولة في Ion Torrent. ولكن تبين أن Ion Torrent يتمتع بجودة مستقرة إلى جانب قراءات التسلسل والأداء الجيد في دقة عدم التطابق ، ولكنه بالأحرى تحيز في اكتشاف indels. يتم تحليل أنواع مختلفة من الدقة وعرضها في الشكل 1.

5.1.3. توزيع عمق GC

توزيع عمق GC أفضل في Ion Torrent من الشكل 1. في Ion Torrent ، يكون عمق التسلسل مشابهًا بينما يتراوح محتوى GC من 63٪ إلى 73٪. ومع ذلك ، في HiSeq 2000 ، يكون متوسط ​​عمق التسلسل 4x عندما يكون محتوى GC 60٪ ، بينما يكون 3x مع 70٪ محتوى GC.

أصدر Ion Torrent بالفعل Ion 314 و 316 وخطط لإطلاق رقائق Ion 318 في أواخر عام 2011. تختلف الرقائق في عدد الآبار مما يؤدي إلى إنتاج أعلى في نفس وقت التسلسل. تتيح شريحة Ion 318 إنتاج بيانات gt1 Gb في ساعتين. من المتوقع أن يزيد طول القراءة إلى 400 نقطة أساس في 2012.

5.2 MiSeq من Illumina

تم إطلاق MiSeq الذي لا يزال يستخدم تقنية SBS بواسطة Illumina. إنه يدمج وظائف إنشاء الكتلة ، و SBS ، وتحليل البيانات في أداة واحدة ويمكن أن ينتقل من عينة إلى إجابة (البيانات التي تم تحليلها) في غضون يوم واحد (أقل من 8 ساعات). تم استخدام التسلسل المستند إلى المنهي القابل للانعكاس بواسطة الكيمياء التركيبية من Nextera و TruSeq و Illumina في هذه الهندسة المبتكرة. تعد أعلى بيانات تكاملية ونطاق أوسع من التطبيقات ، بما في ذلك تسلسل amplicon ، وفحص الاستنساخ ، و ChIP-Seq ، وتسلسل الجينوم الصغير ، الأجزاء البارزة في MiSeq. كما أنه مرن لإجراء قراءات مفردة 36 نقطة أساس (إخراج 120 ميجابايت) حتى 2 × 150 قراءة نهائية مقترنة (إخراج 1–1.5 جيجابايت) في MiSeq. نظرًا للتحسن الكبير في طول القراءة ، تعمل البيانات الناتجة بشكل أفضل في تجميع contig مقارنةً بـ HiSeq (البيانات غير معروضة). يتم عرض نتيجة التسلسل ذات الصلة لـ MiSeq في الجدول 3. قمنا أيضًا بمقارنة PGM مع MiSeq في الجدول 4.

5.3 علم الجينوم الكامل

الجينوميات الكاملة لها مُسلسِل خاص بها يعتمد على Polonator G.007 ، وهو مُسلسِل قائم على الربط. تعاون مالك Polonator G.007 ، دوفر ، مع مختبر الكنيسة التابع لكلية الطب بجامعة هارفارد ، وهو نفس فريق نظام SOLiD ، وقدم هذا النظام المفتوح الرخيص. يمكن أن يجمع Polonator بين أداة عالية الأداء بسعر منخفض للغاية والبرامج والبروتوكولات مفتوحة المصدر والقابلة للتنزيل مجانًا في نظام التسلسل هذا. Polonator G.007 هو تسلسل كشف الربط ، والذي يفك تشفير القاعدة بواسطة مسبار أحادي القاعدة في nonanucleotides (nonamers) ، وليس عن طريق ترميز ثنائي القاعدة [19]. سوف يتحلل nonamers الموسومة بالفلوروفور عن طريق الربط الانتقائي على سلسلة من مرساة التمهيدي ، والتي تم تصنيف مكوناتها الأربعة بواحد من أربعة فلوروفور بمساعدة T4 DNA ligase ، والتي تتوافق مع النوع الأساسي في موضع الاستعلام. في تقدم الربط ، يعتبر T4 DNA ligase حساسًا بشكل خاص لعدم التطابق على جوانب 3′ من الفجوة التي تفيد في تحسين دقة التسلسل. بعد التصوير ، يقوم Polonator كيميائيًا بتقطيع مجموعة من معقد المسبار الفلوري التمهيدي الملدن ، ويتم استبدال مرساة التمهيدي ويتم تقديم الخليط الجديد الذي تم تمييزه بعلامة nonamers لتسلسل القاعدة المجاورة [20]. هناك نوعان من التحديثات مقارنةً بـ Polonator G.007 ، ومصفوفات DNA nanoball (DNB) ، وربط المجس التجميعي (cPAL). بالمقارنة مع مجموعة DNA أو microsphere ، تحصل صفائف DNA nanoball على كثافة أعلى من كتلة DNA على سطح رقاقة السيليكون. نظرًا لأن المقاطع السبعة المكونة من 5 قواعد غير متصلة ، فإن نظام دورة الكشف عن التهجين والربط يتمتع بقدرة أعلى على تحمل الأخطاء مقارنةً بـ SOLiD. يدعي علم الجينوم الكامل أنه يتمتع بدقة بنسبة 99.999٪ وبعمق 40x ويمكنه تحليل SNP و indel و CNV بسعر 5500 دولار - 9500 دولار. لكن شركة Illumina أبلغت عن أداء أفضل لـ HiSeq 2000 باستخدام بيانات 30x فقط (شبكة Illumina Genome Network).قارن بعض الباحثين مؤخرًا بيانات تسلسل الجينوم البشري لـ CG مع نظام Illumina [21] ، وهناك اختلافات ملحوظة في اكتشاف SNVs و indels والاكتشافات الخاصة بالنظام في المتغيرات.

5.4. الجيل الثالث

في حين أن الاستخدام المتزايد والتعديل الجديد في تسلسل الجيل التالي ، فإن تسلسل الجيل الثالث يخرج برؤية جديدة في التسلسل. تسلسل الجيل الثالث له خاصيتان رئيسيتان. أولاً ، ليست هناك حاجة إلى تفاعل البوليميراز المتسلسل قبل التسلسل ، مما يقصر وقت تحضير الحمض النووي للتسلسل. ثانيًا ، يتم التقاط الإشارة في الوقت الفعلي ، مما يعني أن الإشارة ، بغض النظر عما إذا كانت الفلورسنت (Pacbio) أو التيار الكهربائي (Nanopore) ، يتم مراقبتها أثناء التفاعل الأنزيمي لإضافة النوكليوتيدات في الشريط التكميلي.

الوقت الحقيقي لجزيء واحد (SMRT) هو طريقة تسلسل الجيل الثالث التي طورتها Pacific Bioscience (مينلو بارك ، كاليفورنيا ، الولايات المتحدة الأمريكية) ، والتي استفادت من الإنزيم المعدل والمراقبة المباشرة للتفاعل الأنزيمي في الوقت الفعلي. تتكون خلية SMRT من ملايين الأدلة الموجية ذات الوضع الصفري (ZMWs) ، المدمجة مع مجموعة واحدة فقط من الإنزيمات وقالب الحمض النووي التي يمكن اكتشافها أثناء العملية برمتها. أثناء التفاعل ، يقوم الإنزيم بدمج النيوكليوتيد في الخيط التكميلي ويقطع الصبغة الفلورية المرتبطة سابقًا بالنيوكليوتيدات. ثم تلتقط الكاميرا الموجودة داخل الجهاز إشارة في شكل فيلم في المراقبة في الوقت الحقيقي [19]. هذا لن يعطي فقط إشارة الفلورسنت ولكن أيضًا اختلاف الإشارة على طول الوقت ، والذي قد يكون مفيدًا للتنبؤ بالتباين الهيكلي في التسلسل ، وهو مفيد بشكل خاص في دراسات الوراثة اللاجينية مثل ميثلايشن الحمض النووي [22].

مقارنة بالجيل الثاني ، فإن PacBio RS (أول جهاز تسلسل أطلقته PacBio) له العديد من المزايا. أولاً ، يتم تحضير العينة بسرعة كبيرة ويستغرق من 4 إلى 6 ساعات بدلاً من أيام. كما أنه لا يحتاج إلى خطوة PCR في خطوة التحضير ، مما يقلل التحيز والخطأ الناجم عن PCR. ثانيًا ، معدل الدوران سريع جدًا يتم الانتهاء منه في غضون يوم واحد. ثالثًا ، يبلغ متوسط ​​طول القراءة 1300 نقطة أساس ، وهو أطول من أي تقنية تسلسل من الجيل الثاني. على الرغم من أن إنتاجية PacBioRS أقل من مُسلسِل الجيل الثاني ، إلا أن هذه التقنية مفيدة جدًا للمختبرات السريرية ، وخاصة لأبحاث علم الأحياء الدقيقة. تم نشر ورقة باستخدام PacBio RS حول تفشي الكوليرا في هايتي [19].

لقد قمنا بتشغيل من جديد تجميع عينة فوسميد DNA من Oyster مع PacBio RS في وضع التسلسل القياسي (باستخدام كيمياء LPR وخلايا SMRT بدلاً من النسخة الجديدة من كيمياء FCR وخلايا SMRT). قالب حزام SMRT بمتوسط ​​حجم إدخال 7500 كيلو بايت يتم تصنيعه وتشغيله في خلية SMRT واحدة ويتم التقاط فيلم مدته 120 دقيقة. بعد تصفية ما بعد QC ، تم تسلسل 22373.400 نقطة أساس في 6754 قراءة (متوسط ​​2566 نقطة أساس) بمتوسط ​​نقاط قراءة يبلغ 0.819. تبلغ التغطية 324x بمتوسط ​​درجة قراءة 0.861 ودقة عالية (

99.95). يتم عرض النتيجة في الشكل 2.


تسلسل الحمض النووي fosmid باستخدام Pacific Biosciences Sequencer. مع التغطية ، يمكن أن تكون الدقة أعلى من 97٪. تم إنشاء الرقم من خلال بيانات BGI الخاصة.

يعد تسلسل Nanopore طريقة أخرى لتسلسل الجيل الثالث. Nanopore هو ثقب حيوي صغير بقطر في المقياس النانوي [23] ، والذي يمكن العثور عليه في قناة البروتين المدمجة في طبقة ثنائية الدهون والتي تسهل التبادل الأيوني. بسبب الدور البيولوجي لثاني النانو ، يمكن لأي حركة جسيمية أن تعطل الجهد عبر القناة. يتضمن المفهوم الأساسي لتسلسل الثقوب النانوية وضع خيط من الحمض النووي أحادي الجديلة عبره α-هايموليسين (αHL) المسام. αHL ، بروتين 33 كيلو دالتون معزول من المكورات العنقودية الذهبية [20] ، يخضع لتجميع ذاتي لتشكيل قناة عبر غشاء سباعي [23]. يمكن أن تتحمل جهدًا غير عادي يصل إلى 100 مللي فولت مع تيار 100 باسكال [20]. تدعم هذه الخاصية الفريدة دورها ككتلة بناء للحفر النانوي. في تسلسل النانو ، يتم تطبيق التدفق الأيوني بشكل مستمر. يتم اكتشاف الاضطراب الحالي ببساطة عن طريق التقنية الكهربية القياسية. تعتمد القراءة على فرق الحجم بين جميع أحادي فوسفات الديوكسي ريبونوكليوزيد (dNMP). وبالتالي ، بالنسبة إلى dNMP ، يتم عرض تعديل التيار المميز للتمييز. يتم استئناف التيار الأيوني بعد ضغط النيوكليوتيدات المحاصرة بالكامل.

يمتلك تسلسل Nanopore عددًا من المزايا المثمرة على تقنيات تسلسل الجيل التالي التجارية الحالية. أولاً ، من المحتمل أن تصل إلى طول قراءة طويل gt5 kbp مع سرعة 1 bp / ns [19]. علاوة على ذلك ، فإن الكشف عن القواعد يكون خاليًا من العلامات الفلورية. ثالثًا ، باستثناء استخدام نوكلياز خارجي لعزل ssDNA وانقسام النوكليوتيدات [24] ، يتم تجنب مشاركة الإنزيم بشكل ملحوظ في تسلسل النانو [22]. هذا يعني أن تسلسل النانو أقل حساسية لدرجة الحرارة خلال تفاعل التسلسل ويمكن الحفاظ على نتيجة موثوقة. رابعًا ، بدلاً من تسلسل الحمض النووي أثناء البلمرة ، يتم تسلسل خيوط الحمض النووي المفردة من خلال ثقب نانوي عن طريق إزالة البلمرة من خيوط الحمض النووي. ومن ثم ، يمكن تقصير وقت التدريب العملي لإعداد العينة مثل خطوات الاستنساخ والتضخيم بشكل كبير.

6. مناقشة تطبيقات NGS

أدى التقدم السريع في تقنية تسلسل الحمض النووي إلى خفض كبير في التكاليف وزيادة كبيرة في الإنتاجية والدقة. مع تسلسل المزيد والمزيد من الكائنات الحية ، يغمر العالم فيض من البيانات الجينية العالم كل يوم. كان التقدم في علم الجينوم يتقدم بثبات إلى الأمام بسبب ثورة في تكنولوجيا التسلسل. بالإضافة إلى ذلك ، أصبحت جميع الدراسات الأخرى واسعة النطاق في مجال exomics و metagenomics و epigenomics و transcriptomics حقيقة واقعة. لا توفر هذه الدراسات المعرفة للبحث الأساسي فحسب ، بل توفر أيضًا فوائد التطبيق الفوري. يستخدم العلماء في العديد من المجالات هذه البيانات لتطوير محاصيل مزدهرة بشكل أفضل وعائدات المحاصيل والثروة الحيوانية وتحسين التشخيص والتنبؤات والعلاجات للسرطان والأمراض المعقدة الأخرى.

تعد BGI في طليعة ترجمة أبحاث الجينوم إلى دراسات التكاثر الجزيئي وترابط الأمراض مع الاعتقاد بأن الزراعة والطب وتطوير الأدوية والعلاج السريري ستدخل في النهاية مرحلة جديدة لفهم أكثر تفصيلاً للمكونات الجينية لجميع الكائنات الحية. تركز BGI بشكل أساسي على ثلاثة مشاريع. (1) مشروع جينوم المليون نوع / أصناف ، يهدف إلى تسلسل مليون من النباتات والحيوانات والنماذج المهمة اقتصاديًا وعلميًا ، بما في ذلك السلالات والأصناف والسلالات المختلفة. يتم تمثيل هذا المشروع بشكل أفضل من خلال تسلسلنا لجينومات الباندا العملاقة والبطاطا والماكاكا وغيرها ، جنبًا إلى جنب مع العديد من مشاريع إعادة التسلسل. (2) يركز مشروع المليون جينوم بشري على الدراسات السكانية واسعة النطاق ودراسات الارتباط التي تستخدم استراتيجيات تسلسل الجينوم الكامل أو كامل الإكسوم. (3) يهدف مشروع جينوم النظام البيئي المليون إلى تحديد تسلسل الجينوم الميتاجينومي والميكروبيوم المستنبت في عدة بيئات مختلفة ، بما في ذلك البيئات الدقيقة داخل جسم الإنسان [25]. معا يطلق عليهم مشروع 3 م.

في الجزء التالي ، كل من الجوانب التالية من التطبيقات بما في ذلك من جديد التسلسل ، الزوج المتزاوج ، الجينوم الكامل أو إعادة تسلسل المنطقة المستهدفة ، الحمض النووي الريبي الصغير ، النسخ ، تسلسل الحمض النووي الريبي ، الوراثة اللاجينية ، وعلم الجينوميات ، يتم تلخيصها بإيجاز.

في الحمض النووي من جديد التسلسل ، المكتبة ذات حجم الإدخال أقل من 800 نقطة أساس يتم تعريفها على أنها مكتبة أجزاء قصيرة من الحمض النووي ، وعادة ما يتم تطبيقها في من جديد وإعادة تسلسل البحث. سكوفجارد وآخرون. [26] طبقوا طريقة مركبة من WGS (تسلسل الجينوم الكامل) وتحليل رقم نسخة الجينوم لتحديد الطفرات التي يمكن أن تكبح نقص النمو الذي تفرضه عمليات البدء المفرطة من بكتريا قولونية أصل النسخ المتماثل، oriC.

تسلسل مكتبة Mate-pair مفيد بشكل كبير من جديد التسلسل ، لأن الطريقة يمكن أن تقلل منطقة الفجوة وتمدد طول السقالة. راينهاردت وآخرون. [27] طور أسلوبًا جديدًا لـ من جديد تجميع الجينوم عن طريق تحليل بيانات التسلسل من تقنية تسلسل القراءة القصيرة عالية الإنتاجية. لقد قاموا بتجميع الجينومات في سقالات كبيرة بجزء بسيط من التكلفة التقليدية وبدون استخدام التسلسل المرجعي. أسفر تجميع عينة واحدة عن حجم سقالة N50 يبلغ 531،821 نقطة أساس مع & gt 75٪ من الجينوم المتوقع مغطى بسقالات تزيد عن 100،000 نقطة أساس.

تسلسل إعادة تسلسل الجينوم بالكامل تسلسل الحمض النووي الكامل لجينوم الكائن الحي بما في ذلك الحمض النووي الصبغي الكامل في وقت واحد والمحاذاة مع التسلسل المرجعي. ميلز وآخرون. [28] أنشأ خريطة لـ SVs غير المتوازنة (المتغيرات الهيكلية الجينية) استنادًا إلى بيانات تسلسل الحمض النووي للجينوم الكامل من 185 جينومًا بشريًا مع منصة SOLiD ، وتضمنت الخريطة 22025 عملية حذف و 6000 SVs إضافية ، بما في ذلك عمليات الإدراج والازدواج الترادفي [28]. تم تعيين معظم SVs (53 ٪) إلى دقة النوكليوتيدات ، مما سهل تحليل أصلها وتأثيرها الوظيفي [28].

إعادة تسلسل الجينوم بأكمله طريقة فعالة لدراسة الجين الوظيفي ، لكن التكلفة العالية والبيانات الضخمة هي المشكلة الرئيسية لمعظم الباحثين. تسلسل المنطقة المستهدفة هو حل لحلها. يعد التقاط المصفوفات الدقيقة طريقة شائعة لتسلسل المنطقة المستهدفة ، والتي تستخدم التهجين لمصفوفات تحتوي على نيوكليوتيدات قليلات اصطناعية تتطابق مع تسلسل الحمض النووي المستهدف. Gnirke وآخرون. [29] طور طريقة تم التقاطها تستخدم "طُعم" RNA لالتقاط شظايا الحمض النووي المستهدفة من "البركة" ثم تستخدم منصة Illumina لقراءة التسلسل. حوالي 90٪ من قواعد المحاذاة الفريدة تقع على أو بالقرب من تسلسل الطُعم حتى 50٪ تقع على exons المناسب [29].

Fehniger et al. استخدمت منصتين ، Illumina GA و ABI SOLiD ، لتحديد نسخ ميرنا لخلايا الفئران الأولية NK (القاتلة الطبيعية) التي تنشط السيتوكين [30]. تم تحليل الـ 302 ميرنا المعروفة و 21 الجديدة الناضجة بواسطة خط أنابيب فريد للمعلوماتية الحيوية من مكتبات الحمض النووي الريبي الصغيرة لخلية NK. يتم التعبير عن هذه الجزيئات المجهرية بشكل مفرط في نطاق واسع وتظهر تعقيد isomiR ، ويتم التعبير عن مجموعة فرعية بشكل تفاضلي بعد تنشيط السيتوكين ، والتي كانت المفتاح لتحديد تحديد miRNAs بواسطة أدوات Illumina GA و SOLiD [30].

الترنسكريبتوم عبارة عن مجموعة من جميع جزيئات الحمض النووي الريبي ، بما في ذلك الرنا المرسال ، والرنا الريباسي ، والحمض النووي الريبي ، والحمض النووي الريبي غير المشفر الآخر الذي يتم إنتاجه في خلية واحدة أو مجموعة من الخلايا. في هذه السنوات ، يتم استخدام تقنية التسلسل من الجيل التالي لدراسة مقارنة النسخ مع تقنية DNA microarray في الماضي. ال S. البحر الأبيض المتوسط يمكن تسلسل النسخ من خلال استراتيجية تسلسل فعالة صممها Adamidi et al. [31]. يقوم كتالوج النصوص المجمعة والببتيدات المحددة في هذه الدراسة بتوسيع وصقل الشرح الجيني المستوي بشكل كبير ، والذي يتضح من خلال التحقق من صحة العديد من النصوص غير المعروفة سابقًا باستخدام أنماط التعبير المعتمدة على الخلايا الجذعية.

RNA-seq هي طريقة جديدة في تسلسل الحمض النووي الريبي لدراسة تعبير الرنا المرسال. إنه مشابه لتسلسل النسخ في تحضير العينة ، باستثناء الإنزيم. من أجل تقدير التباين التقني ، ماريوني وآخرون. [32] حللت عينات من الحمض النووي الريبي للكلية على كل من منصة Illumina ومصفوفات Affymetrix. تم العثور على التحليلات الإضافية مثل الجينات منخفضة التعبير ومتغيرات لصق بديلة ونصوص جديدة على منصة Illumina. برادفورد وآخرون. [33] قارن بيانات مكتبة RNA-seq على منصة SOLiD ومصفوفات Affymetrix Exon 1.0ST ووجدت درجة عالية من التطابق بين النظامين فيما يتعلق بالتغييرات على مستوى exon والكشف. وقد شوهد أكبر تطابق في الكشف عندما يكون معدل الخطأ في الخلفية منخفضًا للغاية في تسلسل الحمض النووي الريبي. الفرق بين RNA-seq و transcriptome على SOLiD ليس واضحًا مثل Illumina.

هناك نوعان من تطبيقات التحليل الوراثي اللاجيني ، الترسيب المناعي للكروماتين والتحليل الميثيلى. الترسيب المناعي للكروماتين (ChIP) هو تقنية ترسيب مناعي تُستخدم لدراسة التفاعل بين البروتين والحمض النووي في الخلية ، ويمكن العثور على تعديل الهيستون من خلال الموقع المحدد في الجينوم. استنادًا إلى تقنية التسلسل من الجيل التالي ، جونسون وآخرون. [34] طور مقايسة الترسيب المناعي للكروماتين على نطاق واسع لتحديد الحافز ، وخاصة الحافز غير الكنسي المرتبط بـ NRSF. تعرض البيانات دقة حادة لموضع الربط (± 50 نقطة أساس) ، وهو أمر مهم لاستنتاج تفاعل مرشح جديد لحساسية وخصوصية عالية (ROC (خاصية مشغل المستقبل) منطقة ≥0.96) والثقة الإحصائية (

& LT 10–4). تطبيق مهم آخر في الوراثة اللاجينية هو تحليل مثيلة الحمض النووي. توجد مثيلة الحمض النووي عادةً في الفقاريات في مواقع CpG ، حيث تسبب الميثيل في تحويل السيتوزين إلى 5-ميثيل سيتوزين. قدم تشونج تسلسل ميثيلوم كامل لدراسة الاختلاف بين نوعين من طرق تحويل بيسلفيت (في المحلول مقابل الهلام) بواسطة منصة SOLiD [35].

تشمل مشاريع الجينوم ذات المستوى العالمي مشروع الجينوم 1000 ، ومشروع ENCODE البشري ، مشروع Microbiome البشري (HMP) ، على سبيل المثال لا الحصر. تلعب BGI دورًا نشطًا في هذه المشاريع والعديد من المشاريع الجارية الأخرى مثل مشروع الجينوم الحيواني والنباتي 1000 ، ومشروع MetaHIT ، ومشروع Yanhuang ، و LUCAMP (دراسة الجينات والاختلافات المرتبطة بمرض السكري) ، و ICGC (مشروع جينوم السرطان الدولي) ، والجينوم البشري القديم ، 1000 مشروع اضطرابات مندلية ، مشروع الجينوم 10 ك ، وما إلى ذلك [25]. عززت مشاريع الجينوم المتعاونة دوليًا دراسة الجينوميات وتطبيقاتها في الرعاية الصحية وغيرها من المجالات.

لإدارة العديد من المشاريع بما في ذلك المشاريع الكبيرة والمعقدة التي تحتوي على ما يصل إلى عشرات الآلاف من العينات ، يلزم وجود نظام إدارة مشروع متطور ومتطور للتعامل مع معالجة المعلومات من بداية تسمية العينات وتخزينها إلى إنشاء المكتبة وتعدد الإرسال والتسلسل وتحليل المعلوماتية . لا يتم تضمين تحليل المعلوماتية الحيوية الموجه نحو البحث وتجربة المتابعة المعالجة. على الرغم من أن اعتماد تقنيات الأتمتة قد بسط إلى حد كبير التدخلات البشرية للتجربة الحيوية ، إلا أنه يجب إدارة جميع الإجراءات الأخرى التي تنفذها القوة البشرية. طورت BGI نظام BMS والخدمة السحابية لتبادل المعلومات وإدارة المشاريع بكفاءة. تتبع إدارة السلوك بشكل أساسي نموذج اليابان 5S في الموقع. بالإضافة إلى ذلك ، اجتازت BGI نظام مراقبة الجودة ISO9001 و CSPro (المرخص من شركة Illumina) وهي تخضع حاليًا لاختبارات AShI (تعديلات تحسين المختبرات السريرية) CLIA و (الجمعية الأمريكية للتوافق النسيجي والجينات المناعية). يضمن نظام الانعكاس السريع والقياسي والمفتوح مسارًا فعالاً لاستكشاف الأخطاء وإصلاحها وأداءً عاليًا ، على سبيل المثال ، فشل تصميم الأداة لخلية تدفق Truseq v3 مما أدى إلى ظهور الفقاعة (والتي تم تعريفها على أنها ظاهرة "أسفل - وسط - حامل" بواسطة Illumina) وعشوائية

في القراءات. يحتمل أن يهدد هذا جودة التسلسل وتكوين GC وكذلك الإنتاجية. إنه لا يؤثر فقط على مساحة صغيرة حيث توجد الفقاعة مما يؤدي إلى القراءة

ولكنه يؤثر أيضًا على تركيز المكان القريب ، بما في ذلك الحامل الكامل والحامل المجاور. يجب تحديد معلمات التصفية لضمان جودة البيانات الخام لمعالجة المعلوماتية الحيوية. بقيادة مجموعة NGS للتكنولوجيا ، تمت الدعوة لعقد اجتماعات مشتركة لتحليل هذه المشكلة وحلها ، لمناقشة الاستراتيجيات لتقليل التأثير على أفضل وجه من حيث التكلفة ووقت المشروع ، لإنشاء قناة اتصال ، لتلخيص التعويض إحصائيًا ، من أجل توفير أفضل إدارة للمشروع الاستراتيجيات في هذا الوقت. تم تلخيص بعض أمثلة كاشف مراقبة الجودة في Liu et al. [36].

تقوم BGI بإنشاء خدماتها السحابية. إلى جانب تقنيات NGS المتقدمة ذات الخيارات المتعددة ، فإن خدمة المعلوماتية القابلة للتوصيل والتشغيل سهلة الاستخدام وبأسعار معقولة. تتوفر سلسلة من البرامج بما في ذلك BLAST و SOAP و SOAP SNP لمحاذاة التسلسل وخطوط الأنابيب لبيانات RNAseq. كما أن برامج استدعاء SNP مثل Hecate و Gaea على وشك الإصدار. يمكن الآن مشاركة دراسات البيانات الضخمة من مجموعة كاملة من علوم الحياة والطب الحيوي ونشرها في مجلة جديدة GigaSicence شارك في تأسيسها BGI و Biomed Central. يحتوي على تنسيق نشر جديد: يرتبط كل جزء من البيانات بمنشور معياري للمخطوطة بقاعدة بيانات شاملة تستضيف جميع البيانات المرتبطة وأدوات تحليل البيانات وموارد الحوسبة السحابية. لا يغطي النطاق فقط بيانات النوع omic ومجالات البيولوجيا عالية الإنتاجية التي تخدمها حاليًا مستودعات عامة كبيرة ولكن أيضًا النطاق المتزايد من البيانات التي يصعب الوصول إليها ، مثل التصوير وعلم الأعصاب والبيئة وبيانات الأتراب وعلم الأحياء للأنظمة ، وأنواع جديدة أخرى من البيانات القابلة للمشاركة على نطاق واسع.

مراجع

  1. جي إم تشيرش و دبليو جيلبرت ، "التسلسل الجينومي ،" وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية، المجلد. 81 ، لا. 7، pp.1991–1995، 1984. عرض على: الباحث العلمي من Google.
  2. إف إس كولينز ، إم مورجان ، وأ. باترينوس ، "مشروع الجينوم البشري: دروس من علم الأحياء على نطاق واسع ،" علم، المجلد. 300 ، لا. 5617 ، ص 286-290 ، 2003. عرض على: موقع الناشر | منحة جوجل . .
  3. J. Berka، Y. J. Chen، J.H Leamon et al.، "Bead emulsion nucleic acid amplification،" U.S. Patent Application، 2005. View at: Google Scholar
  4. T. Foehlich وآخرون ، "تحليل الحمض النووي عالي الإنتاجية" ، براءة الاختراع الأمريكية ، 2010. عرض على: الباحث العلمي من Google. .
  5. إي آر مارديس ، "تأثير الجيل التالي من تكنولوجيا التسلسل على علم الوراثة ،" الاتجاهات في علم الوراثة، المجلد. 24 ، لا. 3، pp. 133–141، 2008. عرض على: موقع الناشر | منحة جوجل
  6. S.M Huse ، و J. A. Huber ، و H.G Morrison ، و M.L Sogin ، و D.M Welch ، "دقة وجودة تسلسل الحمض النووي المتوازي بشكل كبير ،" بيولوجيا الجينوم، المجلد. 8 ، لا. 7 ، المقالة R143 ، 2007. عرض في: موقع الناشر | منحة جوجل
  7. "جهاز التسلسل الجديد GS junior" ، http://www.gsjunior.com/instrument-workflow.php. عرض على: الباحث العلمي من Google
  8. "دقة نظام SOLiD ،" http://www.appliedbiosystems.com/absite/us/en/home/applications-technologies/solid-next-generation-sequencing.html. عرض على: الباحث العلمي من Google.
  9. B.A Flusberg ، D.R Webster ، J.H Lee et al. ، "الكشف المباشر عن مثيلة الحمض النووي أثناء الجزيء المفرد ، التسلسل في الوقت الفعلي ،" طرق الطبيعة، المجلد. 7 ، لا. 6 ، ص 461-465 ، 2010.عرض على: موقع الناشر | منحة جوجل
  10. A. Mellmann ، D. Harmsen ، C. A. Cummings et al. ، "التوصيف الجينومي المحتمل لتفشي الإشريكية القولونية الألمانية النزفية المعوية O104: H4 عن طريق تقنية التسلسل السريع للجيل القادم ،" بلوس واحد، المجلد. 6 ، لا. 7 ، معرف المقالة e22751 ، 2011. عرض على: موقع الناشر | منحة جوجل
  11. H. Rohde ، J. Qin ، Y. Cui et al. ، "التحليل الجيني مفتوح المصدر للإشريكية القولونية O104: H4 المنتجة لسموم الشيغا" نيو انغلاند جورنال اوف ميديسين، المجلد. 365 ، لا. 8، pp.718–724، 2011. عرض على: الباحث العلمي من Google
  12. C. S. Chin ، J. Sorenson ، J.B Harris et al. ، "أصل سلالة تفشي الكوليرا في هايتي ،" نيو انغلاند جورنال اوف ميديسين، المجلد. 364 ، لا. 1 ، ص 33-42 ، 2011. عرض على: موقع الناشر | منحة جوجل
  13. W. Timp و U. M. Mirsaidov و D. Wang و J. Comer و A. Aksimentiev و G. معاملات IEEE على تقنية النانو، المجلد. 9 ، لا. 3، pp.281–294، 2010. عرض على: موقع الناشر | منحة جوجل
  14. D. W. Deamer and M. Akeson ، "Nanopores والأحماض النووية: احتمالات التسلسل فائق السرعة ،" الاتجاهات في التكنولوجيا الحيوية، المجلد. 18 ، لا. 4، pp.147–151، 2000. عرض على: موقع الناشر | منحة جوجل
  15. "مقارنة أداء أنظمة تسلسل الجينوم الكامل ،" التكنولوجيا الحيوية الطبيعة، المجلد. 30 ، ص 78-82 ، 2012. عرض على: الباحث العلمي من Google
  16. برانتون ، دي دبليو ديمر ، إيه مارزيالي وآخرون ، "إمكانات وتحديات تسلسل الثقوب النانوية ،" التكنولوجيا الحيوية الطبيعة، المجلد. 26 ، لا. 10، pp. 1146–1153، 2008. View at: Google Scholar
  17. سونغ ، إم آر هوبو ، سي شوستاك ، إس تشيلي ، إتش بايلي ، وجيه إي جوو ، "هيكل المكورات العنقودية & # x3b1-هيموليسين ، مسام غشائية سداسية الشكل ، " علم، المجلد. 274 ، لا. 5294 ، ص 1859-1866 ، 1996. عرض على: موقع الناشر | منحة جوجل
  18. J. Clarke و H.C Wu و L. Jayasinghe و A. Patel و S. Reid و H. Bayley ، "تحديد القاعدة المستمر لتسلسل الحمض النووي أحادي الجزيء ،" تقنية النانو الطبيعة، المجلد. 4 ، لا. 4، pp.265–270، 2009. عرض على: موقع الناشر | منحة جوجل
  19. موقع BGI ، http://www.genomics.org.cn.
  20. O. Skovgaard ، M. Bak ، A. L & # xf8bner-Olesen et al. ، "الاكتشاف على مستوى الجينوم لإعادة ترتيب الكروموسومات ، و indels ، والطفرات في الكروموسومات الدائرية عن طريق تسلسل قراءة قصير ،" أبحاث الجينوم، المجلد. 21 ، لا. 8، pp. 1388–1393، 2011. View at: Google Scholar
  21. J.A Reinhardt، D. A. Baltrus، M. T. Nishimura، W.R Jeck، C.D Jones، and J.L Dangl، “De novo Assembly باستخدام بيانات تسلسل القراءة القصيرة ذات التغطية المنخفضة من مسببات مرض الأرز Pseudomonas syringae pv. oryzae ، " أبحاث الجينوم، المجلد. 19 ، لا. 2 ، ص 294-305 ، 2009. عرض على: موقع الناشر | منحة جوجل
  22. R.E Mills ، K. Walter ، C. Stewart et al. ، "تعيين تباين رقم النسخ حسب تسلسل الجينوم على نطاق السكان ،" طبيعة سجية، المجلد. 470 ، لا. 7332 ، ص 59-65 ، 2011. عرض على: موقع الناشر | منحة جوجل
  23. A. Gnirke ، A. Melnikov ، J. Maguire et al. ، "اختيار الحل المختلط مع قليل النوكليوتيدات الطويلة جدًا للتسلسل المستهدف المتوازي بشكل كبير ،" التكنولوجيا الحيوية الطبيعة، المجلد. 27 ، لا. 2، pp. 182–189، 2009. عرض على: موقع الناشر | منحة جوجل
  24. T.A Fehniger، T. Wylie، E. أبحاث الجينوم، المجلد. 20 ، لا. 11، pp. 1590–1604، 2010. عرض على: موقع الناشر | منحة جوجل
  25. C. Adamidi ، Y. Wang ، D. Gruen et al. ، "تجميع De novo والتحقق من ترانسكريبتوم المستوي عن طريق التسلسل المتوازي الضخم وبروتيوميات البندقية ،" أبحاث الجينوم، المجلد. 21 ، لا. 7 ، ص 1193-1200 ، 2011. عرض على: موقع الناشر | منحة جوجل
  26. J.C Marioni و C.E Mason و S.M Mane و M. Stephens و Y. Gilad ، "RNA-seq: تقييم التكاثر التقني والمقارنة مع مصفوفات التعبير الجيني ،" أبحاث الجينوم، المجلد. 18 ، لا. 9، pp.1509–1517، 2008. عرض على: موقع الناشر | منحة جوجل
  27. J.R Bradford، Y. Hey، T. Yates، Y. Li، S.D Pepper، and C.J Miller، "مقارنة بين تسلسل النوكليوتيدات المتوازي على نطاق واسع مع المصفوفات الدقيقة قليلة النوكليوتيد لتوصيف النسخ العالمي ،" علم الجينوم BMC، المجلد. 11 ، لا. 1 ، المادة 282 ، 2010. عرض على: موقع الناشر | منحة جوجل
  28. جونسون ، أ. مرتضوي ، آر إم مايرز ، ب. وولد ، "رسم خرائط على مستوى الجينوم لتفاعلات البروتين والحمض النووي في الجسم الحي ،" علم، المجلد. 316 ، لا. 5830 ، الصفحات من 1497 إلى 1502 ، 2007. عرض على: موقع الناشر | منحة جوجل
  29. H. Gu و Z.D.Smith و C. Bock و P. Boyle و A. Gnirke و A. Meissner ، "إعداد مكتبات تسلسل تمثيل ثنائي كبريتات التمثيل المنخفض لتوصيف مثيلة الحمض النووي على نطاق الجينوم ،" بروتوكولات الطبيعة، المجلد. 6 ، لا. 4، pp.468–481، 2011. عرض على: موقع الناشر | منحة جوجل
  30. L. Liu و N. Hu و B. Wang et al. ، "تقرير استخدام موجز عن جهاز التسلسل Illumina HiSeq 2000 ،" علم الفطريات، المجلد. 2 ، لا. 3، pp. 169–191، 2011. View at: Google Scholar

حقوق النشر

حقوق النشر & # xa9 2012 Lin Liu et al. هذا مقال مفتوح الوصول يتم توزيعه بموجب ترخيص Creative Commons Attribution License ، والذي يسمح بالاستخدام غير المقيد والتوزيع والاستنساخ في أي وسيط ، بشرط الاستشهاد بالعمل الأصلي بشكل صحيح.


ما هو تسلسل الجيل القادم؟

باختصار ، نفس الشيء بالضبط. ضع في اعتبارك هذا التعريف:

"يشير تسلسل الجيل التالي إلى تقنيات تسلسل الحمض النووي عالية الإنتاجية التي لا تعتمد على سانجر. ويمكن تسلسل الملايين أو المليارات من خيوط الحمض النووي بالتوازي ، مما ينتج عنه إنتاجية أكبر بكثير ويقلل من الحاجة إلى أساليب استنساخ الشظايا التي غالبًا ما تستخدم في تسلسل سانجر للجينوم ".
& ndash Nature.com

يتم استخدام المصطلحين بالتبادل. تاريخياً ، تم استخدام تسلسل الجيل التالي كمصطلح جامع لتسلسل الحمض النووي عالي الإنتاجية. ومع ذلك ، على مدى السنوات القليلة الماضية ، بدأ مصطلح MPS يحظى بتبني أوسع بين علماء الطب الشرعي.


تسلسل أشباه الموصلات الأيونية (تسلسل أيون تورنت)

على عكس Illumina و 454 ، لا يستفيد تسلسل Ion torrent و Ion proton من الإشارات الضوئية. وبدلاً من ذلك ، فإنهم يستغلون حقيقة أن إضافة dNTP إلى بوليمر DNA يطلق H + أيون.

يتم تقطيع عينة الحمض النووي للتسلسل إلى أجزاء. تُستخدم المحولات لالتقاط جزيئات مفردة من القالب على الميكروبيدات عن طريق التهجين التمهيدي. يتم دمج الخرزات في مستحلب يتم التحكم فيه بعناية ، حيث تشكل كل فقاعة مفاعلًا دقيقًا يحتوي على قالب DNA وبادئة وكواشف لـ PCR. بعد التضخيم ، يتم تغليف كل حبة بجزيئات مضخمة نسليًا.

تتدفق كل حبة عبر رقاقة وتودع في بئر. الرقاقة مغمورة بواحدة من أربعة dNTP. عندما يتم دمج نيوكليوتيد في خيط واحد من الحمض النووي ، يتم إطلاق أيون الهيدروجين. يقرأ نظام Ion Torrent هذا التغيير الكيميائي مباشرة على الشريحة باتباع تغيرات الأس الهيدروجيني للمحلول في البئر. طبقة حساسة للأيونات أسفل البئر تقيس تغير درجة الحموضة وتحولها إلى جهد. يتم تسجيل هذا التغيير في الجهد مشيرًا إلى أن النيوكليوتيد قد تم دمجه وتم استدعاء القاعدة. الجهد المسجل يتناسب مع كمية H + الصادرة. تتكرر العملية في كل دورة بغسل النوكليوتيدات المختلفة على الرقاقة.

  • استجواب أكثر من 100 جين في وقت واحد بتكلفة فعالة
  • العثور على متغيرات جديدة عن طريق زيادة عدد الأهداف المتسلسلة في جولة واحدة.
  • عينات التسلسل التي تحتوي على كميات إدخال منخفضة من مادة البداية ، باستخدام ، على سبيل المثال ، إعداد مكتبة Ion AmpliSeq ، والذي يتطلب أقل من 10 نانوغرام من إدخال الحمض النووي
  • تسلسل الجينومات الميكروبية من أجل التصنيف الفرعي لمسببات الأمراض لتمكين البحث عن حالات التفشي الحرجة

طريقة سانجر لتسلسل الحمض النووي (لاحظ أنه في الساعة 0:30 يوجد خطأ ، فإن التمهيدي يصلب إلى نهاية 3 & # x27 للحمض النووي ، وليس 5 & # x27 كما هو موضح في الفيديو ، لأن البوليميراز يضيف النوكليوتيد إلى 3 & # x27 نهاية حبلا DNA)


شاهد الفيديو: Parents Who Instantly Regretted Having A Baby - Part 1 (كانون الثاني 2023).