معلومة

لماذا تسبب محتوى A + T العالي في حدوث مشاكل لمشروع جينوم Plasmodium falciparum؟

لماذا تسبب محتوى A + T العالي في حدوث مشاكل لمشروع جينوم Plasmodium falciparum؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

الورقة الرئيسية لملف المتصورة الحنكية أشار مشروع الجينوم (Gardner et al.، 2002) مرارًا وتكرارًا إلى أن محتوى A + T المرتفع بشكل غير عادي (حوالي 80٪) من الجينوم يسبب مشاكل. على سبيل المثال ، يشيرون إلى أنه منعهم من استخدام نهج استنساخ تلو الآخر:

أيضًا ، لم يتم أبدًا إنشاء مكتبات إدراج كبيرة عالية الجودة من الحمض النووي الغني بالـ P.

وأنه جعل الشرح الجيني صعبًا:

لا يمكن تحديد أصل العديد من الجينات المشتقة من العضيات المرشحة بشكل قاطع ، ويرجع ذلك جزئيًا إلى المشكلات الكامنة في تحليل الجينات ذات المحتوى العالي جدًا (A + T).

سؤال:
ما هي الأهمية البيولوجية لمحتوى A + T العالي ، ولماذا يسبب مشاكل في تسلسل الجينوم؟

المرجع:
Gardner، MJ، Hall، N.، Fung، E.، White، O.، Berriman، M.، Hyman، RW، Carlton، JM، Pain، A.، Nelson، KE، Bowman، S.، Paulsen، IT، جيمس ، ك ، آيزن ، جا ، رذرفورد ، ك ، وآخرون. (2002) تسلسل جينوم طفيلي الملاريا البشري المتصورة المنجلية. طبيعة سجية. 419 (6906) ، 498-511.


تتمتع تقنيات التسلسل التي تم تطويرها في العشرين عامًا الماضية بمجموعة من الاستخدام الأمثل بمتوسط ​​معدل A + T / G + C. تعتبر كل من المناطق الغنية بأجهزة AT والغنية بالـ GC معقدًا للمعالجة من خلال تقنيات التسلسل المختلفة. لكل تقنية نطاقات استخدام مختلفة ، ولكن لتسمية واحدة ، تفضل تقنية Illumina التسلسلات في النطاق المتوسط. إذا حاولت تسلسل جينوم غني بـ AT باستخدام بروتوكول Illumina القياسي ، فسوف تقوم بتسلسل جينوم غير مكتمل ، لا تمثل أجزاء منه انعكاسًا مثاليًا للجينوم الأصلي الكامل. تزعم التقنيات الأخرى أنها غير متحيزة تمامًا لمحتوى النيوكليوتيدات. تعد Pacific Biosciences إحداها ، ويبدو أن الناس يتفقون على هذا الادعاء ، بعد تحليل البيانات التي تنتجها أجهزتهم. تدعي شركة Oxford Nanopore Technologies أنها لا تمتلك أي تحيزات تقريبًا ، ولكن اعتبارًا من اليوم (2012-06-13) ، لا يوجد تأكيد على ذلك من خلال التحليلات الخارجية.

بالإضافة إلى مشاكل التسلسل ، قد يكون البرنامج المستخدم لتجميع التسلسلات والتعليق عليها أيضًا عرضة للأخطاء في المناطق الغنية بـ AT و GC. لكن العديد من هذه المشاكل تنبع من عدم اكتمال التسلسل.


لا يمكنني التعليق على كيفية قيام ثراء A + T بتعقيد عملية التسلسل نفسها ، لكن يمكنني التعليق على المضاعفات التي تنشأ عند التعليق على التسلسل. بداية غالبًا ما تعتمد تنبؤات الجينات على نماذج ماركوف المخفية الحساسة جدًا للتكوين الأساسي في الجينوم (ثنائي نيوكليوتيدات ، ثلاثي نيوكليوتيدات ، إلخ). عادةً ما يكون أداء مكتشفو الجينات ضعيفًا جدًا إذا تم تشغيلهم على جينوم له تركيبة أساسية مختلفة كثيرًا عن تلك التي تم التدريب عليها. قد يفسر هذا بعض الصعوبة التي يواجهونها في تحليل الجينات في الجينوم.


غالبًا ما يتضمن التسلسل خطوة من تضخيم المادة الجينومية. الطريقة القياسية للقيام بذلك هي باستخدام تفاعل البوليميراز المتسلسل ، لكن تفاعل البوليميراز المتسلسل متحيز ولا يؤدي إلى تضخيم المناطق الغنية جدًا بـ AT جيدًا. مع جولات متعددة من تفاعل البوليميراز المتسلسل ، قد تهيمن حتى المناطق منخفضة الوفرة التي ليست غنية بـ AT على العينة وإخفاء التسلسلات الغنية بـ AT.

هذه ليست مشكلة لتسلسل de novo فقط ، ولكن للعديد من التقنيات القائمة على التسلسل (RNA-seq ، ChIP-seq ، التسلسل المفضل لديك ...). تم استخدام طرق بديلة في البلازموديوم ، لكنها ليست قياسية (حتى الآن؟).

انظر ، على سبيل المثال ، يحدد H2A.Z المناطق الجينية من Epigenome المتصورة المنجلية التي تم تمييزها ديناميكيًا بواسطة H3K9ac و H3K4me3 على http://www.plospathogens.org/article/info:doi/10.1371/journal.ppat.1001223


في الماضي ، قبل التسلسل المتوازي على نطاق واسع ، قاموا بإنشاء مكتبة من التسلسلات المستنسخة وحولوها إلى بكتريا قولونية. يصعب الحفاظ على تسلسلات AT العالية بكتريا قولونية (ربما بسبب التشابه مع المروجين؟).


لقد قيل الكثير بالفعل في الإجابات السابقة ، لذا سأضيف بإيجاز مشكلتين محتملتين مع تحيز قوي لـ AT / CG:

1) احتمال انزلاق البوليميراز بسبب البوليمرات المتجانسة: يؤدي هذا إلى حدوث أخطاء بشكل عام لأنه قد يكون لديك indels غير المرغوب فيه في القراءات بالإضافة إلى دمج قواعد غير صحيحة تمامًا. هذه مشكلة يمكن أن تحدث حتى مع PCR (على الرغم من وجود الكثير من الخيارات الآن إذا كنت تريد الإنفاق). لذلك بشكل عام معدلات خطأ أعلى وفشل قراءة أعلى.

2) صعوبة الآلة في فصل إشارات النيوكليوتيدات الفردية لـ SANGER (يتم تشويشها جميعًا) أو أخطاء المعايرة مع تسلسل الجيل التالي. فشل قراءة أعلى (جودة سيئة).

3) بافتراض أن كل شيء على ما يرام الآن ، فإن المناطق الأقل تعقيدًا يمكن أن يكون من الصعب جدًا تعيينها ، ناهيك عن تجميع جينوم كامل من البداية.

أتمنى أن يساعدك هذا!


التنميط التعبير عن مراحل schizont و trophozoite المتصورة المنجليةمع ميكروأري طويل قليل النوكليوتيد

استمرار مقاومة الأدوية في جميع أنحاء العالم المتصورة المنجلية، وهي أكثر أنواع الملاريا التي تصيب البشر فتكًا ، وهي مصدر قلق للصحة العالمية. ال المتصورة المنجلية جلب مشروع التسلسل فرصًا جديدة لتحديد الأهداف الجزيئية للأدوية المضادة للملاريا وتطوير اللقاح.

نتائج

قمنا بتطوير حزمة برامج ، ArrayOligoSelector ، لتصميم إطار قراءة مفتوح (ORF) - مصفوفة دقيقة للحمض النووي باستخدام البرنامج المتاح للجمهور المتصورة المنجلية تسلسل الجينوم. تم تمثيل كل جين بواحد أو أكثر من قليل النوكليوتيدات الطويلة التي يبلغ طولها 70 ميكرًا والتي تم اختيارها على أساس التفرد داخل الجينوم ، واستبعاد التسلسل منخفض التعقيد ، والتكوين الأساسي المتوازن ، والقرب من النهاية 3. مصفوفة ميكروأري من الجيل الأول تمثل ما يقرب من 6000 وحدة معالجة ORFs من المتصورة المنجلية تم بناء الجينوم. تم تقييم أداء المصفوفة من خلال استخدام مجموعات oligonucleotide للتحكم مع مستويات متزايدة من الطفرات المدخلة ، بالإضافة إلى النشاف الشمالي التقليدي. باستخدام هذه المجموعة ، قمنا على نطاق واسع بتمييز ملف تعريف التعبير الجيني لمراحل trophozoite داخل كرات الدم ومراحل schizont من المتصورة المنجلية. كشفت النتائج عن تنظيم نسخ مكثف للجينات المتخصصة في العمليات الخاصة بهاتين المرحلتين.

الاستنتاجات

المصفوفات الدقيقة للحمض النووي المبنية على أليغنوكليوتيدات طويلة هي أدوات قوية للتعليق التوضيحي الوظيفي واستكشاف المتصورة المنجلية الجينوم. كشف التنميط التعبيري عن النواشط والشيزونتس عن جينات مرتبطة بعمليات خاصة بمرحلة معينة وقد تكون بمثابة أساس لأهداف الأدوية المستقبلية وتطوير اللقاح.


خلفية

المتصورة النشيطة هي الملاريا البشرية الأكثر انتشارًا وهي مسؤولة عن 70 & # x0201380 مليون حالة سريرية كل عام وأعباء اجتماعية واقتصادية كبيرة لبلدان مثل البرازيل والهند ، حيث أنها أكثر الأنواع انتشارًا [1]. للأسف ، بسبب مشكلة الحفاظ على هذا الطفيل بشكل مستمر في المختبر الثقافة ، وحقيقة أن الملاريا النشيطة ليست مهددة للحياة مثل الملاريا المنجلية ، وانخفاض الطفيليات المرتبطة بالعدوى البشرية الطبيعية وصعوبة تكييف العزلات الحقلية مع النمو في القرود ، P. النشيطة لا تزال مهملة إلى حد كبير. علاوة على ذلك ، فإن الخصوصية الصارمة للأنواع للاستجابات المناعية الواقية المضادة للملاريا المكتسبة بشكل طبيعي ، تجعل من غير المحتمل أن يكون اللقاح ضد المتصورة المنجلية سوف تكون نشطة ضد P. النشيطة. تتطلب هذه البيانات معًا بذل جهد بحثي شامل للدراسة P. النشيطة.

تم استخدام نهج علم الجينوم لتسريع اكتشاف الجينات في P. النشيطة من خلال إنشاء مكتبة في كروموسومات الخميرة الاصطناعية باستخدام طفيليات تم الحصول عليها مباشرة من مريض بشري [2]. في الواقع ، كشف تسلسل YAC 155،771 نقطة أساس تيلوميرية من هذه المكتبة عن وجود عائلة متعددة الجينات يطلق عليها فير (P. النشيطة الجينات المتغيرة). فير من المحتمل أن تكون الجينات متورطة في التهرب المناعي وتمثل 15 & # x0201320 ٪ من إجمالي محتوى الجين للطفيلي بافتراض وجود فير عدد نسخ الجين 600 & # x020131000 نسخة لكل جينوم فردي [3]. حدد التسلسل الإضافي لاستنساخ YAC الداخلي البالغ 199،866 نقطة أساس من هذه المكتبة نفسها 41 جينًا في التخليق المحفوظ مع منطقة من الكروموسوم 3 في المتصورة المنجلية، لكنه وجد أن تسلسل YAC يفتقر إلى أخصائي تقويم العظام المتصورة المنجلية الجينات التي ترمز للأنماط الظاهرية للتراكم الخلوي داخل نفس المنطقة [4].

تحليل تسلسل واسع النطاق لمكتبتين من الحمض النووي الجيني المهضوم نوكلياز المونج: مكتبة Pv MBN من سلالة Belem [5] ومكتبة Pv MBN # 30 من سلالة Salvador I [6] ، سرعت أيضًا اكتشاف الجينات في P. النشيطة. في الواقع ، مقارنة في السيليكو تحليلات تسلسل GSS من هاتين المكتبتين مع تسلسل GSS و ESTs من مكتبات المتصورة المنجلية و المتصورة البرغي، بنسبة لا تقل عن 10 أضعاف العدد المتوقع P. النشيطة الجينات. المشاكل التقنية مع استخراج بولي (A) مرنا من P. النشيطةومع ذلك ، فقد أعاقت بناء مكتبات (كدنا) للطفيلي المخصص لتسلسل عالي الإنتاجية [6]. بيانات عن ESTs لـ P. النشيطة لذلك ، هناك حاجة للتحقق من صحة هذه التنبؤات الجينية وإنشاء فهرس جيني لطفيلي الملاريا هذا. الأهم من ذلك ، البيانات عن ESTs من P. النشيطة سيكون مفتاحًا للمساعدة في شرح جينوم سلالة السلفادور الأولى المتسلسلة حاليًا لتغطي خمسة أضعاف بواسطة TIGR [7].

بناء أ P. النشيطة تم الإبلاغ مؤخرًا عن مكتبة (كدنا) التي تم الحصول عليها باستخدام مواد طفيليات تم جمعها مباشرة من 10 مرضى بشريين مختلفين في منطقة الأمازون البرازيلية [8]. تقدم هذه الورقة دراسة استقصائية عن ESTs من هذه المكتبة ، والتي تتضمن تحليلات التشابه والتعليقات التوضيحية وتخصيص مصطلحات علم الوجود الجيني.


لماذا تسبب محتوى A + T العالي في حدوث مشاكل لمشروع جينوم Plasmodium falciparum؟ - مادة الاحياء

طفيلي الملاريا المتصورة المنجلية يواجه التغيرات التناضحية الجذرية أثناء ممرات الكلى ويشارك في التخليق الحيوي الضخم للجليسيروليبيدات أثناء تطورها في مرحلة الدم. حددنا أكواجليسروبورين واحد (PfAQP) في جينوم شبه مكتمل المتصورة المنجلية بأعلى تشابه مع الإشريكية القولونية ميسر الجلسرين (50.4٪) ، ولكن تم تغيير كل من الأشكال الأساسية Asn-Pro-Ala (NPA) في منطقة المسام إلى Asn-Leu-Ala (NLA) و Asn-Pro-Ser (NPS) ، على التوالي. التعبير في Xenopusتجعلها البويضات شديدة النفاذية لكل من الماء والجلسرين. كحول السكر يصل إلى خمسة ذرات كربون واليوريا تمر عبر المسام. أظهرت تحليلات الطفرات لأشكال NLA / NPS أهميتها الهيكلية ، ولكن تم الحفاظ على خصائص المسام المتماثلة. يتم التعبير عن PfAQP في طفيليات مرحلة الدم خلال التطور من الحلقات عبر trophozoites إلى schizonts ويتم توطينه للطفيلي ولكن ليس في سيتوبلازم كريات الدم الحمراء أو الغشاء. تشير وظيفتها الثنائية الفريدة إلى وظائف في الحماية من الإجهاد التناضحي وتوفر بكفاءة الوصول إلى تجمع الجلسرين في الدم لاستخدامه في توليد ATP وبشكل أساسي في تخليق الفوسفوليبيد.

نُشرت ، JBC Papers in Press ، 29 نوفمبر 2001 ، DOI 10.1074 / jbc.M110683200

تم دعم هذا العمل من قبل Deutsche Forschungsgemeinschaft و Fonds der Chemischen Industrie. تم تحمل تكاليف نشر هذا المقال جزئيًا عن طريق دفع رسوم الصفحة. لذلك يجب وضع علامة على المقالة بموجب هذا "الإعلانات"وفقًا لـ 18 U.S.C. القسم 1734 فقط للإشارة إلى هذه الحقيقة.

تم تقديم تسلسل (تسلسلات) النوكليوتيدات المذكورة في هذه الورقة إلى GenBank ™ / EBI Data Bank مع رقم (أرقام) الدخول.


شجرة الحياة

قبل أيام قليلة تلقيت بريدًا إلكترونيًا من زميل لم أره منذ سنوات عديدة. كان من مالكولم جاردنر الذي عمل في TIGR عندما كنت هناك وهو الآن في سياتل بيوميد.

كان بريده الإلكتروني مرتبطًا بنشر عام 2002 لتسلسل الجينوم الكامل لـ المتصورة المنجلية - العامل المسبب لمعظم حالات الملاريا البشرية - والتي كان المؤلف الرئيسي لها. أرسل شخص ما بريدًا إلكترونيًا إلى مالكولم يسأل عما إذا كان بإمكانه تقديم تفاصيل حول الإعدادات المستخدمة في عمليات البحث عن الانفجار التي كانت جزءًا من التحليلات التطورية للورقة. الصحيفة متاحة مجانًا في Nature - على الأقل في الوقت الحالي - يبدو أن مجموعة Nature Publishing Group تضعها وراء جدار حماية على الرغم من وعودها بعدم القيام بذلك.

كان مالكولم يتصل بي لأنني قمت بتشغيل / تنسيق الكثير من التحليل التطوري المذكور في تلك الورقة. ألاحظ - كواحد من التطور الوحيد الذي يركز على الأشخاص في TIGR ، كان من الشائع جدًا أن يأتي الناس إلي ويسألون عما إذا كان بإمكاني مساعدتهم في الجينوم الخاص بهم. لطالما قلت نعم منذ ذلك الحين ، حسنًا ، لقد أحببت القيام بهذا النوع من الأشياء وكان من المثير حقًا في الأيام الأولى لتسلسل الجينوم أن أكون أول شخص يطرح بعض الأسئلة المتعلقة بالتطور حول البيانات.


قام مالكولم بتضمين البريد الإلكتروني الذي تلقاه (والذي لم يكن يحتوي على الكثير من التفاصيل) وكتبنا أنا وهو مرارًا وتكرارًا في محاولة لمعرفة ما يريده هذا الشخص بالضبط. ثم قلت ، حسنًا ، ربما يجب على الشخص أن يتواصل معي مباشرة حتى أتمكن من معرفة ما يريده / يحتاج إليه حقًا. بدا من غير المعتاد أن يسأل أحدهم عن شيء من هذا القبيل من جريدة عمرها 10 سنوات ، ولكن ، أيا كان.

عندما كنت أتواصل مع هذا الشخص ، بدأت في البحث في ملفاتي وعقلي محاولًا أن أتذكر بالضبط ما تم إنجازه لهذه الورقة منذ أكثر من 10 سنوات. أتذكر مالكولم وآخرين من المتصورة يقوم المجتمع بتنظيم بعض "المخيمات" التي تبحث في شرح الجينوم. في أحد تلك المخيمات ، التقيت ببعض الأشخاص من مركز سانجر (الذي كان أحد أكبر اللاعبين في المتصورة المنجلية تسلسل الجينوم) مع مالكولم - وبعد بعض المناقشات انتهى بي الأمر إلى القيام بثلاثة أشياء رئيسية تتعلق بالورقة ، والتي أصفها أدناه.

الشيء الأول: جينات حقيقيات النوى المحفوظة

كان أحد تحليلاتي هو استخدام الجينوم للبحث عن الجينات المحفوظة في حقيقيات النوى ولكنها غير موجودة في البكتيريا أو العتائق. فعلت هذا لمحاولة العثور على الجينات التي يمكن اعتبارها على الأرجح قد اخترعت في الفرع التطوري المؤدي إلى السلف المشترك لحقيقيات النوى.

جانبا ، في نفس الوقت تقريبا طُلب مني كتابة أخبار وآراء من أجل الطبيعة حول نشر شيزوساكارومايس بومب الجينوم. في N & ampV كتبت "تسلسل الجينوم: Brouhaha على الخميرة الأخرى" لاحظت كيف استخدم المؤلفون الجينوم لإجراء بعض التحليلات المثيرة للاهتمام للجينات المحفوظة حقيقية النواة. بمساعدة موظفي Nature ، صنعت أيضًا رقمًا يوضح (نوعًا ما) ما كانوا يحاولون القيام به في تحليلهم - وهو العثور على الجينات التي نشأت في الفرع المؤدي إلى السلف المشترك لحقيقيات النوى التي من أجلها كانت الجينوم متاحة في ذلك الوقت. جانبا آخر - S. بومبي ورقة الجينوم ومقالة الأخبار والآراء الخاصة بي متاحة مجانًا.

الشكل 1: شجرة الحياة ، مع تصنيف الفروع وفقًا لتحليل وود وآخرين للجينات التي قد تكون خاصة بحقيقيات النوى مقابل بدائيات النوى ، وللكائنات متعددة الخلايا مقابل الكائنات أحادية الخلية. البكتيريا والعتائق هي بدائيات النوى (ليس لديهم نوى). من الطبيعة 415 ، 845-848 (21 فبراير 2002) | دوى: 10.1038 / nature725. يعتمد الجزء حقيقيات النوى من الشجرة على Baldauf et al. 2000.

على أي حال ، أجريت تحليلًا مشابهًا لما كان موجودًا في S. بومبي ورقة الجينوم ووجدت عددًا معقولًا وساعدت في كتابة قسم للورقة حول هذا.

قائمة الجينات متاحة كمواد تكميلية على موقع Nature على الويب. للأسف هو في تنسيق MS Word وهو ليس الشيء الأكثر فائدة. لكن المزيد عن هذه المسألة في نهاية هذا المنشور.

الشيء الثاني: البحث عن ازدواجية نسب معينة

جانب آخر من التحليل الجينومي المقارن الذي اعتدت القيام به لمعظم الجينومات في TIGR هو البحث عن التكرارات المحددة للنسب (على سبيل المثال ، الجينات التي خضعت لتكرار في سلالة الأنواع قيد الدراسة مع استبعاد السلالات التي توجد لها الجينومات الأخرى متوفرة). كانت الطريقة السريعة والقذرة التي استخدمناها للقيام بذلك هي البحث ببساطة عن الجينات التي لها انفجار أفضل مع جين آخر من جينومها الخاص أكثر من الجينات الموجودة في أي جينوم آخر. يتم أيضًا توفير قائمة الجينات التي حددناها بهذه الطريقة كمستند Word في مواد تكميلية.

الشيء الثالث: البحث عن الجينات المشتقة من العضية في الجينوم النووي لـ المتصورة المنجلية

الشيء 4: تحليل جينات إصلاح الحمض النووي

حللت أنا و Arnab Pain من مركز سانجر الجينات التي يُتوقع مشاركتها في عمليات إصلاح الحمض النووي وإعادة التركيب وكتبنا قسمًا للورقة:

للأسف ، لا يمكنني العثور على المعلمات الأخرى التي استخدمتها في عمليات البحث التفجيرية طوال حياتي. أنا متأكد بنسبة 99.9999 ٪ من أنني استخدمت الإعدادات الافتراضية ولكن للأسف ، لا أعرف ما هي الإعدادات الافتراضية للانفجار في تلك الحقبة. ولست متأكدًا حتى من إصدار blastp الذي تم تثبيته على أنظمة كمبيوتر TIGR في ذلك الوقت. أنا بالتأكيد بحاجة إلى القيام بعمل أفضل للتأكد من أن كل ما أفعله قابل للتكرار حقًا.

قابلية اعادة الأنتاج

كل هذا يقودني إلى الجزء الحقيقي الفعلي من هذه القصة. قابلية اعادة الأنتاج. إنها صفقة كبيرة. يجب أن يكون أي شخص قادرًا على إعادة إنتاج ما تم القيام به في الدراسة. وللأسف ، من الصعب القيام بذلك عندما لا يتم وصف جميع الطرق بشكل كامل. ويجب على المرء أيضًا تقديم نتائج وسيطة حتى لا يضطر الأشخاص إلى إعادة كل ما فعلته في الدراسة ، ولكن يمكنهم فقط إعادة إنتاج جزء منه. سيكون من الجيد ، على سبيل المثال ، إطلاق جميع أشجار النشوء والتطور من تحليل الجينات العضوية في المتصورة. للأسف ، لا يبدو أنني أمتلك كل هذه الملفات حيث تم تخزينها في دليل في TIGR مخصص لمشروع الجينوم هذا ، ولأنني لم أعد في TIGR ، فليس لدي وصول جاهز إلى هذه المواد. ربما لا يزال يتسكع في مكان ما على أنظمة الكمبيوتر JCVI (TIGR ، للأسف ، لم يعد موجودًا رسميًا. ابتلعه معهد J. Craig Venter). لكنني سأستمر في الحفر وسأنشرها في مكان ما مثل FigShare إذا / عندما أجدها.

ربما الأهم من ذلك ، سأعمل مع مختبري للتأكد من أننا في المستقبل نخزن / نسجل / نوفر كل شيء من شأنه أن يسمح للناس بإعادة إنتاج ، وإعادة تحليل ، وإعادة تشغيل ، وإعادة أي شيء من أوراقنا.

الدرس الأساسي - خطط مسبقًا لكيفية مشاركة النتائج والأساليب والبيانات وما إلى ذلك.


تقلب تسلسل الترميز

بعد ملاحظة أن المظاهر السريرية للملاريا المستحثة علاجي المنشأ ، تستخدم في علاج اللولبية الشاحبة تباينت العدوى اعتمادًا على العزلات التي تم الحصول عليها من قارات مختلفة وأسفرت عن مناعة خاصة بالأنواع والخاصة بالعزلة ، نشأ مفهوم التنوع البلازميدي لأول مرة. كانت الألوزيمات والبروتينات المستضدية ، ولا سيما المتغيرات من إيزوميراز جلوكوز فوسفات الطفيل (GPI) و LDH (21) ، أول المتغيرات البلازمية التي تم التعرف عليها. تم الكشف عن متغيرات من هذه الإنزيمات في مرضى الملاريا الأفراد ، مما يثبت وجود عدوى مختلطة مع اختلاف المتصورة المنجلية الحيوانات المستنسخة في الأفراد الفرديين. تم بعد ذلك توضيح التباين الأليلي والاختلافات الجغرافية للعديد من الجينات في دراسة أجريت على المتصورة المنجلية عزلات من آسيا وأفريقيا وأمريكا الجنوبية (30) ، ويمكن تمييز البروتينات المتغيرة مع الأجسام المضادة وحيدة النسيلة.

LSA-1 ، مرشح رئيسي للقاح الوحدة الفرعية ، هو بروتين 200 كيلو دالتون يتم التعبير عنه خلال مرحلة الكبد من المتصورة المنجلية وتراكمت في فجوة الطفيليات. لقد أظهر اثنان من حاتمات LSA-1 تحفيز استجابات الخلايا التائية السامة للخلايا في ناقلات متغيرات HLA-B معينة. يحتوي الترميز الجيني لـ LSA-1 على منطقة تكرار مركزية كبيرة وتسلسلات غير متكررة ترميز طرفي N و C للبروتين. بيانات التسلسل الخاصة بجين الترميز محدودة ، ومع ذلك ، من المعروف أن الطفرات غير المترادفة تحدث عند طرفي N و C- طرفي.


نتائج

تصميم وتجميع الجين الاصطناعي

تصميم oligos المستخدم لتركيب 2.1 كيلو بايت pfsub-1 استلزم الجين اهتمامًا كبيرًا بالتفاصيل ، بسبب الحاجة إلى خلط عدد كبير في PCR واحد. تم تصميم تسلسل النوكليوتيدات للجين وفقًا لـ P. باستوريس تفضيل استخدام الكودون (Bennetzen and Hall ، 1982 Sreekrishna وآخرون.، 1993). بالإضافة إلى ذلك ، تم فحص لوحة oligos بدقة ومطابقتها من أجل تلبية المعايير التالية: (1) انخفاض في محتوى A + T الإجمالي مع التخلص من إشارات إنهاء النسخ المحتملة (2) التخلص من التسلسلات المتجانسة المؤدية إلى الاستقرار دبابيس الشعر داخل الجزيئية (3) التقليل من التكرارات الترادفية أو المقلوبة (& lt10 bp في الطول) والتي من المحتمل أن تؤدي إلى تمهيد غير محدد و (4) تحسين التداخل 20 نيوكليوتيد بين كل 40 مير التمهيدي ، لإعطاء درجة حرارة انصهار في النطاق 58-62 درجة مئوية ، من أجل السماح بالاستخدام اللاحق للبادئات لتسلسل الحمض النووي. تم دمج تسلسل بدء ترجمة توافق Kozak في أقصى 5 oligo للتعبير الفعال للجين في P. باستوريس وتم إدخال خمسة أكواد هيستيدين إضافية قبل كودون الإيقاف في أقصى 3 ′ oligo. تم إدخال عدد من مواقع التقييد الفريدة في مواقع استراتيجية في جميع أنحاء الجين الاصطناعي لتسهيل معالجة الجينات اللاحقة والطفرات. تم تنفيذ تصميم Oligo بمساعدة برنامج تحسين كودون Unix CODOP (انظر المواد والأساليب). يقوم هذا البرنامج بترجمة تسلسل DNA معين إلى تسلسل بروتين ثم ، باستخدام جدول استخدام كودون محدد من قبل المستخدم ، يقوم بترجمة تسلسل البروتين مرة أخرى مع استخدام كودون محسّن. يرفض البرنامج الكودونات ذات الوفرة التي تقل عن قيمة القطع ، ثم يعين كودون عالي الوفرة لكل بقايا في تسلسل البروتين ، باستخدام أكواد وفرة عالية بما يتناسب مع استخدامها في جدول استخدام الكودون. يتم بعد ذلك تقسيم كلا خيوط التسلسل إلى قلة صغيرة متداخلة من 40 قاعدة في الطول ، ويتم حساب درجات حرارة الانصهار لجميع التداخلات ويتم عرض مواقع التقييد التي تم إنشاؤها على طول التسلسل. ثم تم تحليل اللوحة الناتجة من oligos باستخدام حزمة برامج Genetics Computer Group (GCG الإصدار 8-Unix) لوجود التكرارات غير المرغوب فيها والتكرارات المقلوبة وهياكل الحلقة ومناطق التكامل التي يمكن أن تؤدي إلى تهجين جزيئي غير محدد. في معظم الحالات ، تم التخلص من هذه التسلسلات بسهولة مع الحفاظ على تفضيل الكودون. تم اللجوء إلى الكودونات غير المثلى فقط إذا لزم الأمر لإنشاء مواقع تقييد فريدة أو بتسلسلات متكررة. أدى الاستخدام المنتظم والمتكرر لهذين البرنامجين إلى الاختيار النهائي لـ 104 أوليجوس فريد من نوعه لتخليق الجينات. يوضح الجدول الأول مقارنة بين تركيبة الكودون للجين الاصطناعي وتكوين النوع البري المتصورة المنجلية الجين. الكودونات غير الموجودة في جينات الخميرة المعبر عنها بشكل كبير قد انخفضت بشكل كبير في التردد وتم التخلص من عدد من الكودونات النادرة جدًا. على سبيل المثال ، تمت إزالة 31 كودون ATA (Ile) و 49 كودون AAA (Lys) الموجودة في الجين الأصلي تمامًا. تم تخفيض تركيبة A + T الكلية من 72٪ في الجين الأصلي إلى 53٪ في المنتج الصناعي. التسلسل النهائي المُحسَّن للكودون للتركيبات الاصطناعية pfsub-1 يظهر التسلسل والمواضع النسبية لـ 104 oligos في الشكل 1 مع تسلسل الأحماض الأمينية المتوقعة.

تضمن تفاعل التجميع الأولي (الشكل 2) بناء جين كامل الطول من خليط متكافئ من 104 oligos. تم بعد ذلك استخدام جزء من خليط تفاعل التجميع كقالب لعملية التضخيم ، حيث تمت إضافة البادئين الخارجيين فقط للتجميع ، بتركيز 1 ميكرومتر لكل منهما. الإنتاجية المثلى لمنتجات PCR باستخدام Pfu تم الحصول على بوليميريز الحمض النووي باستخدام 3 ملي مولار MgSO4 في PCR. كشف تحليل PCRs على 1 ٪ من المواد الهلامية agarose عن وجود المنتج المتوقع 2.1 كيلو بايت (الشكل 3 أ). في نهج بديل ، تم تصنيع النصفين 5 و 3 من الجين بشكل منفصل ، في شكل جزأين من الحمض النووي 1.1 و 1 كيلو بايت ، على التوالي (الشكل 3 ب). ظلت ظروف تفاعل البوليميراز المتسلسل (PCR) لتفاعل التجميع دون تغيير ، على الرغم من أن عدد قليل من القلة في كل مجموعة انخفض إلى 56 و 50 ، على التوالي ، لكل تفاعل. تم ربط منتجات الحمض النووي الاصطناعية بنهاية حادة pMosالأزرق للاستنساخ والتسلسل. لتسلسل التفاعلات ، تهجين الاشعال للمواقع

تم اختيار 400 نقطة أساس داخل الجين من اللوحة المستخدمة في التوليف ، مما يسمح بتغطية كل من خيوط الجين بالكامل pfsub-1 تسلسل مع تداخلات متسقة. حدد تحليل التسلسل الكامل لثلاثة من استنساخ 2.1 كيلو بايت وخمسة من كل من الحيوانات المستنسخة الأصغر متوسط ​​3.5 أخطاء استبدال النيوكليوتيدات فقط لكل كيلو بايت في منتج PCR 2.1 كيلو بايت ومتوسط ​​خطأ 1.5 فقط لكل كيلو بايت في كل من الاثنين 1.1 ومنتجات 1 كيلوبايت. تم توزيع هذه الطفرات بشكل عشوائي ، مما يشير إلى أن القلة لم تكن مصدر الأخطاء. حيث Pfu تم استخدام البوليميراز ، الذي يُظهر نشاطًا مصححًا للنوكلياز الخارجي 3 → 5 ، لجميع خطوات التضخيم ، ونفترض أن هذه الأخطاء قد تم تقديمها على الأرجح أثناء عملية التجميع. من المحتمل أن يكون تردد الطفرة المنخفض الذي لوحظ في المنتجات الأصغر نتيجة مباشرة لانخفاض عدد القلة المختلطة معًا أثناء تفاعل التجميع.

تعبير البروتين

التعبير من الاصطناعية pfsub-1 الجين في البداية P. باستوريس. تم استبدال تسلسل إشارة PfSUB-1 بمجال ما قبل الاحتراف لـ S. cerevisiae عامل التزاوج α عن طريق استنساخ الجين فيه سناBI /سابقة بمعنى البيئةRI-Digested pPIC9K والمتجه الخطي المستخدم للتحويل P. باستوريس. تم اختيار المحولات التي تحتوي على إدخالات كروموسومية متعددة للناقل المؤتلف ، وبعد التحريضات الأولية لاختيار النسخ الأكثر إنتاجًا ، تم تحفيز استنساخ واحد في مخمر سعة 4 لترات. منذ N- glycosylation لمرحلة الدم المتصورة المنجلية البروتينات نادرة (جودا وآخرون.، 1997) ، تم إجراء الحث في وجود التونيكاميسين. لم يفرز المستنسخ أي بروتين مؤتلف. أظهر فحص مستخلصات الخلايا الكلية بواسطة النشاف الغربي أن المنتج المؤتلف المستحث يتراكم داخل الخلايا في شكل غير قابل للذوبان. الاستفادة من علامة هيكساهيستيدين C- الطرفية ، تمت تنقية البروتين المؤتلف تحت ظروف تغيير طبيعة من مقتطفات من الاستنساخ المستحث بواسطة كروماتوغرافيا كلاب النيكل (Holzinger وآخرون.، 1996) (الشكل 4). من بيانات التنقية هذه ، تم تقدير مستوى التعبير عن المؤتلف PfSUB-1 بنحو 0.2-0.5 جم / لتر. أظهر تسلسل الأحماض الأمينية N-terminal للبروتين المنقى أنه قد تمت إزالة تسلسل إشارة إفراز α-factor N-terminal بينما كان المجال pro-factor pro لا يزال موجودًا ، مما يشير إلى أن البروتين قد خضع للانتقال إلى الخميرة ER ولكن لم يكن كذلك. مزيد من المعالجة.

تم اعتبار نظام baculovirus بعد ذلك كنظام تعبير بديل قد يدعم بشكل أفضل الطي المناسب والمعالجة اللاحقة للترجمة لـ PfSUB-1. استخدام الكودون أوتوجرافها كاليفورنيكا فيروس تعدد التعرق النووي (AcMNPV) أقل صرامة من فيروس P. باستوريس ( Ranjan and Hasnain ، 1994) ، لذلك اعتبر أن الجين الاصطناعي الخاص بنا يجب أن يتم التعبير عنه بشكل جيد في نظام الفيروس البكتيري. أدت الإصابة بخلايا حشرية عالية الخمسة TM في وجود التونيكاميسين عند 0.5 ميكروغرام / مل إلى إفراز مستويات يمكن اكتشافها بسهولة من PfSUB-1 الذي تمت معالجته بشكل صحيح على ما يبدو (الشكل 5). أشارت عملية التنقية الأولية مع المنتج المفرز إلى أن مستويات التعبير عن البروتين المؤتلف كانت في حدود 2-5 مجم / لتر (غير معروض).


الاستنتاجات ووجهات النظر

أصبح من الواضح الآن أن أعضاء من عائلتين بروتينيتين يشاركون في عمليات اختيار الخلايا المضيفة التي تحدد انتفاخ خلايا الدم الحمراء لميروزويت طفيل الملاريا. تنوع هذه البروتينات داخل جينومات مختلفة المتصورة تسمح الأنواع باقتراح نموذج افتراضي حيث يمكن لمجموعات الروابط والتحكم في تعبيرها أن تفسر السلوك الغازي المتميز للميروزويت في الأنواع المختلفة. ومع ذلك ، لا يوجد دليل قاطع على هذا النموذج ولا التفاصيل الدقيقة للتفاعلات التي تدعم اختيار خلايا الدم الحمراء للغزو حتى الآن. ليس هناك شك في أن القدرة على التعديل الجيني للطفيلي أدت إلى تقدم كمي في إدراكنا لهذه الآليات الغازية ، وأن التحليلات المنهجية المستمرة للطفيليات ذات جينات RBL و / أو EBL المعطلة ستؤدي إلى مزيد من المعرفة. من غير المحتمل أن يوفر هذا النهج نظرة ثاقبة لطبيعة اختيار خلايا الدم الحمراء ، إلا إذا كان مرتبطًا بدراسات حيث يتم تحديد مستقبلات خلايا الدم الحمراء أيضًا. تشكل متغيرات خلايا الدم الحمراء الموجودة بشكل طبيعي في الطبيعة مصدرًا غنيًا للمواد لهذه الدراسات ، ولكن من المحتمل ألا تكون كافية. لتلك الطفيليات التي يمكن الحفاظ عليها بشكل روتيني في المختبر (المتصورة المنجلية و P. نولسيسيكون التحدي هو ابتكار طرق للحصول على مجموعة متجانسة من خلايا الدم الحمراء ذات خصائص مستقبلات محددة. إن التقدم في التلاعب الجيني لأرومات الدم الحمراء وفي توليد أعداد كبيرة من كريات الدم الحمراء من هذه الخلايا السلفية قد يوفر حلاً.

يمكن الحصول بسهولة على العرض التوضيحي الذي يتحول إلى مسارات غزو بديلة حيث تتورط روابط ومستقبلات مختلفة من أجل المتصورة المنجلية تحت ظروف المختبر ، والأدلة على أن هذا يحدث أيضًا في الطفيليات المنتشرة في السكان المتوطنين ، هو مصدر قلق للقاحات الملاريا القائمة على بروتينات RBL أو EBL. حقيقة أن الطفيليات التي لا تعبر عن EBA175 ، المرشح الرئيسي لمثل هذه اللقاحات ، لا تزال قادرة على التكاثر (Duraisingh وآخرون. ، 2003b) في اختيار متغيرات الهروب إذا تم نشر هذا اللقاح. ومع ذلك ، يجب تخفيف التشاؤم لأنه من غير المعروف في الواقع ما إذا كانت سلالات الطفيليات المتغيرة التي تنمو في ظل ظروف المختبر ستكون قابلة للحياة. في الجسم الحي. ومع ذلك ، فقد أصبح من الضروري النظر في تضمين اثنين أو أكثر من روابط RBL و EBL في أي لقاح يهدف إلى منع التفاعلات بين المرزويت وخلايا الدم الحمراء.

أخيرًا ، أحد الافتراضات المركزية المتعلقة ببروتينات RBL و EBL هو أنها تشارك فقط في غزو خلايا الدم الحمراء. نشأ هذا في المقام الأول من حقيقة أن هذه البروتينات تم العثور عليها لأول مرة مرتبطة بالميروزويت. علاوة على ذلك ، بالنسبة للعديد من هذه البروتينات يمكن إثبات ارتباطها بخلايا الدم الحمراء ، وبالنسبة للبعض تم تحديد مستقبل خلايا الدم الحمراء. أخيرًا ، يمكن للأجسام المضادة التي يتم رفعها ضد عدد من هذه البروتينات أن تثبط أو تغير الانتارة والملامح الغازية للميروزويت. هناك دراستان حديثتان نسبيًا تشككان في صحة هذا الافتراض. أولاً ، تم إظهار التعبير عن مجموعات فرعية متميزة من جينات Py235 (عائلة RBL) (على مستويي النسخ والبروتين) في البوغ والطفيلي الكبدي (Preiser). وآخرون. ، 2002). ثانيًا ، EBA175 (عائلة EBL) ، عنصر مهم المتصورة المنجلية تم عرض لقاح مرشح مضاد لغزو خلايا الدم الحمراء ، على سطح البوغات وفي خلايا الكبد المصابة (Grüner وآخرون، 2001). في حين أن التعبير عن هذه البروتينات قد يكون متوقعًا في خلايا كبدية متجهة إلى غزو خلايا الدم الحمراء ، فإن دورها في بيولوجيا البوغ ، وهو شكل طفيلي يتفاعل مع الغدد اللعابية للبعوض ، وهي الخلايا الموجودة في الجلد حيث تترسب من قبل الجسم. لدغة معدية قبل غزو خلايا الكبد ، لم يتم استكشافها بعد. دراسات منهجية لتحديد أي من الأعضاء الآخرين في عائلات RBL و EBL يتم التعبير عنها خلال مراحل ما قبل كريات الدم الحمراء من المتصورة جارية حاليا. قد يؤدي هذا إلى تحديد بعض الروابط التي تتفاعل بشكل خاص مع نوع خلية مضيفة واحدة ، وأخرى قد تكون جزءًا من مجموعة بروتينات الطفيليات المتورطة في جميع الأحداث الغازية.

في الختام ، شرح الآليات الجزيئية الكامنة وراء انتفاخ الخلية المضيفة وغزوها المتصورة تمثل الطفيليات تحديًا هائلاً للباحثين ، تقنيًا وفكريًا. The resources that would be required to achieve this goal are justified by the central role these processes play in the survival of the parasite and in the possibility that the knowledge to be gained might yield novel and efficient strategies to control the infection.


مقدمة

Quantifying the diversity of major surface antigens underlying immune evasion of HIV 1 and 2 and Influenza A has been central to characterizing the transmission dynamics of these important human pathogens. In addition, documentation of variation data has provided a basis for the development of candidate vaccine targets [1,2]. Surprisingly, in-depth molecular epidemiological sampling and population genomic analyses of the var genes encoding the major blood stage surface antigen of the malaria parasite, المتصورة المنجلية erythrocyte membrane protein 1 (PfEMP1), has not been done. This is largely due to the inherent difficulties in the population genomic analysis of highly diverse multigene families. We set out to develop and evaluate a rapid, molecular epidemiological population genomic framework to investigate var gene diversity in natural parasite populations, due to the importance of these genes to the biology of P. falciparum.

To achieve chronic infection, malaria parasites evade the host immune response by switching PfEMP1 isoforms through differential expression of members of the var multigene family [3𠄵]. PfEMP1 is expressed on the surface of blood stage parasites known as trophozoites [6] and the transmission (early gametocyte) stages [7]. Parasite adhesion occurs in the deep vasculature of host tissues by binding of PfEMP1 to host endothelial cell receptors. Some PfEMP1-adhesion interactions are proposed to lead to severe disease manifestations such as cerebral and placental malaria (reviewed in [8]). Variant specific anti-PfEMP1 antibodies are believed to contribute to the regulation of parasite density in a manner that decreases the incidence of clinical disease [9�]. This immunity may reduce the duration of infection in a variant-specific manner to drive the dynamics of multiple infections in semi-immune children [14] and induced infections in humans [15]. Immunity to PfEMP1 can thereby influence transmission by reducing persistence. It may also reduce transmission by regulating the density of asexual blood stages with potential to become transmission stages and by directly targeting early gametocytes to prevent the maturation of transmission stages [16]. Consequently, diversity of PfEMP1 or var genes is able to promote transmission success by immune evasion.

Describing the diversity of var genes presents a more complex problem than assessing the diversity of the single copy major surface antigen genes of HIV and Influenza A. Individual المتصورة المنجلية genomes have repertoires of var genes that can recombine with other repertoires during the obligatory sexual phase of the life cycle in the mosquito [17�]. There is also circumstantial evidence for ectopic recombination among var genes within the same genome, possibly during both meiosis and mitosis [20�]. Therefore, there is enormous potential to generate diversity, even among closely related genomes. فار genes are large (5� kb) and complex [23�], encoding variable numbers and classes of the adhesion domains, Duffy binding like (DBL: α, β, δ, ɛ, and γ classes) and cysteine interdomain rich (CIDR: α, β, and γ classes) [26]. Both size and complexity preclude population genomic analysis of the full var gene sequences. The DBLα encoding domain was used previously as a marker of var genes in investigations of diversity [21,22,27�] and expression [31�]. The small size (𢏁 kb) and ubiquitous presence of DBLα among var genes [24�,34] make this domain a suitable population genomic marker.

Previous analyses of var gene diversity have examined DBLα domain sequences from the var gene repertoires of allopatric (distantly related) [22,27,30] or just a few sympatric (closely related) [28,29] isolates. These studies have established that any pair of DBLα sequences from the same genome were on average as diverse as any pair from two different genomes, with a range of 45%�% amino acid identity [3,22,27,28]. This has made it impossible to identify var gene orthologs among genomes. Limited overlap (shared DBLα sequences) among var repertoires from sympatric isolates has also been reported [27�], suggesting that many genomes must be sampled to see the extent of diversity of these genes in natural populations. Given the importance of var genes to transmission, a systematic sequencing effort and population genomic analysis is needed to examine var gene diversity in sufficient depth to estimate levels of antigenic diversity within natural populations.

A high-throughput population genomic framework was developed to address sampling issues specific to the molecular epidemiological analysis of diverse multigene families. This allowed the random sampling of the var gene repertoires of culture-adapted and field isolates of المتصورة المنجلية by sequencing DBLα domains as population genomic markers ( Figure 1 ). فار genes were sampled from a “global” collection of isolates, including clones 3D7 and HB3 used in genome sequencing projects ([34] D. Wirth, personal communication). DBLα sequences from these isolates were used to validate the framework. The “global” DBLα sequences were combined with available data from previous studies and compared to that obtained from a local population of Papua New Guinea (PNG). The results show immense levels of diversity among the var genes with strong evidence of geographic structuring of variation. We demonstrate patterns of similarity among sequences that suggest the widespread action of recombination in creating and maintaining diversity.

The cumulative diversity of DBLα was determined by comparing each new DBLα repertoire to previous repertoire(s) using a 96% DNA sequence identity cut-off. We plotted the number of accumulating “types” (distinct sequences) against the number of “sequences” compared. For example, the first point on the plot will be the number of types found in both isolates A and B on the y-axis against the total number of sequences compared on the x-axis. The next point will be the number of types found in isolates A, B, and C against the total number of sequences compared. The plot shown here is the average curve of 1,000 permutations of the order that isolates were compared (i.e., isolates A, B, then C or A, C, then B or B, C, then A).


معلومات الكاتب

الانتماءات

Department of Immunology and Infectious Disease, Harvard School of Public Health, 665 Huntington Avenue, Boston, 02115, Massachusetts, USA

Sarah K. Volkman & Dyann F. Wirth

Broad Institute, 7 Cambridge Center, Cambridge, 02142, Massachusetts, USA

Sarah K. Volkman, Daniel E. Neafsey, Stephen F. Schaffner, Daniel J. Park & Dyann F. Wirth

School for Nursing and Health Sciences, Simmons College, 300 The Fenway, Boston, 02115, Massachusetts, USA

Department of Organismic and Evolutionary Biology, Harvard University, 26 Oxford Street, Cambridge, 02138, Massachusetts, USA


شاهد الفيديو: Web application tour - MalariaGEN Plasmodium falciparum genetic crosses data release (شهر فبراير 2023).