معلومة

قاعدة بيانات تفاعل البروتين البروتين المصدق عليها للسرطان

قاعدة بيانات تفاعل البروتين البروتين المصدق عليها للسرطان


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أحتاج إلى استخدام بيانات PPI التي تم التحقق من صحتها في بحثي. هل توجد أي قاعدة بيانات لقاعدة بيانات تم التحقق من صحتها (مثل قياس الطيف الكتلي) للسرطان؟


تعد STRING من أكثر قواعد البيانات شيوعًا لبيانات PPI. لا يقتصر الأمر على السرطان فقط ، ولكن نظرًا لإجراء العديد من الأبحاث في مجال السرطان ، ستجد الكثير من البيانات المستمدة من أبحاث السرطان.


OncoPPi

يوفر هذا الموقع منصة لتسهيل اكتشاف آليات جديدة للتحكم في تكون الأورام من خلال تكامل البيانات الجينومية والدوائية والسريرية والهيكلية مع شبكة تفاعلات البروتين البروتين المرتبطة بالسرطان تم اكتشافه تجريبيا في الخلايا السرطانية.


لي وآخرون. (2017) شبكة OncoPPi لتفاعلات البروتين والبروتين التي تركز على السرطان لإبلاغ الرؤى البيولوجية والاستراتيجيات العلاجية. نات كومون 16: 14356.


مشروع الخميرة التفاعلية

التفاعل في الكائن الحي هو الشبكة التي تتكون من مجموعة كاملة من التفاعلات الفيزيائية التي يمكن أن تحدث في نطاق ديناميكي ذي صلة من الناحية الفسيولوجية بين جميع الجزيئات الكبيرة ، بما في ذلك تفاعلات البروتين والبروتين والبروتين DNA والبروتين RNA. هدفنا هو تطوير خريطة تفاعل بروتين البروتين الخميرة (PPI) أكثر اكتمالاً ، والاستفادة من المعرفة التي اكتسبناها من جهود رسم خرائط التفاعل الثنائي المنهجية. تتيح لنا الخميرة الفرصة لاستجواب مجموعة شاملة من جينات ترميز البروتين ودمج بيانات تفاعلنا المنهجي مع المعلومات عالية الجودة المنسقة بالأدبيات ومع مجموعات البيانات المنهجية الأخرى القابلة للتحقق المتعامد. يعد إنشاء خرائط الشبكة التفاعلية مع زيادة الحساسية والجودة جانبًا ضروريًا ، وإن لم يكن كافياً ، في السعي لتوليد نماذج جزيئية كبيرة تنبؤية على نطاق الخلية بأكملها. لقد طورنا إطارًا مفاهيميًا لتقييم النماذج التفاعلية بناءً على القياس الكمي لفحوصات الفحص والتحقق من الصحة مقابل مجموعات مرجعية. من خلال هذا ، أظهرنا أن مجموعة مجموعات بيانات تفاعل الخميرة المنهجية عالية الجودة تغطي

20٪ من تفاعلات الخميرة الثنائية المتوقعة ، وإن كانت تستجوب أقل من 75٪ من جينات ترميز بروتين الخميرة. باستخدام التقنيات الجديدة ، نهدف إلى التوسع إلى 50 ٪ لتمكين فهم محسن بشكل عميق للشبكة التفاعلية للخميرة الناشئة. لمراقبة الجودة ، يتم التحقق من صحة التفاعلات الثنائية في مقايسات تفاعل متعامد معيارية ، مما يسمح لنا بإنشاء وتحليل الجيل الثالث ، خريطة تفاعلية ثنائية عالية الجودة من S. cerevisiae.

YI-I: أجرينا تقييمًا مقارنًا للجودة لمجموعات بيانات تفاعل الخميرة الحالية ، مما يدل على أن الخميرة عالية الإنتاجية ثنائية الهجين (Y2H) توفر معلومات تفاعل ثنائي عالية الجودة. نظرًا لأنه لا يزال يتعين تعيين جزء كبير من التفاعل الثنائي للخميرة ، فقد طورنا إطارًا لرسم الخرائط يتم التحكم فيه تجريبيًا لإنتاج مجموعة بيانات Y2H عالية الجودة وعالية الإنتاجية من "الجيل الثاني"

20٪ من تفاعلات الخميرة الثنائية. كل من Y2H وتنقية التقارب تليها بيانات قياس الطيف الكتلي (AP / MS) ذات جودة عالية بنفس القدر ولكنها ذات طبيعة مختلفة ومتكاملة بشكل أساسي مما يؤدي إلى شبكات ذات خصائص طوبولوجية وبيولوجية مختلفة. تم إثراء هذه الخريطة الثنائية لتفاعلات الإشارات العابرة والوصلات بين معقدة مع تكتل شديد الأهمية بين البروتينات الأساسية. بدلاً من الارتباط بالأساسيات ، يرتبط اتصال البروتين بالتنوع الوراثي.

تمثيل رسومي لثلاثة أنواع مختلفة من مجموعات البيانات التفاعلية للخميرة. من الواضح أن بنية الشبكة التفاعلية الثنائية تختلف عن بنية شبكة التفاعل المشتركة المعقدة. يشبه هيكل الشبكة لمجموعة البيانات المنسقة بالأدب بنية مجموعة البيانات المشتركة ، على الرغم من الإبلاغ عن احتواء مجموعات البيانات المنسقة بالأدب على تفاعلات ثنائية في الغالب. يمكن تنزيل جميع مجموعات البيانات هنا.


مشاريع Interactome في بنك CCSB

رسم الخرائط التفاعلية H uman هو المشروع الرئيسي لـ CCSB. أول خريطة للتفاعل الثنائي البشري (Rual وآخرون الطبيعة 2005) عن طريق فحص الخميرة ثنائية الهجين (Y2H) للتفاعلات الثنائية المباشرة داخل مصفوفة "Space I" من

8000 × 8000 ORFs الواردة في Human ORFeome v1.1 (Rual وآخرون الدقة الجينوم 2004). لقد طورنا إطارًا تجريبيًا يقيس كميًا معلمات اكتمال الفحص وحساسية الفحص وحساسية أخذ العينات والدقة ، واستخدمنا هذا الإطار لتقدير حجم التفاعل الثنائي البشري مثل

130.000 ± 32.000 تفاعل ثنائي (Venkatesan طرق وآخرون نات 2009). استخدام استراتيجية تسلسل جديدة من الجيل التالي لتحديد أزواج التفاعل (Yu طرق وآخرون نات 2011) ، قمنا بتنفيذ شاشة Y2H للتفاعلات داخل مصفوفة "Space II" من

13000 × 13000 ORFs الواردة في Human ORFeome v5.1. نفيدكم

14000 تفاعل ثنائي مباشر جديد (Rolland وآخرون الخلية 2014) ، وبذلك يصل العدد الإجمالي للتفاعلات الثنائية الفريدة إلى

تعتمد الفيروسات بشكل جوهري على خليتها المضيفة أثناء مسار العدوى ويمكن أن تثير أنماطًا مرضية مرضية مماثلة لتلك الناشئة عن الطفرات (Gulbahce وآخرون PLoS Comput Biol 2012). قمنا بتطبيق خط أنابيب متكامل منهجي للتحقيق في الاضطرابات على نطاق الجينوم لشبكات التفاعل المضيفة التي تحدثها منتجات الجينات الفردية المشفرة من قبل أعضاء أربع عائلات مرتبطة وظيفيًا ، ولكنها متميزة بيولوجيًا ، من فيروسات أورام الحمض النووي: الفيروسات البوليمية ، الفيروسات الحليمية ، الفيروسات الغدية ، وإبشتاين بار فيروس (روزنبلات روزين وآخرون الطبيعة 2012). بواسطة الخميرة ثنائية الهجين ، قمنا بفحص 123 من ORFs الفيروسية

13000 ORFs بشري ، حصلوا على 454 تفاعلًا ثنائيًا تم التحقق منه بين 53 بروتينًا فيروسيًا و 307 بروتينًا مستهدفًا بشريًا. من خلال تنقية التقارب الترادفي متبوعًا بقياس الطيف الكتلي (TAP-MS) ، قمنا بتعيين 3787 ارتباطًا مشتركًا معقدًا مضيفًا فيروسيًا بشكل متكرر يتضمن 54 بروتينًا فيروسيًا ومنتجات 1،079 جينة مضيفة تم تحديدها بشكل لا لبس فيه. أكثر

تتميز النباتات P بميزات فريدة تطورت استجابة للتحديات البيئية والبيئية. حسابات الشبكات الخلوية المعقدة التي تكمن وراء الوظائف الخاصة بالمصنع مفقودة. لقد أبلغنا عن خريطة تفاعل بروتين بروتين ثنائي على مستوى البروتين من حجم مساحة بحث تبلغ

8000 × 8000 ORFs للشبكة التفاعلية للمصنع نبات الأرابيدوبسيس thaliana. تحتوي هذه الخريطة التفاعلية

6200 تفاعل موثوق للغاية بين

2٪ من مجموع أرابيدوبسيس تفاعل ثنائي فيزيائي حيوي. أكثر

يحتوي W orm Interactome الإصدار 8 على 3864 تفاعلًا ثنائيًا للبروتين والبروتين لـ C. ايليجانس تم تجميعها من شاشة WI-2007 عالية الإنتاجية ثنائية الخميرة (1،816 تفاعلًا جديدًا تم الإبلاغ عنها في Simonis طرق وآخرون نات 2009) شاشة الخميرة عالية الإنتاجية ثنائية الهجين WI-2004 (1735 تفاعل تم الإبلاغ عنها في Li وآخرون العلوم 2004) وخلاصة وافية للبيانات من الشاشات ثنائية الهجين الخميرة متوسطة الإنتاجية (554 تفاعلًا). أكثر

يحتوي الإصدار 1 من Y east Interactome (CCSB-YI1) على تفاعلات بروتينية بروتينية هجينة ثنائية الخميرة عالية الجودة من أجل S. cerevisiae. وهو يشتمل على 1809 تفاعلًا بين 1278 بروتينًا

10٪ من تفاعلات الخميرة الكاملة المقدرة بـ

18000 ± 4500 تفاعل (Yu وآخرون العلوم 2008). للحصول على تفاعل خميرة ثنائية أكثر شمولاً ، تم دمج CCSB-YI1 مع مجموعات بيانات Ito-core و Uetz-screen لإنتاج اتحاد Y2H ، والذي يحتوي على 2930 تفاعلًا ثنائيًا بين 2018 بروتينًا ،

20٪ من تفاعلات الخميرة الكاملة. أكثر

F ragmentome: يتم التوسط في العديد من تفاعلات البروتين والبروتين من خلال مجالات قابلة للطي بشكل مستقل. أهملت الجهود المبذولة على مستوى البروتيوم لنمذجة الشبكات التفاعلية بالضرورة التنظيم المعياري للبروتينات. قمنا بتطوير إستراتيجية تجريبية "مجزأة" لتحديد مجالات التفاعل بكفاءة (Boxem وآخرون الخلية 2008). استخدمنا هذه الاستراتيجية لإنشاء شبكة تفاعلية قائمة على المجال للبروتينات المشاركة فيها C. ايليجانس انقسامات الخلايا الجنينية المبكرة.

مشروع H uman Interactome Mapping هو المشروع الرئيسي لـ CCSB. تم نشر المسودة الأولى لخريطة "Space-I" للتفاعل البشري ، والتي تصف التفاعلات داخل مصفوفة 8000x8000 ORFs الموجودة في Human ORFeome v1.1 في عام 2005 (Rual et al.). لقد استخدمنا هذه البيانات لتطوير إطار عمل مفاهيمي يشتمل على اكتمال الشاشة وقدرة الكشف عن المقايسة وتشبع الشاشة لتقدير حجم التفاعل البشري (Venkatesan et al ، مقدم). حاليًا ، يجري العمل على رسم خريطة للفضاء II (12kx12k) والثالث (16k x 16k) للتفاعل البشري بتغطية ثلاثية.

C hlamydomonas reinhardtii هو كائن حي واعد "للطاقة الحيوية" قادر على إنتاج غاز الهيدروجين وموارد "الوقود الحيوي" الأخرى. في هذا المشروع الممول من وزارة الطاقة لتحويل الغاز إلى سوائل ، نقوم بما يلي: 1) التحقق التجريبي وتحديد هياكل النسخ الخاصة بـ

2000 جينة مرتبطة بالأيض واستنساخ إطارات القراءة المفتوحة (ORF) 2) تحديد تفاعلات البروتين البروتين بين منتجات الجينات الأيضية و 3) بناء خرائط تفاعل البروتين وشبكات التمثيل الغذائي التي ستسمح في النهاية بتطوير تنبؤات قابلة للاختبار لـ C.reinhardtii علم وظائف الأعضاء ، بما في ذلك فتك الجينات ومعدلات النمو في ظل ظروف بيئية محددة. أكثر


نهج البيولوجيا الكيميائية لاستهداف التحقق من صحة السرطان

يعد التحقق من صحة الهدف أمرًا بالغ الأهمية بشكل خاص في سياق تخدير جينوم السرطان ومقاومة الأدوية السريرية.

نراجع كيف تستفيد منهجيات البيولوجيا الكيميائية من التحقق من صحة الهدف.

نوضح كيف أن مثبطات الجزيئات الكيميائية الصغيرة التي تم تقييمها بشكل نقدي تكمل الأساليب الجينية.

نسلط الضوء على التقدم الذي تم إحرازه مؤخرًا ، بما في ذلك الكواشف لأهداف أقل قابلية للعقاقير.

التحقق من صحة الهدف هو عنصر حاسم في اكتشاف الدواء. بالنظر إلى ثروة الأهداف المحتملة الناشئة عن تسلسل الجينوم السرطاني والشاشات الجينية الوظيفية ، وكذلك النظر في وقت وتكلفة جهود اكتشاف الأدوية اللاحقة ، من الضروري بناء الثقة في الهدف المقترح ، من الناحية المثالية باستخدام أساليب تقنية مختلفة. نحن نجادل بأن استراتيجيات البيولوجيا الكيميائية والبيولوجية التكميلية ضرورية للتحقق من صحة الهدف. نناقش التقدم الذي تم إحرازه مؤخرًا في اكتشاف وتطبيق أدوات كيميائية عالية الجودة وغيرها من مناهج البيولوجيا الكيميائية لاستهداف التحقق من السرطان. من بين الأمثلة الموضعية الأخرى ، نسلط الضوء على ظهور أدوات كيميائية مصممة لا رجعة فيها لدراسة البروتينات المستهدفة المحتملة والمسارات المسببة للأورام التي كانت تعتبر حتى الآن غير قابلة للعلاج بشكل جيد.


PIMKL: نحو تنبؤ النمط الظاهري القابل للتفسير باستخدام معلومات المسار

يعد توقع تطور المرض بناءً على البيانات الجزيئية التي تم الحصول عليها من عينات الأنسجة المريضة وطبقات أو تصنيف المرضى وفقًا لذلك خطوة حاسمة لمساعدة الأطباء على تخصيص علاجات فعالة وتصميمها بشكل أفضل. على الرغم من اقتراح عدد من الخوارزميات الآلية لحل هذه المهمة ، إلا أن العديد منها فشل في توفير تنبؤات قابلة للتفسير ، وهو جانب رئيسي لاعتماد مثل هذه المنهجيات في صناعة الرعاية الصحية.

قامت شركة IBM بإنشاء PIMKL (التعلم النوى المتعدد الناجم عن المسار) ، وهي خوارزمية جديدة للتعلم الآلي يمكنها إنتاج أداء تنبؤي عالي وقابلية للتفسير في التنبؤ بالأنماط الظاهرية بناءً على البيانات الجزيئية. يتيح PIMKL ذلك من خلال استغلال المعرفة السابقة بالتفاعلات الجزيئية. على وجه التحديد ، نقوم بتغذية معلومات PIMKL على الشبكات الجزيئية والمسارات التي تصف عملية جزيئية حيوية محددة جيدًا. باستخدام تقنية التعلم الآلي المعروفة باسم التعلم متعدد النواة ، يحدد PIMKL المسارات الجزيئية المهمة لتصنيف مجموعات المرضى. يمكن أن تؤدي الرؤى حول الاختلافات بين مجموعات المرضى المقدمة ، وذلك بفضل قابلية تفسير النموذج ، إلى فهم أفضل لتطور السرطان.

في دراستنا ، تناولنا على وجه التحديد مهمة التنبؤ بما إذا كانت مريضة بسرطان الثدي ستعاني من انتكاس في غضون خمس سنوات بعد العلاج الأول. من أجل قياس PIMKL ، قمنا بمقارنتها بـ 14 خوارزمية أخرى مماثلة تم تطبيقها مسبقًا على ستة مجموعات من سرطان الثدي. تفوق PIMKL باستمرار على نظرائه أو تم تصنيفه ضمن الخوارزميات الأفضل أداءً في كل مجموعة. [vii]

تبين أن التواقيع الجزيئية التي تم تحديدها بواسطة PIMKL كانت أيضًا ذات صلة كبيرة عندما طبقنا الخوارزمية على بيانات غير مرئية من مجموعة مختلفة عن تلك المستخدمة في التدريب. هذا مؤشر على أن المعرفة التي تم الحصول عليها بشأن تطور المرض يمكن نقلها عبر مجموعات البيانات والأتراب. ظهرت قوة خاصة لـ PIMKL عندما قمنا بتدريبها على بيانات صاخبة من طبقات أوميك مختلفة ، أي بيانات وراثية أو جينية أو بروتينية. حتى ذلك الحين ، أثبت PIMKL قدرته على التخلص من الضوضاء واختيار البيانات الأكثر إفادة دون تقليل أدائها.

قمنا بنشر PIMKL على IBM Cloud. يمكن للباحثين الوصول إلى خدمة الويب أو استخدام التعليمات البرمجية مفتوحة المصدر واستخدام بياناتهم الخاصة لإجراء التجارب. والحصول على توقيعات جزيئية مستقرة. تعرف على المزيد حول PIMKL على موقع المشروع على الويب.

يستغل PIMKL تقنية تعلم الآلة تسمى التعلم متعدد النواة والمعرفة السابقة بالتفاعلات الجزيئية للتنبؤ بالأنماط الظاهرية من البيانات الجزيئية ذات الأصول المتنوعة.

توضح الخوارزميات الثلاثة المقدمة كيف يمكن استغلال مناهج التعلم الآلي للنهوض بالبحوث الطبية الحيوية حول الأمراض المعقدة مثل السرطان. يُظهر عملنا أيضًا أنه من الممكن دمج التفسير في الخوارزميات ، وبالتالي تعزيز الثقة مع توجيه البحث أيضًا عن آليات المرض الأساسية. نواصل العمل لتحسين هذه الحلول. من خلال إتاحتها للجمهور ، نأمل في تعظيم تأثيرها الإيجابي في المجتمع العلمي.

[iv] ماتيو مانيكا ، علي أوسكوي ، جانيس بورن ، فينيشواري سوبرامانيان ، خوليو سايز- رودريغيز ، ماريا رودريغيز مارتينيز ، "نحو توقع حساسية مركب مضاد للسرطان يمكن تفسيره عن طريق الترميز التلافيفي متعدد الوسائط القائم على الانتباه" ، ورشة عمل حول علم الأحياء الحسابي ICML ، 2019.

[v] Mikolov، T.، Sutskever، I.، Chen، K.، Corrado، G. & amp Dean، J. التمثيلات الموزعة للكلمات والعبارات وتكوينها. في بروك. المؤتمر الدولي السادس والعشرون لنظم معالجة المعلومات العصبية ، NIPS’13 3111–3119

[vi] ماتيو مانيكا ، ورولاند ماتيس ، وجوريس كادو ، وماريا رودريغيز مارتينيز ، "شبكات تفاعل خاصة بالسياق من تمثيل متجه للكلمات & # 8220 ، ذكاء آلة الطبيعة 1(4), 181–190, 2019.

[vii] ماتيو مانيكا ، جوريس كادو ، رولان ماتيس ، ماريا رودريغيز مارتينيز ،
"PIMKL: التعلم متعدد النواة المستحث بالمسار" ،
بيولوجيا وتطبيقات أنظمة npj 5(1), 8, 2019.

عضو فريق البحث في الرعاية الصحية المعرفية وعلوم الحياة ، IBM Research-Zurich


ثالثا. منهج بيولوجيا الأنظمة

تفتح القدرة على جمع البيانات لعدد كبير من الأنواع الجزيئية من نفس العينة ، بما في ذلك بيانات قياس التعبير الجيني ومستويات العديد من البروتينات والمستقلبات ، إمكانية الحصول على بيانات على مستوى الشبكة. هذا النوع من البيانات يجعل من الممكن أيضًا اتباع نهج أكثر توجهاً نحو الاكتشاف. نظرًا لأن الهدف النهائي لنهج بيولوجيا الأنظمة للسرطان هو فهم شبكة بيولوجية ذات صلة بمساعدة نموذج رياضي مشتق من جهد التنقيب عن البيانات على بيانات غير متجانسة على مستوى النظام ، تتطلب مشاريع بيولوجيا الأنظمة تصميمًا تجريبيًا متخصصًا ، خطوات لتحليل البيانات ، ونهج تكراري بالتناوب بين التنبؤ الحسابي والتحقق التجريبي. يتم تمثيل هذه العملية بشكل تخطيطي في الشكل 2.

استراتيجية بيولوجيا النظم. الهدف من نهج بيولوجيا الأنظمة هو بناء نماذج رياضية تنبؤية للأنظمة البيولوجية. يوضح هذا الرقم الإستراتيجية العامة الواجب اتباعها. نقطة البداية هي المعرفة البيولوجية الموجودة حول النظام المعني. يتم استخدامه لبناء إطار رياضي عام لنموذج. قد يحتوي النموذج على العديد من المعلمات البيولوجية غير المعروفة ، مثل ثوابت معدل الحركة أو معدلات الانتشار. يتم تنقيح النموذج من خلال قيم المعلمات المعروفة والبيانات التجريبية ، والتي يمكن تركيب النموذج عليها من خلال المحاكاة. في هذه المرحلة ، يتم استخدام النموذج لتوليد فرضيات بيولوجية يمكن اختبارها تجريبيًا. من خلال عملية تكرارية من الفرضية والتجربة ، يتم تنقيح النموذج حتى يلتقط بدقة السمات البيولوجية الرئيسية للنظام المراد نمذجته.

الفرضية الأساسية لبيولوجيا الأنظمة هي أن الفهم الكامل للشبكة الجزيئية لا يتطلب فقط معرفة أجزائها ولكن أيضًا بتفاعلاتها الديناميكية. من أجل بناء نماذج ذات مغزى على مستوى النظام ، يلزم إجراء قياسات كمية للخلية الكاملة لمكونات الشبكة لأنها تتغير بمرور الوقت استجابةً لواحد أو أكثر من الاضطرابات. إنها تشكل أساس النموذج الحسابي للشبكة. يشتمل النموذج على فرضية واحدة أو أكثر حول الآليات المسؤولة عن ديناميكيات النظام ويقدم تفسيرًا نظريًا للملاحظات. التحقق من صحة النموذج مع مزيد من التجارب يختبر هذه الفرضيات. يمكن أن يعمل النموذج الذي تم التحقق من صحته كأداة لتوليد المزيد من الفرضيات. على هذا النحو ، يمثل النموذج الرياضي أداة لتوليد الفرضيات حول نظام يكون عادةً كبيرًا جدًا ومعقدًا بحيث لا يمكن فهمه على أساس مخطط الأسلاك الثابت. لا يمكن اكتشاف وفهم السمات الأساسية للشبكات الجزيئية ، مثل حلقات التغذية الراجعة والتأثيرات التآزرية للمسارات المختلفة ، بدون الأساس النظري الذي يوفره النموذج.

غالبًا ما يكون بناء نماذج رياضية ديناميكية للشبكات غير ممكن ، بسبب نقص مجموعات بيانات الدورة الزمنية المناسبة. في هذه الحالات ، لا يزال من المفيد وغالبًا ما يكون من الممكن إنشاء وتحليل شبكات ثابتة تمثل ، على سبيل المثال ، جميع تفاعلات البروتين البروتين الممكنة في نوع خلية. تتوفر لهذا الغرض العديد من مجموعات البيانات من الجينوميات الوظيفية. في القسم السادس سوف نصف مثالين من هذا القبيل.

أداة مهمة أخرى في ذخيرة بيولوجيا الأنظمة هي الاستدلال الشبكي من البيانات على مستوى النظام ، وعادةً ما تقيس بيانات المصفوفة الدقيقة للحمض النووي مستويات نسخ الجينات ، أو هلام ثنائي الأبعاد ، أو بيانات قياس الطيف الكتلي واسعة النطاق. تسمح طرق الاستدلال ببناء شبكات ظاهرية تعتمد فقط على المعلومات المتاحة في البيانات ، دون تحيز المعرفة البيولوجية السابقة أو المفاهيم المسبقة لهيكل الشبكة. يمكن بعد ذلك استخدام هذه النماذج الظاهراتية لتركيز الانتباه على ميزات معينة وتوفير قيود لبناء نماذج ميكانيكية مثل تلك الموجودة في [19].

في بعض الأحيان ، يُشار إلى أساليب استدلال الشبكة باسم & # x0201ctop-down & # x0201d النمذجة والنماذج الميكانيكية كـ & # x0201cbottom-up. & # x0201d نظرًا لأن هذه المصطلحات بدأت تدخل في الاستخدام العام ، فمن الجدير التعليق على تمييزها. إن توفر مجموعات البيانات عالية الإنتاجية مثل المصفوفات الدقيقة للحمض النووي أو ملفات تعريف البروتين والمستقلب واسعة النطاق قد فتح إمكانية إنشاء نماذج شبكات على مستوى النظام من خلال استدلال العلاقات بين عقد الشبكة من مجموعات البيانات. يشار إلى هذا النهج أحيانًا باسم النمذجة من أعلى إلى أسفل، على النقيض من النهج الأكثر تقليدية لبناء نماذج رياضية أو إحصائية من خلال تحديد قائمة الأنواع الجزيئية وتفاعلاتها أولاً ثم بناء نموذج يشفر هذه العلاقات. ثم يتم تقدير معلمات النموذج بشكل متكرر عن طريق ملاءمة النموذج للبيانات المتاحة. قد يتم استدعاء هذا النهج النمذجة من أسفل إلى أعلى. (يتم تقديم مثال في دراسة الحالة التالية.) والفرق الأساسي بين النهجين هو أنه في النهج التصاعدي يبدأ المرء بتحديد الجزيئات المهمة وأي التفاعلات يجب أخذها في الاعتبار. في النهج من أعلى إلى أسفل ، يتمثل الهدف في إجراء هندسة عكسية لهذه المعلومات بطريقة غير متحيزة من البيانات على مستوى النظام. برز الاستدلال الشبكي كمشكلة مركزية في بيولوجيا الأنظمة [20]. تم تطوير مجموعة متنوعة من الخوارزميات لهذا الغرض ، يتراوح ناتجها من النماذج الإحصائية مثل ARACNE ونماذج شبكات Bayesian [21] ، مما يوفر مقاييس الارتباط لعقد الشبكة ، إلى النماذج المنفصلة ، مثل الشبكات المنطقية [22] وأنظمة عادية معادلات تفاضلية [23] ، تعطي نماذج شبكة ديناميكية كاملة. في معظم الحالات ، تكون النماذج من أعلى إلى أسفل ظاهرة ظاهرية وليست آلية ، مثل النماذج التصاعدية. الهدف النهائي هو الجمع بين النهجين ، مع نماذج من أعلى إلى أسفل توفر قيودًا للنهج التصاعدي.

ركزت مناهج بيولوجيا الأنظمة لدراسة السرطان حتى الآن في الغالب على بناء وفهم الشبكات الجزيئية التي يتم تغييرها بواسطة التحولات الخبيثة. ولكن تم إجراء العديد من الدراسات التي نقلت تطبيق تقنيات بيولوجيا الأنظمة إلى العيادة. بينما لا يزال بعيدًا عن نموذج الطب الشخصي الذي اقترحته ثورة علم الجينوم ، فمن الممكن تصور بعض الطرق التي قد تعتمد بها المعلمات في النماذج الرياضية على خصائص الأفراد وتحديد طبيعة العمليات الديناميكية المتعلقة بتطور السرطان أو تشخيصه وعلاجه. الأسئلة ذات الصلة التي تؤثر على الممارسة السريرية هي:

كيف يمكننا استخدام التحليل على مستوى الشبكة لتحسين التنبؤ النذير؟ تقترح دراسة الحالة 1 في القسم الخامس إجابة فيما يتعلق بالتنبؤ بإمكانية النقائل لأورام الثدي. باستخدام مجموعة من بيانات المصفوفة الدقيقة للحمض النووي ومعلومات تفاعل البروتين والبروتين ، تقترح الدراسة شبكات فرعية لشبكة تفاعل البروتين والبروتين كمتنبئات ، بدلاً من مجموعات من الجينات الفردية.

كيف يمكننا استخدام تعديلات الشبكة الجزيئية في الخلايا الخبيثة بدلاً من التعبير الجيني التفاضلي من أجل تحديد الجينات المسرطنة؟ تركز دراسة الحالة 2 على هذا السؤال في سياق الأورام اللمفاوية للخلايا البائية. باستخدام مجموعة متنوعة من مجموعات البيانات والتقنيات الإحصائية ، يتم إنشاء شبكة تدمج مجموعة من التفاعلات الجزيئية. يتم تحديد الجينات المسرطنة في أنماط ظاهرية مختلفة من سرطان الغدد الليمفاوية من خلال التغييرات في محيط الشبكة بدلاً من التعبير التفاضلي.

كيف يمكننا استخدام نماذج ديناميكية متعددة المقاييس تغطي المستوى الجزيئي والأنسجة لتحسين طرق العلاج؟ تم تناول هذا السؤال في دراسة الحالة 3 ، التي تركز على البروتوكولات المحسنة للعلاج الإشعاعي. باستخدام نموذج رياضي ديناميكي يدمج المقاييس الجزيئية والخلوية والأنسجة ، يمكن للمرء دراسة استراتيجيات للتوقيت الأمثل لجلسات العلاج الإشعاعي.

قبل تقديم دراسات الحالة التي تتناول حالات محددة من هذه الأسئلة ، نراجع أولاً بإيجاز أدبيات بيولوجيا الأنظمة من حيث صلتها بالسرطان. لا يُقصد من هذه المراجعة أن تكون شاملة ، ولكنها بالأحرى توضيحية لمنهج بيولوجيا الأنظمة.


نتائج ومناقشة

اختيار الطعم والمعالجة التحليلية

تم اختيار مجموعة أولية من 407 بروتينات طُعم بشري بناءً على ارتباطات مرضية معروفة أو ضمنية والتعليقات التوضيحية الوظيفية. هذه البروتينات متورطة في مجموعة متنوعة من العمليات والمسارات البيولوجية. فئات العمليات البيولوجية الأكثر تمثيلاً بين مجموعة الطعم هي تعديل البروتين ودورة الخلية والنسخ ونقل الإشارة ، مما يعكس اختيار بروتينات الطعم التي تعتبر أساسية للعمليات الخلوية الأساسية. العديد من الطعوم لها أيضًا روابط مرضية معروفة ، وأكثرها تمثيلًا هو سرطان الثدي وسرطان القولون والسكري والسمنة ، مما يعكس هدفنا في استهداف الأمراض البشرية المهمة. كان ما يقرب من 10٪ من الطعوم المختارة عبارة عن بروتينات افتراضية أو بروتينات مشروحة بشكل سيئ ، تم اختيارها في بعض الحالات لتماثلها مع البروتينات المصابة بمرض أو ارتباطات وظيفية ذات أهمية. تحدد مجموعة البيانات الواردة هنا التفاعلات لـ 338 من المجموعة الأولية لبروتينات الطعم. قائمة كاملة ببروتينات الطُعم وعملية بيولوجية تمثيلية من علم الوجود الجيني (GO) (Ashburner وآخرون، 2000) ، حيثما كان ذلك متاحًا ، في الجدول التكميلي الأول (انظر المعلومات التكميلية للحصول على مزيد من التفاصيل حول اختيار الطعم وجمعيات الأمراض.)

تم إجراء المعالجة التحليلية وقياس الطيف الكتلي كما هو موضح في المواد والطرق. في المجموع ، تم حل 1034 تجربة فردية للترسيب المناعي بواسطة SDS-PAGE ، وتم تصوير البروتينات بواسطة صبغة كوماسي الغروية. أسفرت معالجة الممرات الهلامية المقابلة عن 16 321 نطاق جل تمت معالجتها بواسطة مطياف الكتلة مما أدى إلى توليد أكثر من 400000 أطياف MS / MS تطابق تسلسل الببتيد في قاعدة البيانات. لأكثر من نصف الطعوم ، أجريت تجارب مناعية مكررة. يوضح الشكل 1 تفصيلاً للمجموعة الإجمالية للتجارب حسب النوع.

تحديد الفريسة والتسجيل والتصفية

كما هو مبين في الشكل 1 ، تتكون مجموعة البيانات الخاصة بنا من تجارب الترسيب المناعي المنسوخة والمرة واحدة. ينشأ مستوى إضافي من التكرار من حقيقة أن البروتينات المفترسة قد تكون أو لا تقتصر على عصابات أحادية الهلام في ممر معين. لذلك ، ابتكرنا خط أنابيب لمعالجة البيانات من شأنه أن يدمج وينظم ويزيل التكرار ويزودنا بقائمة رئيسية دقيقة لبروتينات الفريسة المحددة لكل طعم. يقدم الشكل 2 نظرة عامة على هذه العملية. بعد استخراج كل فرقة جل والحصول على بيانات MS / MS (الشكل 2 أ) ، تم البحث في كل ملف بيانات باستخدام محرك البحث التميمة (www.matrixscience.com). ثم تمت إزالة الببتيد والبروتينات منخفضة الجودة من خلال تطبيق قواعد عتبة النتيجة (انظر المواد والطرق). تم دمج جميع البروتينات والببتيد الذي يقابل عصابات الجل من نفس الطعم وتجميعها باستخدام الخوارزمية الموضحة في الشكل 2 د. تقضي الخوارزمية على البروتينات إلى مجموعات إذا كانت مجموعات كل منها من الببتيدات المطابقة مجموعات فرعية مناسبة لبعضها البعض (على سبيل المثال ، إذا كانت مجموعة واحدة من الببتيدات زائدة عن الحاجة تمامًا فيما يتعلق بالأخرى). يمكن بعد ذلك اختيار بروتين تمثيلي (يُطلق عليه "مرساة" الكتلة) من الكتلة. يتم اختيار المرساة عن طريق ترتيب البروتينات داخل الكتلة حسب الدرجة أو عدد الببتيدات ثم اختيار البروتين الأعلى مرتبة. يمكن كسر الروابط بالنظر إلى سمات أخرى ، مثل كمية ونوعية التعليقات التوضيحية لكل بروتين. تزيل هذه العملية التكرار على مستوى التطابقات الببتيدية وتسلسل البروتينات يضمن أن يكون كل من بروتينات المرساة غير زائدة عن الحاجة فيما يتعلق بمكملة الببتيدات المطابقة. ومع ذلك ، فإن نسبة صغيرة (0.5 ٪) من التفاعلات المبلغ عنها زائدة عن الحاجة على مستوى موضع الجين ، أي أن بروتينات الفريسة المتعددة التي تم الإبلاغ عنها ترتبط بنفس اسم الجين. قد تمثل هذه أمثلة على الأشكال الإسوية للبروتين أو المتغيرات ، وبالتالي تُترك في مجموعة البيانات.

تصفية البروتينات الزائفة وغير النوعية

من أجل تقليل عدد التفاعلات الإيجابية الخاطئة ، طبقنا عملية تصفية تجريبية لإزالة البروتينات الزائفة / الملوثة والبروتينات المتفاعلة غير المحددة (الشكل 2E). تم تطبيق ثلاث خطوات تصفية على شبكة التفاعل. تم تلخيص هذه الخطوات في الجدول الأول. أولاً ، كان تحديد بروتين الطُعم نفسه (تمت إزالة تفاعلات الطُعم - الطُعم من الشبكة ، وتم تحديد 97٪ من الطُعم مرة واحدة على الأقل). ثانيًا ، تمت إزالة 207 تفاعلات مقابلة لحالات الانسكاب من حارة هلامية إلى أخرى. أخيرًا ، قمنا ببناء قاعدة بيانات للبروتينات والملوثات التي تحدث بشكل خاطئ بناءً على 202 تجربة تحكم مناعي (ناقل فقط). تمت إزالة تلك البروتينات التي تحدث في 2.5٪ من تجارب التحكم من مجموعة البيانات كما كانت البروتينات تتفاعل مع 5٪ من الطعوم. تتضمن هذه المجموعة المجمعة من البروتينات العديد من الملوثات الشائعة لتجارب قياس الطيف الكتلي (مثل الكيراتين البشري) بالإضافة إلى البروتينات التي لوحظ أنها ترتبط بشكل غير محدد ، وتتضمن عائلات البروتين مثل التوبولين والبروتينات الريبوسومية وبروتينات الصدمة الحرارية.

خطوة التصفية الطعوم بروتينات فريدة التفاعلات
شبكة تفاعل غير مصفاة 407 2826 24 540
إزالة تفاعلات الطُعم - الطُعم أ تلك الحالات التي تم فيها تحديد بروتين الطُعم في تجربة قياس الطيف الكتلي.
407 2826 24 211
إزالة التفاعلات الانسكابية ب ملاحظات الانسكاب الظاهري من ممر جل إلى آخر تم اكتشافه عن طريق الفحص اليدوي للمواد الهلامية وبيانات تحديد الببتيد / البروتين.
407 2826 24 005
قم بإزالة الروابط المتكررة وبروتينات التجربة الضابطة ج ج - تُعرف الروابط المتكررة على أنها بروتينات فريسة تم تحديدها لـ ⩾5٪ من بروتينات التحكم في الطعوم وهي بروتينات "فريسة" تم تحديدها في ⩾2.5٪ من تجارب التحكم.
338 2235 6463
  • (أ) تلك الحالات التي تم فيها تحديد بروتين الطعم في تجربة قياس الطيف الكتلي.
  • (ب) رصد الانسكاب الظاهر من ممر جل إلى آخر عن طريق الفحص اليدوي للمواد الهلامية وبيانات تحديد الببتيد / البروتين.
  • ج - تُعرف الروابط المتكررة على أنها بروتينات فريسة تم تحديدها لـ ⩾5٪ من بروتينات التحكم في الطعم وهي بروتينات "فريسة" تم تحديدها في ⩾2.5٪ من تجارب التحكم.

درجات ثقة التفاعل

نظرًا لأنه يمكن استخدام العديد من مقاييس تحديد الببتيد والبروتين (الدرجات ، والقيم المتوقعة ، وعدد الببتيدات ، وتغطية الببتيد ، وما إلى ذلك) لتقييم الثقة العامة في تحديد الفريسة ، فقد سعينا إلى الجمع بين العديد من هذه المقاييس وإنشاء مقياس شامل لـ ثقة كل ملاحظة فريسة (الشكل 2G). تم استخدام البيانات المقابلة لمجموعة مكونة من 18 طعومًا مكررة جيدًا (⩾5 تجربة ترسيب مناعي) (انظر الشكل 1) كمجموعة تدريب لبناء نموذج انحدار جزئي يعتمد على المربعات الصغرى (PLS) لإمكانية استنساخ بروتين فريسة ، حيث كانت قابلية التكاثر تم اختيار المتغير التابع وستة متغيرات توقع لبناء النموذج. كانت متغيرات التوقع الستة هي درجة التميمة للفريسة في الممر ، والعدد الإجمالي للببتيدات التي لوحظت للفريسة في الممر ، ورتبة بروتين الفريسة في الممر ، وهي قيمة ثنائية تشير إلى ما إذا كانت الفريسة هي الطُعم بالفعل البروتين نفسه ، وهو الحد الأقصى لدرجات التميمة للفريسة عبر جميع العصابات التي لوحظت فيها في الممر وأفضل تصنيف لبروتين الفريسة عبر جميع العصابات في الممر. تم تدريب النموذج على مجموعة الطعم المنسوخة ثم تم تطبيقه على مجموعة البيانات المتبقية. عند إجراء تجارب متعددة للطعم ، تم حساب متوسط ​​قيمة التكاثر المتوقعة عبر جميع الملاحظات الخاصة ببروتين الفريسة المحدد. أخيرًا ، تم تطبيع هذه القيمة إلى ما بين 0 و 1 وتم الإبلاغ عنها على أنها درجة ثقة التفاعل. في عدد قليل من الحالات (حوالي 5٪ من التفاعلات المبلغ عنها) ، لم يتم حساب درجة ثقة التفاعل ، لأن أحد متغيرات التوقع لم يكن متاحًا. على سبيل المثال ، في بعض الحالات ، قد لا يتم الحكم على البروتين الذي تم تحديده على أنه موجود في حارة معينة على أنه موجود في أي من النطاقات الفردية في هذا الممر (قد توجد الببتيدات المقابلة للبروتين في نطاقات مختلفة ، ولا يوجد أي منها بدرجة كافية حتى يتم اعتبار البروتين موجودًا) في هذه الحالات ، لا يتم حساب متغير التوقع المقابل لأفضل رتبة للبروتين عبر جميع النطاقات في الممر. بالنسبة لـ 18٪ من التفاعلات في مجموعة البيانات المصاحبة ، تم الإبلاغ عن درجة ثقة التفاعل على أنها 0. لا يزال يتعين تفسير ملاحظات بروتين الفريسة هذه على أنها صالحة لأنها تلبي عتبات درجة محرك البحث المطلوبة.

لقد تحققنا من مقياس تسجيل تفاعلنا بعدة طرق ، موضحين فائدته كمقياس لثقة التفاعل. أولاً ، باستخدام مجموعة بيانات التدريب الخاصة بنا من الطعوم المستنسخة ، أجرينا التحقق من صحة النموذج بمقدار 10 أضعاف ، وقاسنا قدرة نموذجنا على تقدير إمكانية تكرار إنتاج الفريسة (انظر المعلومات التكميلية). وجدنا علاقة جيدة (ص= 0.66) بين إمكانية التكاثر المرصودة والتكاثر المتوقع عبر مجموعة التدريب لدينا. ثانيًا ، من خلال تحليل المجموعة الفرعية للتفاعلات المعروفة في مجموعة البيانات (انظر القسم التالي) ، لاحظنا أن درجات ثقة التفاعل المعينة لمجموعة التفاعلات المعروفة كانت أعلى بكثير من تلك الدرجات المخصصة لتفاعلات غير معروفة سابقًا لمجموعة التفاعلات المعروفة. متوسط ​​درجة ثقة التفاعل من 0.43 ، في حين أن متوسط ​​المجموعة الكاملة لدرجات ثقة التفاعل هو 0.21 ، وهو فرق ذو دلالة إحصائية (اختبار مجموع رتبة ويلكوكسون ص≪0.0001). ثالثًا ، قمنا بتحليل مجموعة التفاعلات المتبادلة في مجموعة البيانات. في دراستنا ، لم يتم بذل أي جهد واضح لاختبار تفاعلات الطعم والفريسة بشكل متبادل (أي استخدام بروتينات الفريسة المرصودة كطعم ومعرفة ما إذا تم التعرف على بروتينات الطعم الأصلية). ومع ذلك ، لوحظ عدد قليل من التفاعلات (21) بشكل متبادل في مجموعة البيانات. كانت درجات ثقة التفاعل لهذه التفاعلات الـ 21 التي تمت ملاحظتها بشكل متبادل (المتوسط ​​= 0.43) أعلى بكثير (اختبار مجموع رتبة ويلكوكسون ص≪0.0001) من مجموعة التفاعلات التي لم يُلاحظ فيها تفاعل متبادل (المتوسط ​​= 0.25) أو مجموعة البيانات بأكملها (المتوسط ​​= 0.21). تظهر هذه الملاحظات أن درجة ثقة التفاعل هي وسيلة مفيدة لترتيب التفاعلات لاستخراج البيانات اللاحقة. لتسهيل التحليل الأكثر عمقًا لمجموعة البيانات الكبيرة هذه ، ركزنا تفسيرنا المتعمق للتفاعلات بشكل أساسي على التفاعلات مع النتيجة ⩾0.3 ، والتي تقابل ما يقرب من ثلث (2251 تفاعلًا) من مجموعة البيانات. تم اختيار هذه العتبة لأن معظم التفاعلات بين الوحدات الفرعية لمجمعات البروتين جيدة التوصيف والممثلة في مجموعة البيانات (عوامل بدء الترجمة الأولية وحقيقية النواة - انظر أدناه) لها درجات ⩾0.3. بالإضافة إلى ذلك ، بالنسبة لـ 85٪ من بروتينات الفريسة ذات درجة التفاعل 0.3 ، تم تحديد اثنين أو أكثر من متواليات الببتيد المتميزة ، بما يتوافق مع الإرشادات الناشئة لتحديد البروتين القائم على قياس الطيف الكتلي (برادشو وآخرون, 2006 ).

التقييم والتحقق الحسابي

يمكن للأنواع الأخرى من المعلومات الجينومية ، عند دمجها مع تفاعلات البروتين والبروتين ، أن تقدم دليلاً أقوى على العلاقات الوظيفية بين الجينات. تم اقتراح عدة طرق لاستخدام هذه البيانات الجينومية المتعامدة في التقييم الحسابي لبيانات تفاعل البروتين والبروتين عالي الإنتاجية ، مثل المقارنة مع التعبير الجيني ، وتحليل التفاعلات المتعادلة واستخدام معلومات التوطين الوظيفي والخلوي الفرعي (Deane). وآخرون، 2002 فون ميرينغ وآخرون، 2002 روال وآخرون، 2005). في هذا القسم ، نقدم تقييمًا حسابيًا لمجموعة بيانات IP-HTMS من خلال دمج ثلاث فئات من المعلومات الجينومية: مصادر بيانات تفاعل البروتين البشري الأخرى ، شروح GO وبيانات ميكروأري للتعبير الجيني.

من الاعتبارات المهمة عند دمج أنواع البيانات الأخرى كيفية حساب تفاعلات البروتين والبروتين (von Mering وآخرون، 2002). تم اقتراح نموذجين لنمذجة بيانات التفاعل بين البروتين والبروتين: نموذج "التكلم" ، حيث يُفترض أن يتفاعل كل طعم مع كل من بروتينات الفريسة المرصودة ، ونموذج "المصفوفة" ، حيث يتفاعل الطعم وجميع الفرائس مع بعضنا البعض (Bader and Hogue، 2002) اعتمدنا نموذج "الكلام" لجميع تحليلاتنا (ما لم يذكر خلاف ذلك) ، حيث ثبت أن نموذج "المصفوفة" ينتج معدلات أعلى من الإيجابيات الخاطئة (Bader and Hogue ، 2002 ). ومع ذلك ، فإننا ندرك قيود نموذج "الكلام" ، ولا سيما أن تفاعلات الطعم والفريسة التي تم تحديدها في تجارب الترسيب المناعي قد لا تمثل في الواقع مباشرة التفاعلات الفيزيائية بين بروتين الطعم والفريسة.

مقارنة بمصادر بيانات تفاعل البروتين والبروتين الأخرى

وجدت التقارير السابقة بشكل عام تداخلًا ضئيلًا نسبيًا بين مجموعات بيانات تفاعل البروتين والبروتين (Bader and Hogue ، 2002). على سبيل المثال ، أظهرت مقارنة حديثة لكتالوج شامل لتفاعلات الخميرة المنسقة بالأدب لجميع تفاعلات الخميرة عالية الإنتاجية المتوفرة تداخلًا بنسبة 14٪ فقط (Reguly وآخرون، 2006). كما أشار المؤلفون الأخيرون ، من المهم التمييز بين التقاطع المطلق لمجموعتي البيانات (عدد التفاعلات المشتركة بين مجموعات البيانات التي تتم مقارنتها) وتقاطع "مساحة التفاعل" التي تغطيها كل بيانات يضع. بالنسبة لمنصة IP-HTMS ، فإن مساحة التفاعل هي المساحة التي تغطيها مجموعة بروتينات الطعم. على سبيل المثال ، عند مقارنة مجموعة بيانات IP-HTMS بمجموعة بيانات Y2H ، نحدد مساحة IP-HTMS على أنها تفاعلات Y2H حيث يتوافق واحد أو أكثر من المتفاعلات مع طعم IP-HTMS. يسمح إجراء المقارنات بهذه الطريقة بتقديرات واقعية لكيفية تلخيص التفاعلات عبر مختلف الدراسات ومنصات التكنولوجيا.

قارنا مجموعة بيانات IP-HTMS بثلاثة مصادر أخرى لتفاعلات البروتين البشري: مجموعة من التفاعلات المعروفة (Ramani وآخرون، 2005) ، مجموعة من التفاعلات المتوقعة من خرائط تفاعلية حقيقية النواة منخفضة (Lehner and Fraser ، 2004) ودراسة Y2H عالية الإنتاجية (Rual وآخرون، 2005). تم تلخيص التداخل بين مجموعات البيانات هذه ومجموعة بيانات IP-HTMS في الجدول II. يتراوح التداخل بين مجموعة بيانات IP-HTMS وهذه المصادر الثلاثة الأخرى من 6 إلى 11٪ ، على نطاق واسع بما يتماشى مع ملاحظات التداخل بين مجموعة بيانات Y2H البشرية والتفاعلات المنسقة بالأدب (2-8٪) (Rual وآخرون، 2005). من خلال التبديل العشوائي لتفاعلات IP-HTMS مع الطعم والفريسة وإعادة حساب التداخلات ، أكدنا أن التداخلات أكبر بكثير مما هو متوقع بالصدفة (ص& lt0.0001). مقارنات مماثلة في الخميرة بين تفاعلات IP-HTMS (Ho وآخرون، 2002) وتنقية الألفة المنسقة والمترادفة (Gavin وآخرون، 2002) والتفاعلات المنسقة بالأدب 20 و 30٪ على التوالي (Reguly وآخرون، 2006) ، مما يشير إلى أنه تم فهرسة نسبة أكبر بكثير من تفاعل الخميرة مقارنةً بالتفاعل البشري.

مجموعة بيانات تفاعل البروتين والبروتين
معروف براماني وآخرون (2005)
توقعت ب ب لينر وفريزر (2004)
التجريبية (Y2H) ج ج Rual وآخرون (2005)
التفاعلات 31 183 20 469 6727
ظهرت طعوم IP-HTMS في مجموعة البيانات d d طعوم IP-HTMS (من إجمالي 343) التي تظهر في مجموعة البيانات.
216 123 94
التداخل مع مساحة IP-HTMS e عدد التفاعلات في مجموعة البيانات التي تتميز بواحد أو أكثر من طعوم IP-HTMS.
2332 668 366
التقاطع مع IP-HTMS (عدد التفاعلات ، النسبة المئوية من الإجمالي) f عدد التفاعلات المشتركة بين مجموعة البيانات و IP-HTMS.
149, 6.4% 78, 11.4% 29, 7.9%
تقاطع تم تبديله عشوائيًا مع IP-HTMS (الحد الأدنى ، المتوسط ​​، الأقصى) ز عدد التفاعلات المشتركة بين IP-HTMS التي تم تبديلها عشوائيًا (1000 تكرار) ومجموعة البيانات.
7, 14.3, 25 3, 8.0, 14 0, 1.8, 7
دلالة إحصائية للتقاطع (إثراء أضعاف ، ص-value) h h إثراء ثني للتقاطع المرصود عبر التقاطع المتوقع بالصدفة.
∼10 أضعاف ، ص& lt0.0001 ∼10 أضعاف ، ص& lt0.0001 ∼15 أضعاف ، ص& lt0.0001
  • راماني وآخرون (2005)
  • ب لينر وفريزر (2004)
  • ج روال وآخرون (2005)
  • د طعوم IP-HTMS (من إجمالي 343) تظهر في مجموعة البيانات.
  • هـ عدد التفاعلات في مجموعة البيانات التي تتميز بطعم IP-HTMS واحد أو أكثر.
  • و عدد التفاعلات المشتركة بين مجموعة البيانات و IP-HTMS.
  • g عدد التفاعلات المشتركة بين IP-HTMS التي تم تبديلها عشوائيًا (1000 تكرار) ومجموعة البيانات.
  • h أضعاف الإثراء للتقاطع المرصود عبر التقاطع المتوقع بالصدفة.

مجموعات التفاعلات المشتركة بين تفاعلات IP-HTMS البشرية وكل مجموعة من مجموعات البيانات الثلاثة الأخرى هي نفسها متداخلة من إجمالي 256 تفاعلاً متداخلاً بين IP-HTMS ومجموعات البيانات الثلاث الأخرى ، 82 موجودة في اثنين أو أكثر من المجموعات المتداخلة. نلاحظ أيضًا أن التفاعلات المشتركة بين IP-HTMS والمصادر الأخرى للتفاعلات بين البروتين والبروتين البشري لها بشكل عام درجات ثقة أعلى بشكل ملحوظ. متوسط ​​درجات الثقة للتفاعلات المشتركة بين IP-HTMS والمجموعة المعروفة ، IP-HTMS والمجموعة المتوقعة ، و IP-HTMS ومجموعة Y2H هي 0.43 و 0.43 و 0.42 ، على التوالي ، أعلى من المتوقع بالصدفة (ص≪0.0001 اختبار مجموع رتبة ويلكوكسون) بالنظر إلى التوزيع العام لدرجات الثقة.

كما ذكرنا سابقًا ، من المحتمل أن بعض تفاعلات الطعم والفريسة المحددة في تجارب IP-HTMS قد لا تمثل في الواقع مباشرة التفاعلات الفيزيائية بين بروتين الطُعم والفريسة ، ولكن بدلاً من ذلك التفاعلات بين الفرائس. لاستكشاف هذا الأمر بشكل أكبر ، قمنا أولاً بتوسيع مقارناتنا من خلال النظر في مصفوفة جميع التفاعلات الممكنة في مجموعة بيانات IP-HTMS (على سبيل المثال ، بما في ذلك جميع التفاعلات الممكنة بين الفريسة والفريسة لكل طعم). من مصفوفة ∼225K الممكنة لتفاعلات IP-HTMS ، 1678 مشتركة مع المجموعة المعروفة (إحصائيًا أكبر بكثير مما هو متوقع بالصدفة ، ص& lt0.0001). على الرغم من أنه من المتوقع أن تكون دقة اعتبار مصفوفة جميع التفاعلات أقل مما هو عليه عند التفكير فقط في تفاعلات الطعم والفريسة (Bader and Hogue ، 2002) ، فمن الواضح أن العديد من التفاعلات الصالحة لا يزال يتعين اكتشافها من هذا النهج الأوسع.

ثانيًا ، قمنا بمقارنة تفاعلات IP-HTMS مع الأدبيات باستخدام برنامج Pathway Studio (Ariadne Genomics). يتيح هذا البرنامج إمكانية التعليق التوضيحي السريع لتفاعلات البروتين والبروتين مع الأدبيات المستخرجة من مصادر مختلفة. باستخدام هذا النهج ، تم شرح 145 تفاعلًا بروتينيًا بروتينًا في مجموعة بيانات IP-HTMS كما هو الحال في الأدبيات. من أجل تحديد تفاعلات IP-HTMS التي تمثل تفاعلات غير مباشرة بين الطُعم والفريسة ، قمنا باستخراج الأدبيات بالطريقة التالية. تم اختيار أزواج الطعم والفريسة من تجارب IP-HTMS الخاصة بنا والتي لها التحقق من صحة الأدبيات في قاعدة بيانات Pathway Studio. تم بعد ذلك توسيع شبكة التفاعل عن طريق استخراج جميع المتفاعلات المعروفة من الأدبيات الموجودة ضمن حافتي الفريسة. قمنا بعد ذلك بتداخل التفاعلات التجريبية مع الشبكة الموسعة بحيث أخذنا في الاعتبار جميع المسارات ذات الطول الثاني لكل طُعم حيث يكون كل من أزواج (الطُعم والفريسة) و (الطُعم والمتفاعل مع الفريسة) في IP-HTMS ، وبالتالي ، يمكن استنتاج الزوج (فريسة ، متفاعل الفريسة). لقد فعلنا الشيء نفسه بالنسبة للمسارات التي يبلغ طولها ثلاثة ، وقمنا بتعداد جميع أزواج الطول المميزة - واحدًا من الأدبيات التي كانت جزءًا من المسارات المتداخلة. هذا يسمح لنا بتوسيع نطاق التحقق من صحة مجموعة البيانات الخاصة بنا بشكل كبير باستخدام الأدبيات من خلال تضمين ليس فقط الطعم والفريسة ولكن أيضًا التفاعلات بين الفريسة. من خلال تحليلنا الإضافي ، زاد العدد الإجمالي للتفاعلات المرصودة التي عززتها الأدبيات إلى 375. وهذا يمثل زيادة بمقدار 2.6 ضعفًا في التحقق مما يقابل 6٪ من جميع تفاعلاتنا. يتم توفير مجموعة التفاعلات هذه في الجدول التكميلي الرابع. لقد استخدمنا هذا النهج بطريقة مفصلة لتوسيع الشبكات لبروتينات الطعم الفردية. ويرد مثال على ذلك في الشكل التكميلي الثالث. أربعة فقط من المتفاعلات المباشرة لـ VHL من مجموعة بياناتنا متطابقة مع الأدبيات. باستخدام نهجنا الجديد ، قمنا بتوسيع التفاعل المحيط بـ VHL ضمن حافتي أدبيات. أدى هذا إلى زيادة عدد البروتينات التي شوهدت في تجربة VHL IP-HTMS المرتبطة بـ VHL من خلال الأدبيات إلى 13 (زيادة ثلاثة أضعاف). الروابط التسع الجديدة غير مباشرة ولكنها مرتبطة من خلال تفاعلات معروفة لـ VHL.

تفاعلات Paralogous

تم اقتراح العلاقات التطورية بين الجينات عبر الأنواع وداخلها كمصادر لاكتشاف وتأكيد تفاعلات البروتين والبروتين (ماثيوز وآخرون، 2001). في الخميرة ، ثبت أن التفاعلات بين أزواج البروتينات أكثر ثقة إذا حدثت تفاعلات أيضًا بين نظائر المتفاعلات (Deane وآخرون، 2002). طور المؤلفون الأخيرون طريقة التحقق المتماثل ، وأظهروا أنه في الخميرة كانت الطريقة قادرة على التنبؤ بنسبة 40٪ من التفاعلات الحقيقية بمعدل إيجابي كاذب بنسبة 1٪ (Deane وآخرون, 2002 ).

استكشفنا فائدة هذه الطريقة لتقييم مجموعة بيانات IP-HTMS من خلال تجميع مجموعة من 1999 مجموعات من نظائرها البشرية (تمثل 6023 جينًا بشريًا) من قاعدة بيانات inparanoid (O'Brien وآخرون، 2005). حددت الإحالات المرجعية إلى مجموعة بيانات IP-HTMS 834 تفاعلًا يمكن لكل من الطعم والفريسة تخصيص واحد أو أكثر من نظائرها. بشكل عام ، 154 من هذه التفاعلات البالغ عددها 834 (18٪) كان لها واحد أو أكثر من التفاعلات المماثلة. يتم توفير مجموعة من 154 تفاعلًا paralogous كمعلومات تكميلية (الجدول التكميلي III).

في كثير من الحالات ، تتكون هذه التفاعلات المتوازية من طُعم واحد يتفاعل مع اثنين أو أكثر من بروتينات الفريسة (المتقابلة) ذات الصلة. كنا نرغب أيضًا في اختبار المعدل الذي تحدد فيه الطعم المتماثل نفس البروتينات الفريسة أو ذات الصلة. توفر مجموعة بيانات IP-HTMS فرصة للقيام بذلك ، لأنه بالنسبة لـ 16 من طعوم IP-HTMS ، تم أيضًا استخدام واحد أو أكثر من Paralogs كطعم. تتوافق هذه الطعوم الـ 16 مع 157 تفاعلًا تم تخصيص نظائر لها ، و 57 من هذه التفاعلات متشابهة (36٪). أحد التحذيرات لتحليل بيانات IP-HTMS بهذه الطريقة هو أنه لا يمكن التمييز بين التفاعلات المستقلة للطعم المتماثل مع بروتينات الفريسة نفسها أو ذات الصلة والسيناريو الذي تتفاعل فيه الطعوم المتعادلة مع بعضها البعض (على سبيل المثال ، غير المتجانسة) وذلك ثم يحدد المركب نفس مجموعة الفرائس بغض النظر عن الطُعم المستخدم. تشتمل المجموعة المكونة من 16 طعمًا متوازيًا على ثلاثة أعضاء من عائلة البروتين 14-3-3 ، YWHAB و YWHAQ و YWHAZ. من المعروف أن هذه البروتينات تشكل متجانسة ومغايرة في الجسم الحي (جونز وآخرون، 1995) وساهموا معًا في 35 من 57 تفاعلًا من الطعم المتماثل. ومع ذلك ، يعد هذا دليلًا مفيدًا على إمكانية استنساخ الطعم المتماثل ، فالطعم الثلاثة 14-3-3 تحدد إجمالي 117 بروتينًا فريسة ، تم تحديد 33 منها بواسطة أكثر من واحد من الطعوم. أخيرًا ، نلاحظ أن التفاعلات المدعومة بتفاعل مماثل لها درجات ثقة تفاعل أعلى بشكل ملحوظ ، حيث أن المجموعة المكونة من 154 تفاعلًا paralogous لها متوسط ​​درجة 0.33 ، مقارنةً بـ 0.21 عبر مجموعة البيانات بأكملها (اختبار مجموع تصنيف Wilcoxon ص≪0.0001). كما أشار دين وآخرون (2002) ، طريقة التحقق من Paralogous مفيدة فقط حيث يمكن تحديد Paralogs. هذا ممكن فقط لجزء صغير نسبيًا (834 من 6463 تفاعلًا) من مجموعة بيانات IP-HTMS. ومع ذلك ، فإننا نعتقد أن هذا التحليل الأولي الأول للتفاعلات المماثلة في التفاعل البشري يوضح إمكانية إجراء مزيد من الدراسات المتعمقة حيث تتحسن قدرتنا على تعيين المتماثلات وتزداد معرفتنا بالتفاعل البشري.

العملية البيولوجية وتخصيب المسار

للحصول على نظرة عامة على فئات البروتينات التي تم تحديدها على أنها فريسة لكل من الطعوم ، استخدمنا GO (مجموعات فرعية رفيعة) لتحليل العملية البيولوجية وتمثيل فئة المكونات الخلوية. في كلتا الحالتين ، يكون توزيع بروتينات الفريسة بين الفئات مشابهًا لتوزيع الفئات بين بروتينات الطعم ، وهي أكثر فئات بروتينات العملية البيولوجية للطعم تمثيلًا جيدًا - تعديل البروتين ، والتخليق الحيوي للبروتين ، ودورة الخلية ، والنسخ ونقل الإشارة ، وهي أيضًا فئات بروتين الفريسة الأكثر تمثيلًا.

استخدمنا التعليق التوضيحي GO لتحليل الدرجة التي يتشارك بها مفاعلو الطعم والفريسة نفس فئات GO أو ذات الصلة. بالنسبة لبيانات الخميرة عالية الإنتاجية ، تم تقدير أجزاء التفاعلات التي يكون لكل من المتفاعلين فيها نفس العملية البيولوجية عالية المستوى أو فئات المكونات الخلوية بنسبة 20 و 27 ٪ ، على التوالي (Reguly وآخرون، 2006). بالنسبة لبيانات IP-HTMS الخاصة بنا ، تبلغ هذه الكسور 12 و 20٪ على التوالي. لتوضيح هذه الارتباطات بمزيد من التفصيل ، قمنا بإنشاء خرائط مصادفة للطعم والفريسة (الشكل 3) يتم فيها اختبار الارتباط بين كل مجموعة من فئات الطعم والفريسة GO باستخدام جدول طوارئ واختبار إحصائي (اختبار فيشر الدقيق). كل مجموعة من فئات الطعم GO ، أنا، وفريسة GO الفئة ي، يمثل كخلية في المصفوفة ، ويمثل لون الخلية الدلالة الإحصائية للارتباط بين فئة الطعم أنا والفريسة ي. قمنا أيضًا بتنفيذ إجراء التقليب لوصف توزيع ص- القيم المشتقة من الجمعيات العشوائية (انظر المواد والطرق). القائم على التقليب ص- تم حساب القيمة لكل مجموعة من فئات الطعم والفريسة على أنها جزء من مرات اختبار فيشر الدقيق ص- كانت القيمة أقل من القيمة "الحقيقية" التي تمت ملاحظتها ص-القيمة. على هذا الأساس ، مجموعات فئة الطعم والفريسة مع ص- القيم التي تقل عن 0.0001 أو تساويها جميعًا تعتبر أصغر بدرجة كبيرة ص- لم تُلاحظ القيم لكل من مجموعات الفئات هذه عبر 1000 تبديل عشوائي مستقل لفئات الطعم والفريسة.

كشف هذا التحليل عن ميل كبير للطعم للتفاعل مع بروتينات الفريسة المتورطة في نفس العملية البيولوجية أو ما شابهها (الشكل 3 أ و ب). على سبيل المثال ، كانت مجموعات فئات العمليات البيولوجية للطعم والفريسة الأكثر أهمية هي التخليق الحيوي للبروتين / التخليق الحيوي للبروتين (ص= 1.7e − 09) وتقويض / تقويض (ص= 2.3e − 08). تتوافق هذه مع مجموعتين مترابطتين للغاية من البروتينات المتفاعلة التي تمثل مجمعات جزيئية معروفة - عوامل بدء الترجمة والاستطالة والبروتوزوم (تمت مناقشة كلاهما بمزيد من التفصيل أدناه). تم الحصول على نتائج مماثلة لفئات المكونات الخلوية (الشكل 3C و D) ، باستثناء أنه شوهدت أيضًا ارتباطات كبيرة خارج القطر. وعلى وجه الخصوص ، لوحظ وجود إثراء كبير بين الطعوم المخصصة لطعوم غشاء البلازما والشبكة الإندوبلازمية / فرائس جولجي. يرجع هذا التخصيب إلى حد كبير إلى تفاعل اثنين من الطعوم فائقة الأسرة لمستقبل عامل نخر الورم (TNFRSF14 و TNFRSF5) مع العديد من بروتينات فريسة الشبكة الإندوبلازمية. يتفاعل هذان الطعمان مع مجموعة متداخلة من البروتينات المرتبطة بالشبكة الإندوبلازمية بما في ذلك العديد من مكونات مجمع إشارة الببتيداز الميكروسومي وأفراد عائلة إيزوميراز ثنائي كبريتيد البروتين المرتبط بالشبكة الإندوبلازمية. على الرغم من أنه ليس من الواضح ما قد يكون التفسير البيولوجي الفعلي ، فإننا نعتقد أن هذه ليست ملاحظات زائفة لأن هذه المجموعة من بروتينات الفريسة يتم تحديدها أيضًا باستخدام طعم TRAF6 (العامل المرتبط بمستقبلات TNF) ، وهو وسيط معروف للإشارة من TNFRSF5.

سهّل التحليل المتكامل لفئات IP-HTMS و GO أيضًا اكتشاف بعض التفاعلات المحددة للغاية ولكن ذات الأهمية الطبية الحيوية المحتملة. يتم تعيين عدد قليل نسبيًا من البروتينات في مجموعة بيانات IP-HTMS إلى البيروكسيسوم (تتضمن 17 تفاعلًا طعمًا أو فريسة بيروكسوسومات). من بين هذه التفاعلات ، لوحظ تفاعل واحد بين طعم بيروكسيسومال وفريسة بيروكسيسومال: تم التعرف على طعم PHYH (phytanoyl-CoA 2-hydroxylase) ABCD3 (شريط ربط ATP ، فصيلة D) كفريسة. تتورط العيوب في أداء كل من PHYH و ABCD3 في متلازمة زيلويغر واضطرابات تكوين بيروكسيسومات أخرى ، وهي مجموعة من الأمراض الوراثية الشديدة (المميتة) (Moser، 1999 Steinberg وآخرون، 2006). بالإضافة إلى ذلك ، أظهرت العديد من الدراسات التفاعلات بين بروتينات ABCD وعوامل التكوُّن الحيوي البيروكسيسومي (بروتينات PEX) وبين بروتينات PHYH و PEX (Liu). وآخرون، 1999 جلوكنر وآخرون، 2000). على حد علمنا ، فإن ملاحظتنا هي أول مؤشر على تفاعل البروتين والبروتين بين PHYH و ABDC3.

إحالة معلومات التعبير الجيني

تم إثبات تشابه متزايد في ملامح التعبير الجيني للجينات التي تشفر البروتينات المتفاعلة في الخميرة (Ge وآخرون، 2001). تم الإبلاغ عن أدلة أولية على أن هذا قد يكون هو الحال أيضًا في حقيقيات النوى الأعلى أنواع معينة انيقة (لي وآخرون، 2004) وفي البشر (Hahn وآخرون، 2005 روال وآخرون، 2005). في الحالة الأخيرة ، شوهد الإثراء لارتباط أعلى للتعبير الجيني لكل من التفاعلات المشتقة من الأدب ، وإن كان ذلك على مستوى أقل ، لمجموعة البيانات المشتقة تجريبياً (Rual وآخرون، 2005). إحدى القضايا الرئيسية في محاولة قياس ما إذا كانت هناك علاقة بين التعبير الجيني ومجموعات بيانات تفاعل البروتين هي عدم الاكتمال والطبيعة التعسفية لاختيار بيانات التعبير الجيني البشري المناسبة. بدلاً من تحديد مجموعات البيانات الفردية التي يمكن قياس التعبير المشترك عليها ، استخدمنا خلاصة وافية لقياسات التعبير المشترك الناتجة من 3924 مصفوفة ميكروية من 60 دراسة بشرية مختلفة (لي وآخرون، 2004). تُعرَّف روابط التعبير المشترك في هذه الدراسة على أنها إيجابية أو سلبية بناءً على وضعها داخل أقصى توزيعات الارتباط لكل دراسة (Lee وآخرون، 2004). يوضح الشكل 4 الكسور ذات الصلة من روابط التعبير المشترك الإيجابية والسلبية لعدة مجموعات من بيانات التفاعل. بالنسبة للمجموعة الكاملة التي تضم ما يقرب من 9 ملايين من قياسات التعبير المشترك ، لوحظ تحيز طفيف نحو القياسات الإيجابية (Lee وآخرون، 2004). أكدنا أولاً أن نسبة أعداد التعبير المشترك الإيجابية إلى السلبية للقياسات داخل مساحة IP-HTMS (على سبيل المثال ، حيث يتوافق واحد أو أكثر من الجينات المتضافرة مع طعم IP-HTMS) كانت مشابهة إلى حد كبير للتحيز الملحوظ في مجموعة البيانات الكاملة (النسب الإيجابية إلى السالبة هي 1.25 و 1.32). لاحظنا بعد ذلك أنه لوحظ ارتفاع النسب الإيجابية إلى السلبية لكل من مجموعة بيانات IP-HTMS ومجموعة بيانات Y2H البشرية (Rual وآخرون، 2005) وللمجموعة المعروفة من التفاعلات (Ramani وآخرون، 2005) ، مما يشير إلى أن أزواج الجينات البشرية التي تشفر البروتينات المتفاعلة من المرجح أيضًا أن تكون مشتركة. تتشابه مقادير النسب الموجبة إلى السالبة لمجموعات بيانات IP-HTMS و Y2H (2.33 و 2.50 على التوالي) ، في حين أن النسبة للمجموعة المعروفة أعلى بكثير (4.75). لقد أكدنا أيضًا أن نسبة أعداد التعبير المشترك الإيجابية إلى السلبية لمجموعة بيانات IP-HTMS أعلى من الناحية الإحصائية (ص& lt1e − 6 ، 1 مليون تكرار) مما كان متوقعًا عن طريق الصدفة عن طريق مجموعات أخذ العينات العشوائية (1028 زوجًا للتعبير المشترك - بنفس حجم التداخل الملحوظ) لأزواج التعبير المشترك من مساحة IP-HTMS (النسبة المتوسطة = 1.32 ، النسبة القصوى = 1.68).

لقد استخدمنا أيضًا بيانات IP-HTMS المدمجة وبيانات التعبير المشترك للجينات لمزيد من الاكتشاف المتعمق للعلاقات الوظيفية بين الجينات. تم عزل بروتين LYAR (الجسم المضاد التفاعلي Ly-1) في الأصل من خط خلايا سرطان الدم في الخلايا التائية للفأر وتبين أنه يشفر بروتينًا محليًا في الغالب النواة (Su وآخرون، 1993). كطعم IP-HTMS ، حدد LYAR 79 بروتينًا فريسة ، ومن بينها 32 تم العثور عليها أيضًا كجينات متضافرة في قاعدة بيانات التعبير المشترك (Lee وآخرون، 2004). تم تصنيف اثني عشر من روابط التعبير المشترك هذه على أنها صارمة (لوحظ التعبير المشترك عبر ثلاث أو أكثر من دراسات التعبير الجيني) (لي وآخرون، 2004) ، وتم تمثيلها في الشكل 5. جميع المعبِّرات المشتركة / المتفاعلات الاثني عشر متداخلة بشكل إيجابي ويتم توزيعها بشكل غير عشوائي ضمن توزيع كل التعبيرات المشتركة ص- قيم LYAR (انظر الشكل 5). في الواقع ، اثنان من المتفاعلات LYAR ، BRIX و DKC1 ، هما الجينان الأكثر تعايشًا في LYAR عبر قاعدة بيانات التعبير المشترك الكاملة. تم توثيق كل البروتينات المتفاعلة / المتفاعلة الـ 12 (باستثناء بروتين افتراضي واحد) كبروتينات نووية (انظر الشكل 5). بشكل عام ، أنماط التعبير / التفاعل المتماسكة هذه ليست غير شائعة في مجموعة البيانات لدينا 32 طعوم IP-HTMS تُظهر تعبيرًا مشتركًا صارمًا مع اثنين أو أكثر من بروتينات الفريسة.

التفسير البيولوجي لشبكة التفاعل

التصور العالمي لمجموعة بيانات IP-HTMS

للمساعدة في تفسير مجموعة بيانات IP-HTMS ، قمنا بتصور شبكة التفاعل بطريقتين. أولاً ، لتصور مجموعة البيانات عالميًا ، قمنا بتطوير خريطة اتصال الطعم والطعم (الشكل 6 أ و ب). يقلل هذا التصور من التعقيد ويسلط الضوء على السمات البارزة لمجموعة البيانات من خلال تمثيل بروتينات الطعم فقط ودرجة مشاركة بروتينات الفريسة. ثانيًا ، قمنا بتصور شظايا مختارة من خريطة التفاعل (الطعوم والفرائس) الكاملة (الشكل 6C-F). تمت مناقشة الأهمية البيولوجية لاثنتين من هذه الخرائط (عائلة NIMA كيناز ، تفاعلات Nek6 وبدء الترجمة والاستطالة) بمزيد من التفصيل في الأقسام اللاحقة.

العديد من ميزات مجموعة البيانات واضحة من خريطة الطعم في الشكل 6 أ. أولاً ، كما هو موضح في الجزء السفلي من الرسم البياني ، فإن العديد من الطعوم (حوالي 30٪) متصلة بشكل ضعيف ، أي أن مجموعة بروتينات الفريسة التي تم تحديدها مختلفة تمامًا عن مجموعة الفرائس المحددة لأي طعم آخر.هذا نتيجة لكل من التصفية التجريبية التي تم تطبيقها على مجموعة البيانات (حيث تمت إزالة البروتينات والبروتينات المتكررة التي لوحظت في تجارب التحكم والتي كانت ستميل إلى ضم جميع الطعوم إلى بعضها البعض) وحقيقة أن الطعم المختار من أجل الدراسة عبارة عن بروتينات متورطة في مجموعة متنوعة من الأمراض والعمليات والمسارات والمجمعات. ثانيًا ، في حالة توفر بيانات من طُعم متعددة من نفس المعقد والعملية ، فإن تلك الطُعم مرتبطة جيدًا ببعضها البعض. العديد من هذه المجموعات المترابطة من الطعوم موضحة في الشكل 6 أ و ب (تمت الإشارة إليها بالأرقام الرومانية). على سبيل المثال ، تشكل الطعوم الخمسة المقابلة للبروتيازوم المتضمن في الدراسة شبكة متميزة ومتصلة جيدًا إلى حد كبير كما هو موضح في الشكل 6 أ و ب ، اللوحة الرابعة. يظهر الشكل 6 ج خريطة التفاعل الكاملة لهذه الطعوم الخمسة. تشتمل بروتينات الفريسة المحددة على العديد من المكونات الأساسية والتنظيمية للبروتيازوم. تشتمل مجموعات الطعوم الأخرى المترابطة جيدًا على مكونات معقدة من مجموعة الوصلات (الشكل 6 أ و ب ، اللوحة الأولى) ، مكونات إعادة تشكيل الكروماتين (الشكل 6 أ و ب ، اللوحة الثانية) ، طعوم عامل الترجمة والاستطالة (الشكل 6 أ و ب ، اللوحة الثالثة) ، 14-3-3 طُعم بروتين (الشكل 6A و B ، اللوحة v) ومكونات مسار سومويل (الشكل 6 أ و ب ، اللوحة السادسة). بالنسبة للعديد من مجموعات الطعم المتصلة جيدًا ، قمنا أيضًا بتمثيل خرائط التفاعل الكاملة المقابلة (الشكل 6 أ و ب ، اللوحة الثالثة تتوافق مع الشكل 6 و ، الشكل 6 أ و ب ، اللوحة الرابعة تتوافق مع الشكل 6 ج ، والشكل 6 أ و ب ، اللوحة السادس يتوافق مع الشكل 6 د). حدد كل من الطعوم 14-3-3 (الشكل 6A و B ، اللوحة v) مجموعة متداخلة إلى حد كبير من الفرائس ، وهي نتيجة متوقعة بالنظر إلى أن هذه البروتينات تشكل متجانسة ومتغايرة. في الجسم الحي (جونز وآخرون، 1995). تم الإبلاغ سابقًا عن مجموعة فرعية من التجارب للطعم الأربعة 14-3-3 المتضمنة في دراستنا وتحليلها بعمق (جين وآخرون، 2004) (تم الإبلاغ عن حوالي 60٪ من بروتينات الفريسة 14-3-3 المذكورة في الدراسة الحالية بواسطة Jin وآخرون (2004)). بالإضافة إلى ذلك ، قام هؤلاء المؤلفون بتحليل ملفات تعريف المجال لبروتينات الفريسة المحددة وتحققوا من صحة التفاعل مع منشط Rho GTPase ، AKAP13 ، وهو تفاعل تم تحديده في دراستنا مع اثنين (YWHAB و YWHAG) من أربعة طعوم 14-3-3.

كينازات عائلة نيما والشلال الانقسامي

تم وصف NIMA (لم يحدث أبدًا في جين الانقسام أ) في الأصل نيدولانس الرشاشيات كمنظم رئيسي للدخول في الدورة الانقسامية. ومن ثم ، تم العثور على عائلات كينازات مرتبطة بـ NIMA (Nek) منذ ذلك الحين موزعة على نطاق واسع في حقيقيات النوى مع دور محفوظ في تنظيم الانقسام (Lu and Hunter ، 1995 O'Connell وآخرون، 2003). في البشر ، تم وصف 11 فردًا من عائلة نيك. كان Nek6 سابقًا ضروريًا للتقدم الانقسامي في الخلايا البشرية ، واقترح أنه مهم بشكل خاص للانتقال بين الطور الطوري (Yin). وآخرون، 2003) وتكثيف الكروماتين (هاشيموتو وآخرون، 2002). اقترح تحليل التعبير أيضًا ارتباطًا بين أفراد عائلة نيك مع عدم استقرار الكروموسومات والسرطان (Bowers and Boylan ، 2004 Hayward and Fry ، 2005). تم استخدام طعم Nek6 في ثلاث تجارب IP-HTMS ، وتم تحديد 42 بروتينًا فريسة (انظر خريطة التفاعل في الشكل 6E). من المهم بشكل خاص في هذه المجموعة من البروتينات المتفاعلة Nek6 تلك التي لها أدوار في الشلال الانقسامي وإعادة تشكيل الكروموسومات وتنظيم دورة الخلية. تم تحديد كل من Nek7 و Nek9 على أنهما بروتينات متفاعلة بثقة عالية (Nek9 هي أعلى فريسة تسجل لـ Nek6). بالإضافة إلى ذلك ، فإن هذين البروتينين الفريستين هما نوعان من البروتينات المحددة تمامًا تم تحديد Nek7 فقط في تجارب Nek6 ، بينما تم تحديد Nek9 بطعم آخر ، GABARAPL2. أظهر العمل السابق أن Nek9 ينشط Nek6 أثناء الانقسام وربما ينظم Nek7 أيضًا (Belham وآخرون، 2003). بالإضافة إلى ذلك ، أظهرت تجارب الترسيب المناعي السابقة أن Nek6 يرتبط Nek9 (Nercc1) (Roig وآخرون، 2002). حددت تجارب Nek6 أيضًا المكونات الرئيسية لمجمعات cohesin و condensin (SMC1L1 و SMC2L1 و MTB و CNAP1 و CSPG6 و MCM7) اللازمة للتكثيف والعزل والصيانة الهيكلية للكروموسومات أثناء الانقسام بالإضافة إلى العديد من البروتينات المرتبطة بالأنابيب الدقيقة (EML2 و EML3 و EML4). على الرغم من عدم فهمها جيدًا ، يُعتقد أن بروتينات "شوكيات الجلد الدقيقة المرتبطة بالأنابيب الدقيقة" تلعب دورًا في تنظيم ديناميكيات الأنابيب الدقيقة أثناء الانقسام (Eichenmuller وآخرون، 2002). في دراستنا ، تم التعرف على هذه البروتينات فقط بطعم Nek6. حدد Nek6 أيضًا العديد من منظمات دورة الخلية المعروفة (WEE1 و CDC37 و RBL1) ، على الرغم من أننا نلاحظ أن البروتين الشبيه بالورم الأرومي الشبكي ، RBL1 ، قد ظهر سابقًا أنه يربط MCM7 (Sterner). وآخرون، 1998) ، مما يشير إلى أن Nek6 قد لا يرتبط مباشرة بكل من هذين البروتينين. إلى جانب الارتباط القوي بين Nek6 والدورة الانقسامية ، يتفاعل Nek6 مع العديد من البروتينات المشاركة في الاستيراد / التصدير النووي (TNPO3 و IPO4 و XPO5 و NUP93). ومن المثير للاهتمام ، يبدو أن كيناز NIMA مطلوب لإجراء تغييرات توافقية في مجمع المسام النووي أثناء الانقسام الفتيلي في فطر الرشاشيات (دي سوزا وآخرون، 2004). علاوة على ذلك ، تم عرض تفاعل مباشر بين nucleoporin 93 kDa (NUP93) و NIMA kinase واقتراح أنه ضروري للتراكم النووي للمنظمات الانقسامية (De Souza) وآخرون، 2003). لذلك تشير بياناتنا إلى أن أفراد عائلة Nek مطلوبون أيضًا لتنظيم معقد المسام النووي في حقيقيات النوى الأعلى.

عوامل بدء الترجمة والاستطالة

الآليات الجزيئية الكامنة وراء تخليق البروتين في الكائنات حقيقية النواة معقدة ومفهومة جزئيًا فقط (Kapp and Lorsch ، 2004). يمكن تقسيم عملية الترجمة حقيقية النواة إلى أربع خطوات: البدء - تجميع الريبوسوم عند كودون البدء ، الاستطالة - وضع aminoacyl tRNAs في موقع المستقبل ، الإنهاء - يحدث عند مواجهة كودون التوقف ، وأخيرًا إعادة تدوير آلات الريبوسوم. كجزء من تخطيط تفاعل البروتين لدينا ، اخترنا ستة بروتينات عامل بدء الترجمة حقيقية النواة (EIF) كطعم (EIF2B1 ، EIF3S10 ، EIF4A1 ، EIF4A2 ، EIF4EBP1 و GC20). تم تحديد ما مجموعه 222 تفاعلًا لهذه الطعوم الستة ، بشكل أساسي مع GC20 (162 تفاعلًا) و EIF4A2 (42 تفاعلًا). خمسة وسبعون تفاعلًا لها درجة ثقة تفاعل أكبر من 0.3 ، و 60٪ من هذه التفاعلات مع بروتينات عامل بدء حقيقية النواة أو مكونات آلية الترجمة. نركز مناقشتنا هنا على هذه المجموعة الفرعية من التفاعلات. تلخص نتائجنا العديد من المجمعات والخطوات المعروفة المتضمنة في بدء الترجمة وتوضح خصوصية وحساسية نهج IP-HTMS. يوضح الشكل 6F خريطة تفاعل الطعم والفريسة لطعم عامل البدء الستة. يتم عرض جميع التفاعلات باستثناء طعوم GC20 و EIF4A2 ، حيث يتم عرض بروتينات الفريسة المحددة فقط.

تتمثل الخطوة الأولى لبدء الترجمة في تكوين مركب ثلاثي بين GTP و Met-tRNA و EIF2 وربط هذا المركب و EIFs الأخرى بالمجمع الريبوزومي 40S لتشكيل مجمع 43S المسبق (Pestova وآخرون، 2001). لاحظنا العديد من المجمعات التي تشارك في هذه العملية. GC20 هو تجانس لبروتين الخميرة SUI1 / EIF1 ، المعروف أنه مطلوب لربط مركب GTP / Met-tRNA / EIF2 بالريبوسوم 40S (Majumdar وآخرون، 2003). في تجاربنا ، حدد طُعم GC20 عدة مكونات لمركب EIF2.

مطلوب أيضًا EIF3 لتوليد مجمع ما قبل البدء المستقر 40S. حددت تجاربنا مع GC20 و EIF3S10 العديد من مكونات EIF3 (EIF1 (GC20 homolog) التي سبق أن ثبت أنها تتفاعل مع EIF3 (Fletcher وآخرون, 1999 )).

توضح تجارب EIF3S10 خصوصية وحساسية نهج IP-HTMS الذي حدد هذا الطعم ثمانية بروتينات فريسة ، سبعة منها موثقة من وحدات EIF3 الفرعية. ومن المثير للاهتمام أن بروتين الفريسة المتبقي ، GA17 ، بروتين الخلية التغصنية ، يحتوي على مجال عامل نيتزوم P roteasome / C OP9 / I (PCI) ، وهو مجال ذو وظيفة غير معروفة ولكنه يُرى في مكونات مجمعات متعددة الوحدات الفرعية ، مثل البروتيازوم. و COP9 و EIF3. تدعم نتائجنا العمل الأخير الذي يشير إلى أن GA17 هي وحدة فرعية إضافية لـ EIF3 (Unbehaun وآخرون, 2004 ).

الخطوة التالية في العملية هي ربط mRNA لتشكيل مجمع ما قبل البدء 43S. من المعروف أن EIF4H يتفاعل مع EIF4A كجزء من هذه العملية وقد لوحظ في تجاربنا (Richter وآخرون، 1999). تمت ملاحظة كل من EIF4A و EIF4H في البيانات الأولية لتجارب GC20 المناعية ، على الرغم من إزالة EIF4A بناءً على معايير التصفية الخاصة بنا وخصص EIF4H درجة ثقة منخفضة للتفاعل.

تحتوي رنا رسول حقيقيات النوى على غوانوزين معدل ، يُطلق عليه غطاء ، في نهاياتها 5. لكي تستمر الترجمة ، يلزم ربط عامل بدء ، EIF4E ، ببنية الغطاء (ريختر وسوننبرغ ، 2005). يربط EIF4B بالقرب من غطاء الرنا المرسال ذو 5 محاور في وجود EIF4F و ATP. تعتبر EIF 4G1 و 4G2 و 4E و 4A مكونات معروفة لمجمع EIF4F متعدد الوحدات ، وقد لوحظت جميعها في تجاربنا مع طعوم EIF4. يتم تنظيم EIF4E وترجمة البروتين ككل جزئيًا بواسطة بروتين ربط EIF4E ، EIF4EBP1 (Haghighat وآخرون، 1995). في تجاربنا ، حدد طعم EIF4EBP1 بروتين فريسة واحد ، EIF4E. تم تحديد بروتين PDCD4 (موت الخلية المبرمج 4) كفريسة في كل من تجارب EIF4A1 و EIF4A2. تم الإبلاغ عن أن منتج الجين PDCD4 مثبط للأورام والتحول وتم اقتراحه كهدف لعلاج السرطان (Lankat-Buttgereit and Goke ، 2003). كما ثبت أن PDCD4 يمنع الترجمة من خلال ربطه بـ EIF4A و EIF4G (Yang وآخرون، 2004 زاكوفيتش وآخرون، 2005). تدعم نتائجنا هذه التقارير وتشير إلى أن PDCD4 يتفاعل بشكل خاص جدًا مع آلية الترجمة لم يُشاهد PDCD4 إلا مع طعوم EIF4A1 و EIF4A2.

أخيرًا ، يعمل EIF2B لإعادة تدوير مجمع EIF2 – GDP وإعادة إنشاء EIF2 – GTP ، والذي يكون جاهزًا بعد ذلك لجولة بدء لاحقة. حدد الترسيب المناعي باستخدام EIF2B1 ستة بروتينات فريسة ، اثنان منها (EIF2B3 و EIF2B5) موثقان من مكونات EIF2B.

لقد زودنا IP-HTMS بلقطة من التفاعلات التي تحدث أثناء العملية المعقدة لبدء الترجمة حقيقية النواة. من خلال ستة بروتينات للطعم تغطي العمليات الرئيسية للبدء ، يمكننا تحديد العديد من البروتينات المتفاعلة ذات الصلة وتوفير مجموعة بيانات غنية لمزيد من الاكتشاف.

افاق المستقبل

تقدم هذه الدراسة أول تحليل عالي الإنتاجية لمجمعات البروتين الأصلية بواسطة IP-HTMS في خط خلية بشرية. كما هو موضح في هذا التقرير ، توفر مجموعة البيانات الخاصة بنا إعادة تلخيص كل من المجمعات المعروفة واكتشاف التفاعلات والمجمعات الجديدة. على الرغم من أن مجموعة البيانات لدينا تحدد التفاعلات للبروتينات المتورطة في مجموعة واسعة من المسارات والعمليات ، فإننا نتوقع أن التطبيقات المستقبلية المركزة لنهج IP-HTMS ستبدأ في التحقيق بعمق أكبر في تأثير الحالات المرضية والعلاجات الدوائية على البروتين البشري- تفاعلات البروتين.


شكر وتقدير

تم تمويل هذا البحث من خلال منح من المعاهد الوطنية للصحة (P50AI150476 ، U19AI135990 ، U19AI135972 ، R01AI143292 ، U54CA209891 ، R01AG059751 ، U54NS100717 ، P01HL146366 و U01MH115747 إلى NJK) من وكالة مشاريع أبحاث الدفاع المتقدمة (HR11-1900). -9-S0092-FP-FP-002 و HR00111-92-0021 إلى NJK) وتمويل من F. Hoffmann-La Roche and Vir Biotechnology. نحن ممتنون لـ Qiongyu Li و Monita Muralidharan و Robyn Kaake و Ruth Hüttenhain لمساهمتهم في هذه المخطوطة.


مناقشة

تعد شبكات تفاعل البروتين ضرورية في تعزيز فهمنا للأنماط الظاهرية الخلوية ، وتسجيل تمثيل موثوق وثابت لتفاعلات البروتين البشري المحتملة قيد التقدم (Stelzl ، 2013 Rolland وآخرون، 2014). ومع ذلك ، فإن إعادة توصيل تفاعل البروتين المشروط هو مفتاح الاستجابات الخلوية (Ideker & Krogan ، 2012 Woodsmith & Stelzl ، 2014). يوفر تحليل إعادة التوصيل التفاعلي نظرة ثاقبة آلية للعمليات الخلوية (Hegele وآخرون، 2012) وأساس لتقييم تأثير التباين الجيني في المرض (Zhong وآخرون، 2009 وي وآخرون، 2014). في الاستجابات الخلوية ، غالبًا ما يتم نشر الإشارات من خلال PTMs مثل فسفرة التيروزين. تتوسط بروتينات القارئ هذه المتغيرة PTMs من خلال التعرف عليها (Seet وآخرون، 2006) ، إعادة تشكيل شبكات التفاعل على نطاق واسع استجابة لحالة تشوير الخلية.

تقدم هذه الدراسة مجموعة بيانات من 292 تفاعلاً يعتمد على الفوسفو - التيروزين تم إنشاؤه بواسطة نهج Y2H على نطاق واسع باستخدام كينازات التيروزين البشرية (pY-Y2H) والتي تغطي جزءًا من مساحة تفاعل لم يكن من الممكن في السابق الوصول إليها للاختبار التجريبي المباشر. يقيس نهجنا التفاعلات المعتمدة على كيناز للبروتينات كاملة الطول في بيئة خلوية مزدحمة. لضمان خصوصية الفحص وتجنب عيوب اللياقة البدنية للخميرة بسبب الإفراط في التعبير عن التيروزين كيناز ، يتم التعبير عن الطعم والفريسة وكينازات البروتين عند مستويات منخفضة جدًا (Worseck وآخرون، 2012). تظهر أنماط التفاعل التي تم الحصول عليها خصوصية عالية فيما يتعلق بالكينازات البشرية. يتطلب نمو الخميرة المعتمد على كيناز كمؤشر للتفاعلات المعتمدة على الفسفرة حدثين تمييز ، أي الفسفرة الفريسة بواسطة الكيناز وربط البروتين الفسفوري بواسطة بروتين قارئ pY المحتوي على مجال التعرف على الفوسفور. يقلل حدثا التعرف من فرصة وجود إشارات إيجابية زائفة أو كاذبة مقارنة بتفاعلات البروتين الثنائي غير الشرطي. ومع ذلك ، من المهم ملاحظة أن أنماط التفاعل التي لوحظت تعتمد على العديد من المعلمات التي يمكن أن تختلف اختلافًا كبيرًا بين الكينازات والأزواج المتفاعلة. وهذا يشمل: (1) مستويات التعبير عن البروتين ، (2) نشاط كيناز ، (3) خصوصية كيناز و (4) خصوصية التفاعل. على سبيل المثال ، يشجع ABL2 أكبر عدد من تفاعلات البروتين المعتمدة على pY ، ربما لأن نشاطه التحفيزي هو الأمثل لمقايسة pY-Y2H.

تخضع كينازات التيروزين غير المستقبلة لتنظيم صارم في الخلية البشرية حيث يتم تثبيطها عادةً في غياب المحفزات (Blume-Jensen & Hunter ، 2001). من الصعب للغاية التحكم في أصل الفسفرة في أي نظام بشري حيث أن كينازات التيروزين لها مستويات نشاط موضعية ، تتداخل إلى حد كبير مع خصوصية الركيزة ووظيفتها في تسلسلات الإشارات. خميرة الخميرة لا يحتوي حسن النية كينازات التيروزين وأي مكونات عابرة للتنظيم غير موجودة عند فحص الخميرة pY-PPI. ومع ذلك ، في نظام pY-Y2H ، نكشف بشكل لا لبس فيه عن الكيناز المرشحين الذين يمكنهم فسفرة البروتينات البشرية ، وبالتالي تعزيز التفاعلات المعتمدة على pY. في اختبار مصمم خصيصًا للتحكم في غياب التفاعلات ، اختبرنا مجموعة مختارة من 37 تفاعلًا باستخدام إصدارات ميتة كيناز من كينازات التيروزين التسعة المستخدمة في شاشة pY-Y2H. لم يتم الحصول على إشارة تفاعل قابلة للمقارنة مع الإصدارات الميتة للكيناز لأي من التفاعلات المختبرة التي أدت بنا إلى استنتاج أن الغالبية العظمى من التفاعلات المعتمدة على كيناز تعتمد بالفعل على الفسفرة في مقايسة pY-Y2H. بروتينات ربط الفوسفو-التيروزين هي بروتينات متعددة المجالات ، 24 منها تحتوي على مجال التيروزين كيناز أيضًا. باستخدامهم كطعم ، وجدنا تفاعلات تعتمد على الفوسفو وتفاعلات مستقلة عن الفوسفو. في الحالات الأخيرة ، لا يمكننا استبعاد أن هذه التفاعلات تعتمد على الفسفرة لأن الفسفرة لشريك التفاعل يمكن أن تكون بسبب نشاط كيناز للطعم نفسه.

يؤكد تحليل الشبكة لمجموعة البيانات أن إشارات الفوسفو-تيروزين قد تطورت كنظام معياري شديد الترابط يحكم العمليات المشاركة في الإشارات الخلوية والتواصل الخلوي الخلوي ومسارات استجابة النمو المتعلقة بالسرطان (Lim & Pawson ، 2010). كشفت إحصائيات التعليقات التوضيحية للركيزة أيضًا عن اتفاق قوي مع معرفتنا الحالية بوظيفة pY للتحقق من صحة شبكة pY-PPI الخاصة بنا. تم إجراء بحث PPI من خلال فحص مصفوفة

13900 بروتين (مستوى Entrez GeneID ، مغطاة بـ

17000 ORFs) بطريقة متوازية للغاية تبحث عن العلاقات الثنائية المعتمدة على pY بطريقة غير متحيزة بيولوجيًا. ومع ذلك ، حددنا التفاعلات المعتمدة على pY والتي تدور حول وحدة نمطية من البروتينات المتفاعلة قليلة نسبيًا في البروتين البشري بالاتفاق مع ملاحظة أن PTM ، بما في ذلك فسفرة التيروزين ، تتراكم بشكل انتقائي على مجمعات البروتين البشري (Woodsmith) وآخرون، 2013). ومع ذلك ، تم الإبلاغ عن الفسفرة Y على نطاق واسع على أكثر من 5000 بروتين بشري في دراسات واسعة النطاق لبروتينات الفوسفور (تان). وآخرون، 2009 هورنبيك وآخرون، 2012) ويشير تحليلنا الأدبي إلى أنه لا يزال يتعين اكتشاف العديد من مؤشرات pY-PPI البشرية. قد يكون جزء من مواقع pY المسجلة عبارة عن تحديدات زائفة لقياس الطيف الكتلي أو قد لا تعمل من خلال التعرف عليها بواسطة بروتينات قارئ pY. ومع ذلك ، كما هو الحال مع أي طريقة للكشف عن التفاعل ، يمكن أن تظهر سلبيات كاذبة في نهج pY-Y2H. مستويات التعبير المنخفضة للبروتينات الهجينة (فينكاتيسان وآخرون، 2009 Worseck وآخرون، 2012) ، كينازات غير نشطة بشكل كافٍ في ظل الظروف المستخدمة ، وحقيقة أنه تم اختبار مجموعة فرعية فقط من البشر غير RTKs يحد من تغطية التفاعلات بوساطة pY.

باستخدام مواقع الفوسفو-التيروزين المعروفة في أشكال الأحماض الأمينية الخطية المعروفة ، توقعنا جزءًا من حوالي 1/6 من التفاعلات التي من المحتمل أن يتم توسطها من خلال التعرف على شكل الببتيد الخطي. بدعم من جزء كبير من التفاعلات التي يمكن التحقق من صحتها في IPs المشتركة في خلايا الثدييات ، تشير البيانات إلى أن الحلقات الخطية غير المعروفة المحيطة بمواقع الفوسفو-التيروزين أو سياق البروتين الكامل الطول ضرورية لخصوصية التفاعل. وبالتالي ، توفر مجموعة البيانات هذه ثروة من الروابط المعتمدة على pY للتحقيق في الأنماط الجديدة المحتملة من حالة التعرف على pY على حدة. على سبيل المثال ، من المعروف أن مجال SH2 لـ GRB2 يربط [pYxNx] الببتيدات التي تشكل تشابهًا متغيرًا مع بقايا N (+2) التي تحدد الخصوصية بجوار W121 في حلقة GRB2 EF لإغلاق جانب الربط (Rahuel وآخرون، 1996). ومع ذلك ، تم العثور على سلسلة من الببتيدات مع الأحماض الأمينية بخلاف N في المواضع (+2) (بما في ذلك A و D و E و G و H و I و M و P و Q و R) لربط GRB2 (SH2 ) في دراسات الصفيف المنهجية باستخدام الببتيدات التي تشبه مواقع pY المعروفة (Miller وآخرون، 2008 تينتي وآخرون، 2013). في سلسلة من التجارب المنسدلة (الشكل 4A-D) بما في ذلك مجموعة ربط الببتيد القياسية مع البروتينات النقية (الشكل 4E والشكل التكميلي S9) ، حددنا Y124 من TSPAN2 كموقع مهم لربط GRB2 و PIK3R3. أيضًا في هذه الحالة ، قد لا يدعم تسلسل الأحماض الأمينية المحيطة بـ TSPAN2-Y124 ربط الببتيد pY في وضع الربط الكنسي (Higo وآخرون، 2013) مما يشير إلى مزيد من التحقيق.

يرتبط دور tetraspanins في السرطان بتفاعلاتها مع الإنتغرينات ، و metalloproteases المصفوفة ، ومستقبلات كينازات (Sadej وآخرون، 2014). على سبيل المثال ، CD9 و CDC151 ، مثل TSPANs الأخرى ، مرتبطة مباشرة بـ RTKs مثل DDR1 (Castro-Sanchez وآخرون، 2010) ، MET (كلوزيك وآخرون2005 فرانكو وآخرون، 2010) أو EGFR (Murayama وآخرون، 2004 ، 2008). على أساس هذه التقارير ، يمكن التكهن بأن TSPANs أهداف لمعدات RTK أو أنشطة معارف تقليدية أخرى غير محددة حتى الآن (Bordoli وآخرون، 2014). تم جمع معلومات حول فسفرة التيروزين في مشاريع اكتساب بيانات بروتينات الفوسفور واسعة النطاق لـ 17 فردًا من عائلة TSPAN (Hornbeck وآخرون، 2012). على وجه الخصوص ، تم الإبلاغ عن تفسفر TSPAN8 في Y122 (Moritz وآخرون، 2010) ، والتي تتوافق في المنطقة المقابلة مع Y124 من TSPAN2. في خلايا سرطان الغدة الرئوية A549 ، تبين أن إسكات CD151 له تأثيرات كبيرة على أحداث إشارات الفسفرة التيروزينية التي تتضمن p130Cas و FAK و paxillin و Src (Yamada وآخرون، 2008). يؤثر CD151 أو CD9 على ديناميكيات الهيكل الخلوي التي تحفز الانتشار الخلوي والنتوءات الطويلة المشابهة للنمط الظاهري الذي لوحظ عند نقل TSPAN2 إلى خلايا HEK293 (وانغ). وآخرون، 2011 بلومنتال وآخرون، 2012). أوتسوبو وآخرون أظهر أن ضربة قاضية TSPAN2 بوساطة RNAi تقلل من حركة الخلية والنشاط الغازي في الخلايا الظهارية لمجرى الهواء الصغيرة ، والأصل المفترض للأورام السرطانية الرئوية ، وتعزز البقاء في نماذج الفئران المنتشرة (أوتسوبو). وآخرون، 2014). تفتح بياناتنا وظيفة محتملة لتفاعلات الفوسفو-تيروزين 124 بوساطة تتعلق بمشاركة TSPAN2 في غزو الورم الحميد والهجرة. ومع ذلك ، فنحن لا نظهر بشكل مباشر الفسفرة TSPAN2-Y124 في الجسم الحي، لا يمكننا استبعاد التأثيرات غير المباشرة لطفرة Y124F ، على سبيل المثال ، على الارتباط بالجليكوزيل TSPAN2 ، المرتبط بالنمط الظاهري الخلوي المرصود. وبالتالي ، فإننا نقدم نقطة دخول آلية لكشف آثار ارتفاع مستويات TSPAN2 في السرطان مثل الأورام الغدية في الرئة (أوتسوبو). وآخرون، 2014). الفرضية هي أن التفاعلات الشرطية المعتمدة على pY مع بروتينات محول مختلفة ، GRB2 أو PIK3R3 ، على التوالي ، قد تتغير في السرطان ، مما يشير إلى مزيد من التحقيق في TSPAN2 وتفاعلاته في انتقال الخلايا إلى نمو غير طبيعي (Lazo، 2007 Hemler، 2014 Otsubo وآخرون, 2014 ).

يوضح التوصيف الأكثر تفصيلاً لتفاعلات TSPAN2 – GRB2 و TSPAN2 – PIK3R3 بشكل نموذجي كيف يتم تقييد PPIs مكانيًا. تملي حالة الإشارة للخلية التفاعلات المعتمدة على pY ويمكن أن تؤدي إلى عدد كبير من شبكات PPI التفاضلية التي تتضمن مجموعة متداخلة من البروتينات تحدد كل منها تدفق الإشارة بوساطة pY في ظل ظروف معينة. يمكن لمراكز الإشارات ، مثل GRB2 أو PIK3R3 ، التوسط في العديد من الاستجابات المتميزة ، التي يتم تشغيلها ، على سبيل المثال ، عن طريق نشاط كيناز المرتفع أو التغييرات في تركيز البروتين المحلي ، في وقت واحد وربما بشكل مستقل. لذلك ، فإن تقييم عواقب التفاعلات الشرطية ، أي الأنماط الظاهرية للحواف ، بدلاً من تغيرات البروتينات وحدها ، قد يكون مهمًا لفهم أفضل للتغيرات الجزيئية التي تحدث ، على سبيل المثال ، أثناء تطور السرطان. تحقيقا لهذه الغاية ، قد تعمل مجموعة بياناتنا pY-PPI كمورد مفيد.


نتائج

شبكة تفاعل البروتين من IAV مع الانسان العاقل

بعد دمج جميع بيانات التفاعل من الأدبيات وقواعد البيانات ، العدد الإجمالي لتفاعلات البروتين بين IAV و الانسان العاقل هو 1477. بعد إزالة التفاعلات المكررة ، يصبح هذا الرقم 1027. يوضح الشكل 1 شبكة تفاعل البروتين البروتين التي تم إنشاؤها في Cytoscape. عدد العقد في الشبكة هو 829 من بينها 14 بروتينات فيروسية و 815 لبروتينات بشرية. يحتوي البروتين الفيروسي NS1 على أكبر عدد من التفاعلات (397) مع البروتينات البشرية ، يليه NP و PB2 مع 184 و 117 جمعية على التوالي. استنادًا إلى الشبكة ، استخدمنا CytoHubba لتصنيف العقد الفردية حسب الميزات المختلفة كما هو موضح في قسم المواد والطرق. يمثل الشكل 2 تصنيفات البروتينات الفيروسية بناءً على عدد ارتباطاتها مع البروتينات المضيفة (انظر الجدول 2 للحصول على بيانات مفصلة). علاوة على ذلك ، تم استخدام CytoCluster [33] لتجميع العقد ، ومن النتيجة وجدنا المحاور شديدة الارتباط ومجمعات البروتين المحتملة في الشبكات البيولوجية. يمثل الشكل 3 مجموعة مفردة شديدة الارتباط تم إنتاجها من خوارزمية ClusterOne ، وهي إحدى الخوارزميات الست في CytoCluster. من خلال أدوات تحليل الشبكة ، حصلنا أيضًا على ميزات إحصائية مهمة للشبكة. يعرض الجدول 3 بعض المعلمات الإحصائية المهمة لشبكة تفاعل البروتين البروتين بين IAV والإنسان.

شبكة تفاعل البروتين والبروتين لفيروس الأنفلونزا أ مع المضيف الانسان العاقل شيدت في Cytoscape. تحتوي الشبكة على 829 عقدة (بروتينات) من بينها 14 بروتينات فيروسية و 815 بروتينات بشرية. إجمالي عدد الحواف (التفاعلات) هو 1051 وتميل العقد شديدة الاتصال إلى تكوين مجموعات ومحاور في الشبكة. تظهر البروتينات الفيروسية NS1 و NP و PB2 بحجم أكبر نظرًا لارتباطها بأعداد أكبر مع البروتينات البشرية. متوسط ​​عدد التفاعلات للعقدة هو 2.4 ، مما يعني أن الشبكة ليست كثيفة للغاية

مخطط دائري لبروتينات IAV استنادًا إلى عدد تفاعلاتها مع البروتينات البشرية

رسم بياني فرعي شديد الارتباط يتكون بين البروتين الفيروسي NS1 مع البروتينات البشرية

تحليلات التخصيب KEGG و GO للبروتينات المضيفة المرتبطة بـ IAV من الدرجة الأولى

من بين البروتينات المضيفة التي لها تفاعلات مع بروتينات IAV ، وجدنا أن بعض البروتينات البشرية مرتبطة ببروتينات فيروسية أكثر مقارنة بالبروتينات الأخرى. تتفاعل البروتينات البشرية LNX2 و MEOX2 مع 7 و 6 بروتينات فيروسية على التوالي. تم العثور على بروتينات مضيفة TFCP2 و PRKRA و DVL2 تتفاعل مع 5 بروتينات فيروسية على التوالي بينما ترتبط ثمانية بروتينات بـ 4 بروتينات فيروسية لكل منها. يوضح الشكل 4 الرسم البياني الناتج لتحليل مسار KEGG لأفضل 13 بروتينًا مضيفًا متفاعلًا مع IAV. من الشكل 4 ، يمكن ملاحظة أن مجموعة الجينات غنية للغاية في مسار سرطان الخلايا القاعدية وهو نوع من سرطان الجلد. المسارات الأخرى التي يتم فيها إثراء مجموعة الجينات هي مسارات دورة الحويصلة المشبكية ، وجمع إفراز حمض القناة ، وإدمان الكوكايين ، و ferroptosis ، وتخليق وإفراز الكورتيزول. يُظهر تحليل علم الوجود الجيني لهذه البروتينات المضيفة شديدة التفاعل مع IAV أن منتجات الجينات متورطة في العمليات البيولوجية المهمة بما في ذلك نسخ snRNA من مروج RNA polymerase III ، وتفكيك مجمع تدمير بيتا كاتينين ، والاستجابة لزيادة مستويات الأكسجين ، وإنتاج siRNA المتضمن في تدخل الحمض النووي الريبي ، والاستجابة الخلوية لمستويات الأكسجين ، وبعض العمليات الأخرى. يظهر التصوير الكامل لمعلومات علم الوجود الجيني ، أي العمليات البيولوجية والوظائف الجزيئية والمكونات الخلوية في الأشكال S1 و S2 و S3 في المواد التكميلية.

مسارات KEGG التي يتم فيها إثراء 13 عامل مضيف شديد التفاعل IAV. يُظهر لون الشريط كثافة مجموعة الجينات المخصبة في مسار معين. كلما كان اللون أفتح ، زادت إثراء الجينات في هذا المسار

تحليل العقدة العنقودية

في شبكة تفاعل البروتين ، تتكون مجموعات العقد ، ومجموعات العقد شديدة الترابط ، بشكل عام من فئتين من الوحدات ، أي مجمعات البروتين والوحدات الوظيفية. من خلال تحليل تكتل العقدة ، حدد الباحثون بعض الوحدات الوظيفية المهمة في دراسات تفاعل البروتين والبروتين على داء السكري من النوع 2 [42] وسرطان الغدد الليمفاوية بوركيت [43] على التوالي. من أجل الكشف عن مجمعات البروتين المحتملة والوحدات النمطية المهمة وظيفيًا في شبكة تفاعل البروتين البشري IAV ، تم إجراء تجميع العقدة بطرق مختلفة بما في ذلك خوارزميات التجميع الهرمية ، و k-mean ، و k-medoid ، والقائمة على الكثافة والطيفية. تقوم خوارزمية التجميع الهرمي ببناء شجرة تربط العقد في الشبكة بشكل هرمي بينما تكتشف الخوارزمية القائمة على الكثافة الرسوم البيانية الفرعية المتصلة بكثافة في الشبكة. يوضح الشكل 5 مجموعات متعددة تم إنشاؤها لشبكة تفاعل البروتين البشري IAV بواسطة MCODE و CytoCluster و ClusterViz و ClusterOne على التوالي. تحتوي المجموعة التي اكتشفها MCODE على 10 عقد تنتمي فيها HA و NA و PA و PB1 و M2 إلى بروتينات فيروسية بينما تنتمي LNX2 و TFCP2 و DVL2 و DVL3 و MEOX2 إلى الإنسان. في المجموعة التي صنعتها CytoCluster ، توجد 9 عقد من بينها PB1-F2 ينتمي إلى بروتينات فيروسية بينما MIF و UGP2 و PLAUR و PASK و ARHGEF1 و GNB2 و PLSCR1 و SNRK هي بروتينات بشرية. هناك 9 عقد في الكتلة تم اكتشافها بواسطة ClusterViz حيث HA هو بروتين فيروسي بينما SLC25A1 و ARF1 و HLA-DRB1 و COL413BP و SLC25A6 و ARF4 و HLA-B و EEF1G تنتمي إلى الإنسان. تحتوي المجموعة التي تصنعها ClusterOne على 6 عقد مع NP كبروتين فيروسي و KPNA6 و ACTN4 و MOV10 و NCBP1 و LARP1 تنتمي إلى الإنسان. هذه العقد مترابطة بشكل كثيف مع بعضها البعض ولكنها مرتبطة بشكل ضئيل بالعقد الأخرى ، وتحتوي المجموعات المكونة منها على مجمعات بروتينية محتملة ووحدات مهمة وظيفيًا في شبكة تفاعل البروتين البشري IAV.

مجموعات العقدة المصممة لشبكة تفاعل البروتين البشري IAV في Cytoscape مع خوارزميات تجميع مختلفة بما في ذلك MCODE a) و CytoCluster b) و ClusterViz c) و ClusterOne d)

عوامل المضيف المشتركة التي تشارك في مسارات عدوى IAV و HCV

في دراستنا السابقة حول شبكة تفاعل البروتين لفيروس التهاب الكبد الوبائي سي مع الانسان العاقل، اكتشفنا بعض البروتينات البشرية المحتملة التي تتفاعل مع البروتينات الفيروسية HCV [44]. هنا ، من خلال مقارنة النتائج من الدراسات الحالية والسابقة ، اكتشفنا عوامل مضيفة مشتركة في كل من مسارات العدوى الفيروسية. من بين 815 عاملاً مضيفًا من الدراسة الحالية و 940 تم تحديدها في الدراسة السابقة ، تم العثور على 138 بروتينًا مضيفًا للتداخل في كلتا الدراستين ، مما يعني أن هذه المنتجات الجينية متورطة في كل من مسارات العدوى HCV و IAV. يعطي الجدول S1 قائمة بـ 138 عامل مضيف مشترك في المواد التكميلية. يوضح الشكل 6 نتائج تحليل مسار KEGG لهذه البروتينات. يمكن ملاحظة أن هذه البروتينات لا تشارك فقط في المسارات المعدية لـ HCV و IAV ولكنها أيضًا مخصبة بنشاط في المسارات المعدية لفيروس التهاب الكبد B ، والمواد المسرطنة الفيروسية ، والحصبة ، وفيروس اللوكيميا البشرية T- الخلايا 1 والفيروس المضخم للخلايا البشري.

تشارك مسارات KEGG التي يتم فيها إثراء جينات المضيف الشائعة في كل من المسارات المعدية لفيروسات IAV و HCV


ساهم المؤلفان بالتساوي: إلهام أمجد وسلماز الصناشاري.

الانتماءات

مركز أبحاث التكنولوجيا الحيوية ، جامعة تبريز للعلوم الطبية ، تبريز ، إيران

إلهام أمجد وسلماز أسناشاري وباباك سوكوتي وأمب سياوش دستمالشي

كلية الصيدلة ، جامعة تبريز للعلوم الطبية ، تبريز ، إيران

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

مساهمات

ب. و S.D. ساهم في تصميم وتنفيذ البحث. إي. و S.A عمل الحسابات العددية ونتائج التجربة. ناقش جميع المؤلفين (E.A. ، SA ، BS and SD) وساعدوا في تفسير النتائج وساهموا في المخطوطة النهائية.

المؤلفون المراسلون


شاهد الفيديو: حقيقة السرطان. معلومات صادمة لأهم مقابلة مع البروفيسور سيفريد. الحلقة كاملة (ديسمبر 2022).