معلومة

هل يمكن أن تنتج الخوارزميات الشاملة MSAs المناسبة لنمذجة الهياكل ثلاثية الأبعاد؟

هل يمكن أن تنتج الخوارزميات الشاملة MSAs المناسبة لنمذجة الهياكل ثلاثية الأبعاد؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أثناء التنبؤ بالبنية ثلاثية الأبعاد للبروتين من خلال نمذجة التماثل ، فإن الخطوة الأكثر أهمية هي محاذاة التسلسل المتعدد لتسلسلات القالب مع البروتين المستهدف الذي سيتم التنبؤ بنموذجه ثلاثي الأبعاد. في هذه الخطوة وفقًا لكتابي الخاص بمحاذاة التسلسل المتعدد ، يتم استخدام برنامج T-coffee أو Praline ؛ هذه البرامج هي إرشادية بطبيعتها وتستند إلى طريقة المحاذاة التدريجية. هناك دائمًا مخاوف بشأن حساسية وخصوصية خوارزميات الكشف عن مجريات الأمور.

لتجنب هذه المشكلة أتخيل أن أحد الخيارات هو استخدام خوارزميات شاملة. خلال خطوة المحاذاة هذه ، والتي تعتبر بالغة الأهمية في النمذجة ثلاثية الأبعاد ، هل يمكننا استخدام خوارزميات شاملة لإنتاج نماذج جيدة؟


لا.

تستخدم طرق محاذاة التسلسل المتعدد (MSA) مثل T-coffee ، والتي ذكرتها ، و Clustal (http://www.clustal.org) ، والتي تُستخدم أيضًا على نطاق واسع ، أساليب الاستدلال للمحاذاة لسبب وجيه للغاية وهو أن الخوارزميات الشاملة للقيام بذلك هي NP كاملة.

لقد ذكرت خوارزمية البرمجة الديناميكية باعتبارها شاملة في تعليقك. محاذاة تسلسلين بواسطة البرمجة الديناميكية لها تعقيد زمني (كبير O) بقيمة $ n ^ 2 $ وقد تستغرق بضع دقائق حسب طول التسلسل وما إلى ذلك. المحاذاة الثلاثة لها O كبير من $ n ^ 3 $ ويمكن إذا كان لديك الكثير من الوقت بين يديك ، ولكن يجب أن يكون واضحًا أن هذا هو الحد الأقصى لعدد التسلسلات التي يمكن محاذاتها باستخدام البرمجة الديناميكية.

ليس هناك عيب في الاستدلال. ربما يكون برنامج المعلوماتية الحيوية الأكثر استخدامًا في العالم ، BLAST ، يستخدم أسلوبًا إرشاديًا. (ويتخذ عقلك قرارات تعتمد عليها حياتك كل يوم باستخدام الاستدلال.)

تم تعديل الأساليب التي تستخدم الأساليب البحثية في MSA على التوالي للتعامل مع العوامل المعروفة التي يمكن أن تسبب مشاكل ، وغالبًا ما تؤدي أداءً جيدًا. كيف تستطيع أن تقول ذلك؟ ما عليك القيام به في استخدام برامج MSA هو إجراء "فحص سلامة" على أي محاذاة تنتجها البرامج - هل تبدو معقولة ، هل تطابق المناطق المتشابهة جيدًا أم أن هناك فجوات شاسعة تم تقديمها أو مناطق واضحة من التماثل مفقودة. وإذا كنت تقوم بنمذجة ثلاثية الأبعاد ولم تحصل على محاذاة تبدو جيدة ، فمن غير المحتمل أن تعمل النمذجة الخاصة بك.

أخيرًا ، عليك دائمًا التفكير في احتمال عدم وجود أي بروتينات ذات بنية معروفة تشبه البروتين الذي تريد تصميمه ، لذا لن تحصل أبدًا على MSA جيد.


علم الفطريات التطبيقي والتكنولوجيا الحيوية

ميليسا ر.بيتمان ، ر.إيان مينز ، في علم الفطريات التطبيقية والتكنولوجيا الحيوية ، 2006

أصبحت نمذجة التنادد أداة مفيدة للتنبؤ ببنية البروتين عندما تتوفر بيانات التسلسل فقط. غالبًا ما تكون المعلومات الهيكلية أكثر قيمة من التسلسل وحده لتحديد وظيفة البروتين. من المحتمل أن تكون نمذجة التنادد أداة مفيدة جدًا لطبيب الفطريات ، حيث أن عدد تسلسلات الجينات الفطرية المتاحة قد انفجر في السنوات الأخيرة ، في حين أن عدد هياكل البروتين الفطري المحددة تجريبياً لا يزال منخفضًا. تستخدم البرامج المتاحة لنمذجة التماثل مناهج وطرق مختلفة لإنتاج النموذج النهائي. في كل خطوة من خطوات عملية نمذجة التماثل ، تؤثر العديد من العوامل على جودة النموذج المنتج ، ويمكن أن يؤدي الاختيار المناسب للبرنامج إلى تحسين جودة النموذج بشكل كبير. تناقش هذه المراجعة مزايا وقيود الأساليب والبرامج المتاحة حاليًا وتوفر نقطة انطلاق للمبتدئين الذين يرغبون في إنشاء نموذج هيكلي. لقد اتخذنا نهجًا عمليًا لأننا نأمل في تمكين أي عالم من استخدام نمذجة التماثل كأداة لتحليل البروتين أو الجينوم الذي يهمهم.


ملخص المؤلف

يمكن أن يكون تحديد التفاعلات المنهجية لمكونات متعددة داخل نظام بيولوجي معقد أمرًا صعبًا بسبب عدد العمليات المحتملة وما يصاحب ذلك من نقص في المعلومات حول الديناميكيات الأساسية. توفر خوارزميات الاختيار التي تسمح بإجراء تقييم آلي لعدد كبير من النماذج المختلفة أداة مفيدة في تحديد العلاقات المنهجية بين البيانات التجريبية. ومع ذلك ، فإن العديد من خوارزميات اختيار النموذج الحالية غير قادرة على معالجة هياكل النماذج المعقدة ، مثل أنظمة المعادلات التفاضلية ، وتعتمد جزئيًا على طرق بحث محلية أو شاملة غير مناسبة لتحليل الأنظمة البيولوجية المختلفة. لذلك ، قمنا بتطوير خوارزمية اختيار نموذج مرنة تقوم بإجراء بحث قوي وديناميكي لمساحات النماذج الكبيرة لتحديد ديناميكيات الأنظمة المعقدة وتطبيقها على تحليل ديناميكيات تكاثر الخلايا التائية ضمن ظروف الثقافة المختلفة. توفر الخوارزمية ، المتوفرة في شكل حزمة R ، أداة متقدمة لتحليل سلوك الأنظمة المعقدة ، وبسبب هيكلها المرن ، يمكن تطبيقها على مجموعة كبيرة ومتنوعة من المشكلات البيولوجية.

الاقتباس: Gabel M و Hohl T و Imle A و Fackler OT و Graw F (2019) FAMoS: خوارزمية مرنة وديناميكية لاختيار النموذج لتحليل ديناميكيات الأنظمة المعقدة. بلوس كومبوت بيول 15 (8): e1007230. https://doi.org/10.1371/journal.pcbi.1007230

محرر: بيكا أسكويث ، إمبريال كوليدج لندن ، المملكة المتحدة

تم الاستلام: 27 يناير 2019 وافقت: 30 يونيو 2019 نشرت: 16 أغسطس 2019

حقوق النشر: © 2019 جابل وآخرون. هذا مقال مفتوح الوصول يتم توزيعه بموجب شروط ترخيص Creative Commons Attribution License ، والذي يسمح بالاستخدام غير المقيد والتوزيع والاستنساخ في أي وسيط ، بشرط ذكر المؤلف والمصدر الأصليين.

توافر البيانات: جميع البيانات ذات الصلة موجودة داخل المخطوطة وملفات المعلومات الداعمة الخاصة بها.

التمويل: تم تمويل هذا العمل من قبل مركز النمذجة والمحاكاة في العلوم البيولوجية (BIOMS) إلى FG ، ومن قبل Deutsche Forschungsgemeinschaft (مؤسسة الأبحاث الألمانية ، DFG) - رقم المشروع 240245660 - SFB1129 (المشروع 8) إلى OTF. OTF هي عضو في كتلة التميز Cellnetworks. FG هي عضو في IWR وتدعمها بالإضافة إلى ذلك زمالة من Chica and Heinz Schaller Foundation. لم يكن للممولين أي دور في تصميم الدراسة ، أو جمع البيانات وتحليلها ، أو اتخاذ قرار النشر ، أو إعداد المخطوطة.

تضارب المصالح: وقد أعلن الباحثون إلى أن لا المصالح المتنافسة موجودة.


2. مبادئ تصميم الأدوية الهيكلية

2.1. الأساس المنطقي واختيار الهدف

SBDD هي أداة قوية تستخدم معرفة البنية ثلاثية الأبعاد (3D) لهدف بيولوجي للبحث بكفاءة في الفضاء الكيميائي عن الروابط ذات الصلة العالية. بدأ استخدام SBDD في منتصف الثمانينيات ، وبدأت المنشورات التي تصف نجاحه في تطوير علاجات جديدة لفيروس نقص المناعة البشرية / الإيدز في الظهور في أوائل التسعينيات [25 ، 26]. سمحت المعرفة الهيكلية لبروتياز فيروس نقص المناعة البشرية بتصميم مثبطات جديدة للبروتياز ، أصبحت خمسة منها نجاحات إكلينيكية وتجارية [26 ، 27]. العديد من الأدوية الأخرى المستخدمة على نطاق واسع ، بما في ذلك zanamivir (Relenza GlaxoSmithKline) [28] للأنفلونزا ، ومثبط انزيمات الأكسدة الحلقية سيليكوكسيب (Celebrex Pfizer) [29] ، ومثبط التيروزين كيناز إيماتينيب (Gleevec Novartowe) [30] أصولهم إلى SBDD.

يبدأ SBDD باختيار هدف مناسب. يجب أن يكون الهدف المضاد للفيروس موجودًا فقط في العامل الممرض ، وأن يكون ضروريًا للإمراض البكتيرية ولكن لا يشارك بشكل مباشر في بقاء البكتيريا. الغالبية العظمى من الأهداف المضادة للفيروسات عبارة عن بروتينات ، على الرغم من أن جزيئات الحمض النووي الريبي قد تكون مستهدفة أيضًا ، كما هو الحال بالنسبة للمضادات الحيوية المعروفة مثل التتراسيكلين والستربتومايسين [31]. يجب التحقق من صحة الهدف بشكل مثالي في الجسم الحي عن طريق اختبار سلالة خروج المغلوب للبكتيريا من أجل الفوعة في نموذج حيواني للعدوى. يجب بعد ذلك الحصول على معلومات هيكلية دقيقة حول الهدف. تم استخدام ثلاثة مصادر رئيسية للمعلومات الهيكلية في SBDD: علم البلورات بالأشعة السينية ، والرنين المغناطيسي النووي (NMR) ، ونمذجة التماثل. تعد الهياكل البلورية للأشعة السينية المصدر الأكثر شيوعًا لبيانات تصميم الأدوية ، نظرًا للدقة العالية المتوفرة والقدرة على العمل مع البروتينات التي يتراوح حجمها من الببتيدات الصغيرة إلى 998 كيلو دالتون [32]. في الواقع ، تم تحديد 83.8 ٪ من إجمالي هياكل البروتين في بنك بيانات البروتين (PDB) اعتبارًا من ديسمبر 2018 عبر علم البلورات بالأشعة السينية. تظهر جزيئات الماء المرتبة أيضًا في الهياكل البلورية ، والتي يمكن أن يوفر تنظيمها غالبًا نقطة انطلاق لتصميم الرصاص الدوائي. تعد هياكل الرنين المغناطيسي النووي مصدرًا آخر قيمًا لتصميم الأدوية ، بشرط أن يكون الهدف أصغر من 35 كيلو دالتون [33]. إن الدقة المنخفضة للهياكل المكتسبة عن طريق الفحص المجهري للإلكترون (EM) قد حالت دون استخدامها في SBDD في الماضي ، ومع ذلك ، فقد تجاوزت أفضل هياكل cryo-EM الحديثة

2.5 & # x000c5 عتبة الدقة الذرية وبالتالي قد تكون مفيدة لتصميم الأدوية في المستقبل [34]. يتم تنسيق الهياكل المحددة تجريبياً في PDB ، والتي تحتوي حاليًا على أكثر من 83000 إدخال بروتين بكتيري من بين أكثر من 145000 إدخال إجمالي. بالنسبة للحالات التي لا يتوفر فيها هيكل محدد تجريبيًا ، يمكن استخدام نموذج تماثل لتصميم الدواء بشرط وجود تشابه كبير في التسلسل بين البروتينات [35 ، 36]. تستخدم برامج نمذجة التماثل المتقدمة هياكل محددة تجريبياً كقالب للتنبؤ بالثنيات ثلاثية الأبعاد لبروتين آخر له تسلسل أحماض أمينية مشابه [37]. توفر العديد من البرامج المجانية ، بما في ذلك SWISS-MODEL [38] و Phyre2 [39] ، نمذجة تجانس مؤتمتة بالكامل. توفر البرامج التجارية مثل Modeller [40] أو أدوات النمذجة المضمنة في مجموعات البرامج مثل Discovery Studio (BIOVIA) [41] تحكمًا إضافيًا في عملية النمذجة. على الرغم من استخدام نماذج التماثل بشكل روتيني في غياب الهياكل المحددة تجريبيًا ، إلا أنه يلاحظ أنها ليست مثالية لـ SBDD نظرًا لأن دقة جيب الربط يمكن أن تكون أقل موثوقية ، خاصة عندما تكون هوية التسلسل أقل من 40٪ [37].

تتضمن الخطوة التالية في SBDD استخدام الهيكل أو النموذج المتاح لتحديد موقع ارتباط محدد للرابط. عادةً ما يكون للهدف جيب ربط محدد جيدًا ، مثل موقع ربط مستقبلات ليجند أو موقع إنزيم نشط. تتوفر الآن الخوارزميات للتنبؤ بمدى ملاءمة الجيب الملزم بناءً على معايير مثل صلابته أو طابعه الكارثي للماء كما تم حسابه من هياكل البروتين عالية الدقة [42،43]. على الرغم من أن الأدوية التي تستهدف تفاعلات البروتين والبروتين (PPIs) أقل شيوعًا ، إلا أن مجموعات اكتشاف الأدوية تتابعها بشكل متزايد [44]. من الجوانب المهمة ، ولكن غالبًا ما يتم التغاضي عنها ، في اختيار الهدف ، المرونة المطابقة للبروتين أثناء ربط الترابط. في حين أن بنية البروتين في البلورة تمثل لقطة & # x02018frozen & # x02019 في موضع واحد ، قد يخضع الشكل النشط بيولوجيًا للبروتين لتغييرات تكوينية جذرية عند الارتباط بالرابط. هذا يسلط الضوء على الأهمية المحتملة للقدرة على نمذجة مرونة البروتين والرابط في SBDD. يمكن استخدام العديد من البرامج مثل GOLD [45] و SLIDE [46] و FlexE [47] لتحقيق هذه الغاية ، ومع ذلك ، فإن وقت الحوسبة المتزايد المطلوب يمكن أن يكون باهظًا [48]. بالإضافة إلى ذلك ، فإن هذه البرامج تأخذ في الحسبان فقط مرونة السلسلة الجانبية ، والتي يمكن أن تكون غير كافية عند نمذجة حركات العمود الفقري للبروتين الأكثر تعقيدًا كما في حالة المستقبلات [49].

2.2. طرق SBDD

بمجرد تحديد الهدف ، هناك ثلاث طرق رئيسية تُستخدم لتحديد أو تصميم روابط جديدة بناءً على معلوماتها الهيكلية: فحص الركيزة والمثبطات المعروفة ، والفحص الظاهري ، وتصميم de novo. في الطريقة الأولى ، يتم استخدام فحص الركائز أو العوامل المساعدة أو مثبطات البروتين المعروفة للإبلاغ عن تعديل هذه المركبات لتصبح مثبطات [25،50،51]. في الفحص الافتراضي ، يتم ربط مكتبات الجزيئات الصغيرة المتاحة في منطقة الاهتمام بالسيليكو ويتم تسجيلها بناءً على تفاعلها المتوقع مع الموقع. يتضمن النهج الثالث تصميم de novo لشظايا جزيئية صغيرة يتم وضعها في الموقع المستهدف ، ثم يتم تسجيلها ، ثم ربطها في السيليكو لإعطاء جزيء واحد كامل (الشكل 2). ثم يتم تصنيع المركبات المرتبطة النهائية كيميائيًا واختبارها من أجل النشاط البيولوجي. نناقش أدناه الأمثلة الحديثة لهذه الأساليب الثلاثة في سياق اكتشاف الأدوية المضادة للفيروسات.

سير عمل نموذجي للفحص الافتراضي عالي الإنتاجية وتصميم عقار دي نوفو. (أ) إجراء الفرز الافتراضي المستخدم لاختيار المركبات النشطة من مكتبة كبيرة من الجزيئات الموجودة. SAR ، علاقة الهيكل بالنشاط. (ب) إجراء تصميم de novo للروابط عبر النهج القائم على الشظايا باستخدام برامج مثل LUDI أو SPROUT.


محررو العدد الخاص

ندعوك لتقديم أحدث أبحاثك في مجال الحوسبة الحبيبية إلى هذا العدد الخاص المسمى & ldquoGranular Computing: From Foundations to Applications & rdquo. الحوسبة الحبيبية هي نموذج لمعالجة المعلومات متعدد التخصصات سريع التغير ومناسب لنمذجة الأنظمة المعقدة ولاستخراج المعرفة من البيانات عن طريق الكيانات المناسبة المعروفة باسم حبيبات المعلومات. وفقًا لهذا النموذج ، يمكن ملاحظة نظام معين على مستويات مختلفة من التفصيل ، وإظهار أو إخفاء تفاصيل وخصائص النظام ككل. بالنظر إلى مشكلة النمذجة المحددة التي تعتمد على البيانات ، فإن العثور تلقائيًا على مستوى دقة مناسب (دلالي) من أجل جمع أكبر قدر من المعرفة من البيانات الموجودة يعد مهمة صعبة. من خلال هذا العدد الخاص ، نود احتضان الجوانب الأساسية / المنهجية والتطبيقات المتعلقة بالحوسبة الحبيبية.

نرحب بأوراق البحث عالية الجودة التي تتناول وتستعرض القضايا النظرية والعملية للحوسبة الحبيبية ، مع التركيز على نمذجة الأنظمة المعقدة ، وتحليل البيانات الضخمة المتوازية والموزعة ، وتحبيب البيانات وتأثيرها على اكتشاف المعرفة ، وأنظمة حل المشكلات واتخاذ القرار ، والنمط المتقدم. أنظمة التعرف.

وبالمثل ، نرحب بأوراق البحث حول التطبيقات المتطورة ، بما في ذلك (على سبيل المثال لا الحصر) المعلوماتية الحيوية والبيولوجيا الحاسوبية ، وتحليل الصور ، ومعالجة اللغة الطبيعية ، وتحليل المشاعر والسلوك ، والتنبؤ بالسلاسل الزمنية ، والأمن السيبراني.

الأستاذ الدكتور أنتونيلو رزي
د. أليسيو مارتينو
المحرر الضيف

معلومات تقديم المخطوطات

يجب تقديم المخطوطات عبر الإنترنت على www.mdpi.com من خلال التسجيل وتسجيل الدخول إلى هذا الموقع. بمجرد التسجيل ، انقر هنا للذهاب إلى نموذج التقديم. يمكن تقديم المخطوطات حتى الموعد النهائي. سيتم مراجعة جميع الأوراق من قبل الأقران. سيتم نشر الأوراق المقبولة بشكل مستمر في المجلة (بمجرد قبولها) وسيتم إدراجها معًا على موقع الإصدار الخاص. المقالات البحثية ، مقالات المراجعة بالإضافة إلى الاتصالات القصيرة مدعوة. بالنسبة للأوراق المخططة ، يمكن إرسال عنوان وملخص قصير (حوالي 100 كلمة) إلى مكتب التحرير للإعلان على هذا الموقع.

يجب ألا تكون المخطوطات المقدمة قد نُشرت سابقًا ، أو أن تكون قيد الدراسة للنشر في مكان آخر (باستثناء أوراق وقائع المؤتمرات). يتم تحكيم جميع المخطوطات بدقة من خلال عملية مراجعة أقران أعمى واحدة. يتوفر دليل للمؤلفين ومعلومات أخرى ذات صلة لتقديم المخطوطات في صفحة إرشادات المؤلفين. الخوارزميات هي مجلة شهرية دولية مفتوحة الوصول تخضع لمراجعة الأقران تنشرها MDPI.

يرجى زيارة صفحة تعليمات المؤلفين قبل إرسال المخطوطة. رسوم معالجة المقالة (APC) للنشر في مجلة الوصول المفتوح هذه هي 1400 فرنك سويسري (فرنك سويسري). يجب أن تكون الأوراق المقدمة منسقة بشكل جيد وأن تستخدم اللغة الإنجليزية بشكل جيد. يمكن للمؤلفين استخدام خدمة تحرير اللغة الإنجليزية الخاصة بـ MDPI قبل النشر أو أثناء مراجعات المؤلف.


موضوعي

الهدف من ورشة العمل هذه هو تقديم نظرة واسعة على أحدث ما توصلت إليه النمذجة الاحتمالية وطرق التعلم الآلي التي تتضمن الهياكل والأنظمة البيولوجية ، والجمع بين مطوري الأساليب والتجريبيين الذين يعملون على حل المشكلات.

نشجع عمليات الإرسال التي تقدم طرقًا لاكتشاف الهياكل المعقدة (مثل شبكات التفاعل والهياكل الجزيئية / الخلوية) والأساليب التي تدعم تحليل البيانات على مستوى الجينوم.

قائمة غير شاملة بالموضوعات المناسبة لورشة العمل هذه:

أساليب

  • الخوارزميات
  • طرق بايزي
  • تكامل / اندماج البيانات
  • اختيار الميزة / المساحة الفرعية
  • طرق عالية الإنتاجية
  • طرق Kernel
  • التعلم الالي
  • الاستدلال الاحتمالي
  • توقع الناتج المنظم

التطبيقات

  • تسلسل الشرح
  • التعبير الجيني
  • شبكات الجينات
  • التنبؤ الجيني
  • التنميط الأيضي
  • إعادة البناء الأيضي
  • توقع بنية البروتين
  • التنبؤ بوظيفة البروتين
  • شبكات تفاعل البروتين البروتين

التنظيم وورش العمل ذات الصلة

يتم تنظيم ورشة العمل من قبل الشبكة الأوروبية للتميز PASCAL (تحليل الأنماط والنمذجة الإحصائية والتعلم الحسابي) وهي تنتمي إلى البرنامج الموضوعي حول "التعلم بمخرجات معقدة ومنظمة".

يسبق ورشة العمل ورشة العمل الدولية الرابعة حول بيولوجيا الأنظمة الحاسوبية (WCSB 2006 ، 12-13 يونيو ، تامبيري ، فنلندا).

ويلي ورشة العمل فورًا الندوة الدولية المتخصصة حول الخمائر (ISSY25 ، 18-21 يونيو ، إسبو ، فنلندا) تحت عنوان "بيولوجيا أنظمة الخميرة - من النماذج إلى التطبيقات".


الاستنتاجات والرؤية

سيسمح التوافر المتزايد لكميات كبيرة من البيانات (أي البيانات الضخمة) باختبار النماذج بدقة بالغة. يمكن جمع البيانات المكانية في ثلاثة أبعاد (ربما بفضل تطور التصوير المجهر) ، والتقاط تشكيل الأنماط ، والمنافذ ، والجمعيات الجزيئية ، والميزات متعددة النطاقات. يمكن أن يتراوح البعد الزمني من الأحداث الجزيئية (على سبيل المثال ، طفرات الحمض النووي أو التغيرات اللاجينية) إلى تطور الكائن الحي ، وتطور الساعة البيولوجية ، وتطور الأنواع ، ودوريات أخرى ذات مغزى.

إن تطوير أدوات جديدة وفعالة سيحفز الآخرين على إنشاء نماذج حسابية جديدة أو تحسين النماذج الحالية. سيؤدي ذلك إلى زيادة مجتمع العلماء الذين يتشاركون معرفتهم من خلال نماذج حسابية موحدة تعيد إنتاج سلوك العملية البيولوجية قيد التحقيق عدديًا. مع اكتساب النمذجة الحسابية قدرة أفضل على وصف النظم والعمليات البيولوجية على مستوى مفيد للتنبؤ واقتراح التجارب ، فإنها ستطلق عملية تغذية مفيدة مع علماء الأحياء التجريبية.

يمكن للأدوات الموصوفة في هذه الورقة أن تستوعب بالفعل خصائص هيكلية معقدة مختلفة للعمليات البيولوجية ويمكن استخدامها بشكل منفصل أو في مجموعات وبنيات مختلفة. سيمكن هذا علماء الأحياء من الإجابة على الأسئلة المعقدة. على سبيل المثال ، سيكون للمنطق الزمني ، على وجه الخصوص ، تأثير عميق في بيولوجيا الأنظمة من خلال المساعدة في تحويل العلاقات بين السبب والنتيجة إلى أشياء يمكن التلاعب بها رياضيًا وحسابيًا. في التحكم المعرفي ، يمكن استخدام المنطق الزمني لنمذجة عاملين أو أكثر من العوامل المسببة للتفاعل ميكانيكيًا فيما يتعلق بالظاهرة المرصودة. سيؤدي القيام بذلك إلى إنشاء روابط قوية ، مع التفكير القائم على المنطق والإحصاءات والآليات والعمليات التي تكمن وراء السلوك المرصود.

أحد اتجاهات البحث المستقبلية المثيرة للاهتمام التي نتخيلها هو امتداد تقنيات التحليل الرسمية الحالية والمنطق الزمني إلى المجال المكاني. على سبيل المثال ، يعد فهم كيفية ظهور النمط المكاني من المستوى الكيميائي الحيوي الذي يعمل على المستوى الخلوي (أي التشكل في علم الأحياء التطوري) حاليًا صعبًا للغاية بسبب كل من التعقيد الحسابي العالي الذي تتطلبه النمذجة الزمانية المكانية وعدم وجود لغة مواصفات مناسبة لتحديد الأنماط الزمانية المكانية ذات الأهمية [86،87،153].

علاوة على ذلك ، أدى التقدم السريع للتقنيات الحديثة للرعاية الصحية إلى ظهور جيل جديد من الأجهزة يسمى الأنظمة الفيزيائية الإلكترونية الطبية [154] ، حيث تتحكم العناصر الحاسوبية الذكية والتعاونية في الأنظمة البيولوجية. ومن الأمثلة على ذلك أجهزة تنظيم ضربات القلب ، والأجهزة المتوافقة مع الأحياء والقابلة للزرع ، ومضخات الأنسولين ، والتخطيط والتدخل الكهربائي التشريحي ، والأطراف الاصطناعية الروبوتية ، والمحفزات العصبية. هنا ، النمذجة الحسابية للجزء البيولوجي لا غنى عنها لتطوير أجهزة تحكم فعالة وآمنة. علاوة على ذلك ، فإن التطبيق الناجح لتقنيات وأدوات التحليل الرسمية للتحقق من السلوك الصحيح والآمن لهذه الأنظمة سيكون له تأثير اقتصادي على مجتمعنا من خلال تقليل تكاليف الضمان والمسؤولية والشهادات. نعتقد أن المفاهيم والأدوات الحسابية الموصوفة هنا تمثل العناصر الأساسية للوصف الحسابي ، لا سيما في إطار بيولوجيا الأنظمة ، وسيكون لها بعض الأهمية لكل من الوافدين الجدد والخبراء.


تقييم

تم إجراء تقييم مقارن لتنبؤات PPIS في المراجعات السابقة [109 , 214] على هذا النحو ، فإننا نركز على المعلومات المتعلقة فقط بأحدث المتنبئين ، كما هو موضح في الجدول 4.

أصبح التقييم الموضوعي لأداء توقع PPIS صعبًا بسبب التعاريف المتنوعة لمواقع التفاعل والمخلفات السطحية التي يمكن الوصول إليها في الأدبيات ، ونقص الخوادم المتاحة لجميع المتنبئين ، واعتماد مجموعات بيانات التدريب والاختبار المتنوعة ، والمقاييس المختلفة المستخدمة للتقييم [ 4 , 47]. نحن نتحايل جزئيًا على هذه المشكلات من خلال النظر في أداء كل متنبئ عبر مجموعة متنوعة من مجموعات الاختبار بناءً على قيم الأدبيات.

تدابير التقييم

يتم الحكم على متنبئات PPIS عمومًا بعدد من مقاييس الأداء القياسية ، بما في ذلك الحساسية (الاسترجاع ، أو المعدل الإيجابي الحقيقي ، أو التغطية) ، والدقة ، والخصوصية:

أين تي ص, تي ن, F ص، و F ن تشير إلى الإيجابيات والسلبيات الصحيحة والخاطئة ، على التوالي.

تشمل التدابير المصممة للموازنة بين المعدلات السلبية والإيجابية الكاذبة F 1 و MCC [219]:

وبالمثل ، فإن منحنى مشغل المستقبل (ROC) ، وهو قطعة أرض حساسية مقابل 1−س ص ه ج أنا F أنا ج أنا ر ذ المشتق من خلال تغيير عتبة تنبؤ المصنف ، يمكن استخدامه لحساب المنطقة الواقعة تحت منحنى ROC (AUROC / AUC) [251] ، وهو مفيد بشكل خاص لتحديد الأداء "المتضخم" بشكل مصطنع (على سبيل المثال ، حساسية أعلى على حساب الخصوصية) و لكونها عتبة القرار مستقلة [252].

بشكل عام ، على غرار عدم وجود توافق في الآراء في تعريفات الواجهة ومجموعات البيانات ، لا توجد معايير معيارية لتقييم الأداء [47]. بالنظر إلى أن بعض التوقعات الإيجابية الخاطئة قد تكون صحيحة (بسبب ندرة المجمعات المتبلورة) ، مقاييس الأداء الخاصة بالتصحيح (أي تقييم الإجابة الصحيحة في رقعة محلية حول الواجهة المعنية ، مثل مؤشر Sørensen-Dice [253) , 254]) ، على الرغم من أن هذا يفسر بشكل سيء الإيجابيات الكاذبة. بينما تم وضع طرق تقييم أخرى [16 , 35] ، يبدو أن حساب الإحصائيات المذكورة أعلاه لكل بقايا والمتوسط ​​عبر مجموعة البيانات هي الطريقة الأكثر موضوعية ويمكن مقارنتها بسهولة.

لاحظ المؤلفون أنه حتى المقاييس الأكثر توازناً لا ينبغي الاعتماد عليها فقط (على سبيل المثال ، قد يفضل MCC التنبؤ المفرط في التنبؤ PPIS [214] وقلة التنبؤ في مكان آخر [255]) وأنه يجب النظر إلى أداء التوقع بشكل كلي عبر أكبر عدد ممكن من المقاييس ، مثل موازنة مقاييس الأداء تعتمد على المجال [47 , 255]. عند التفكير في تنبؤات PPIS لتصميم العقاقير المحاكية ، قد يكون من المرغوب فيه تقليل التنبؤ بشكل طفيف ، حيث من المحتمل أن تجد المخلفات الأساسية التي تتميز بتمييز أفضل [7 , 33] ، والتي يمكن من خلالها الاستدلال على PPIS المتبقية (بدلاً من "التخمين" أي من العديد من المخلفات المزعومة "النشطة" التي تتفاعل حتى).

التقييم المقارن

في حين أنه من الصعب استخلاص استنتاجات من الأداء المختلف للمتنبئين ، يمكننا مع ذلك ملاحظة بعض الاتجاهات التي يمكن تفسيرها من خلال النظرية البيولوجية التي نوقشت سابقًا. على سبيل المثال ، في حين أن مجموعات البيانات العابرة (مثل TransComp_1) تحصل عمومًا على درجات أقل من تلك الدائمة (مثل PlaneDimers) ، لا يتم اتباع ذلك تمامًا (الجدول 4) ، ربما بسبب صعوبة تحديد عتبة على التسلسل الدائم الدائم. قد تكون بعض المجموعات (على سبيل المثال S149) أكثر قابلية للتنبؤ بشكل جوهري ، كما يتضح من الدرجات الأعلى عبر جميع المتنبئين الآخرين يحققون نتائج أفضل فقط على أنواع معينة من المتنبئين (على سبيل المثال DB3-188 على المتنبئين الهيكلي القائم على التماثل). لتحقيق درجات عالية في مجموعات بيانات الاختبار المتخصصة ، غالبًا ما تتطلب المتنبئات إما تخصصات خاصة بها ، أو خصائص متأصلة تسمح بالتصنيف الدقيق (على سبيل المثال تخصص ANCHOR [10] للبروتينات المضطربة ونقص HomPPI [20]] يسمح لهم بالمعلومات الهيكلية التنبؤ بنجاح على المجموعات المضطربة S1 / 2). من الناحية النظرية ، يصعب التنبؤ بالهياكل غير المنضمة أكثر من المونومرات المرتبطة (بسبب التباين المطابق بين المجموعتين) وهذا ما تم تأكيده إلى حد كبير من خلال النتائج المختلفة على مجموعات DS56B / U ، وكذلك الدرجات الأقل عمومًا على المجموعات غير المنضمة (الجدول 4 ). بشكل عام ، وجدنا أنه قد تم إحراز تقدم كبير في القدرات التنبؤية للمتنبئين على مدار العقد الماضي عبر أنواع التفاعل ومجموعات البيانات المتنوعة.


5. الخلاصة

في هذه المراجعة ، قدمنا ​​لمحة عامة عن مبادئ الصيدليات ثلاثية الأبعاد ودورها في اكتشاف الأدوية. حقيقة أن نماذج الصيدلة ثلاثية الأبعاد عالمية وقابلة للتحرير وشاملة تسمح بتطبيقها في سيناريوهات مختلفة.

مجال التطبيق الرئيسي هو تحديد الروابط الجديدة من خلال الفحص الافتراضي. لهذا الغرض ، تعد نماذج 3D Pharmophore هي التقنية الوحيدة التي يمكن تطبيقها إما بطريقة تعتمد على الترابط أو على الهيكل. في كلتا الحالتين ، تعد نماذج الصيدلة ثلاثية الأبعاد فعالة للغاية من الناحية الحسابية ، مما يتيح الفحص الافتراضي لقواعد البيانات الكبيرة جدًا. يسمح المفهوم الأساسي لاستخلاص الوظائف الكيميائية بالتنقل بين السقالات وإثراء التنوع الكيميائي لقوائم النتائج. إجمالاً ، يمنح هذا الباحثين مزيدًا من المرونة فيما يتعلق بالبيانات المتاحة والموارد الحسابية وإمكانيات الاختبار. تسلط دراسات الحالة التي اخترناها الضوء على قوة الفحص الافتراضي القائم على الصيدلة لاكتشاف الأدوية وإظهار قابليتها للتطبيق على الأهداف الصعبة. أيضًا ، يمكن أن تستفيد حملات اكتشاف الأدوية المستندة إلى الشظايا الشائعة بشكل متزايد من فحص العقاقير من خلال تقليل كبير للشظايا التي تم اختبارها في المختبر وعن طريق ترشيد نمو الأجزاء مع تفاعلات جوهرية ثابتة للجزء. 54 ، 55

إلى جانب الفحص الافتراضي ، تعتبر الأدوية ثلاثية الأبعاد مناسبة تمامًا لدراسة وتصور أنماط الارتباط للجزيئات الشبيهة بالعقاقير. إن تكوينها لعدد محدود من ميزات التفاعل المحددة كيميائيًا يجعلها مفهومة وبديهية. يمثل هذا ميزة كبيرة في المشاريع متعددة التخصصات ، حيث أن النماذج الصيدلانية ثلاثية الأبعاد قادرة على ترشيد التأثيرات الدوائية المختلفة. لتحقيق هذا الهدف ، يتم عادةً دمج أدوات الصيدلة ثلاثية الأبعاد مع طرق أخرى مثل الإرساء أو محاكاة MD أو التعلم الآلي. تؤكد دراسات الحالة المختارة لهذا المجال على قوة الصيدليات ثلاثية الأبعاد في شرح وفهم وظائف البروتين ميكانيكيًا. بالإضافة إلى ذلك ، تعد أدوات الصيدلة ثلاثية الأبعاد أداة ممتازة للتواصل بين الباحثين ، وهو عامل غالبًا ما يتم التقليل من شأنه.

ومع ذلك ، إلى جانب المزايا والإمكانيات المذكورة أعلاه ، فإن نماذج الصيدلانية ثلاثية الأبعاد الكلاسيكية لها أيضًا عيوب معينة. إنها تمثل نماذج ثابتة للأنظمة عالية الديناميكية وتقتصر ميزات تفاعلها على الأشكال الهندسية البسيطة (على سبيل المثال ، الميزات الكروية). علاوة على ذلك ، فإنها تشترك في عيب مع تقنيات النمذجة الأخرى ، والتي تركز جميعها على تقدير المحتوى الحراري للتفاعلات الجزيئية ولكنها دون المستوى الأمثل لوصف التأثيرات الحتمية. ومع ذلك ، يساهم كل من المحتوى الحراري والإنتروبيا في التغيير في الطاقة الحرة لربط الترابط بجزيء ضخم. على الرغم من أن المفهوم الأساسي لتوليد الصيدلة ثلاثية الأبعاد وتطبيقه على الفحص الافتراضي لم يتغير في الثلاثين عامًا الماضية ، إلا أن هناك تطورات مختلفة في هذا المجال تهدف إلى معالجة أوجه القصور هذه.

وبالتالي فإن الجمع بين نماذج 3D الصيدلانية مع MDs هو تطور لاحق له إمكانات كبيرة. تم الإبلاغ عن طرق مختلفة لدمج MDs في النمذجة الصيدلانية ثلاثية الأبعاد ووصفها في هذه المراجعة. 71-75، 77-79، 81، 103 ومع ذلك ، فإن طريقة dynophore فقط هي التي تمثل نهجًا مؤتمتًا بالكامل ، والذي يعالج عيبين من عقاقير الصيدلة ثلاثية الأبعاد الكلاسيكية في وقت واحد. 74 يكشف تطبيق dynophore عن منظور جديد لربط الترابط من خلال توفير تصور لخصائص الصيدلة التي تهرب من الهندسة الكروية التقليدية ومن خلال تقديم الإحصائيات التي تُبلغ عن ترددات حدوث الميزة وأنماط الربط المختلفة على مدار المسار. قد يمثل الاستخدام المباشر لوظائف كثافة الخصائص هذه للفحص الافتراضي نقلة نوعية حقيقية في النمذجة الصيدلانية ثلاثية الأبعاد.

العديد من الأساليب المتقدمة تنظر أيضًا في التأثيرات الحتمية للربط الترابطي لنمذجة حامل العقاقير ثلاثية الأبعاد. 71-73 ، 78 ، 79 ، 81 ، 103 PyRod ، على سبيل المثال ، يحلل بيئة البروتين لجزيئات الماء في محاكاة MD ، مما يسمح بوضع ميزات الصيدلة في مواقع الترطيب مع بعض الخصائص الديناميكية الحرارية. 79 قد تحتوي مواقع الإماهة هذه على جزيئات ماء في بيئة بروتين شديدة الكراهية للماء أو تقيد جزيئات الماء بشدة عبر روابط هيدروجينية وشكل جيب الربط. إن تقييد الصيدليات ثلاثية الأبعاد على المواقع المهمة من الناحية الحتمية والإنثالبية يجعل هذه الأساليب أدوات قيمة لحملات الفحص الافتراضية ، خاصةً لأولئك الذين يولدون حوامل صيدلانية ثلاثية الأبعاد من بنية apo. الأهم من ذلك ، أن PyRod هي أداة مجانية ومفتوحة الوصول تجعل مثل هذه الاستراتيجيات في متناول قاعدة مستخدمين أوسع.

لا يزال الجمع بين مفهوم الصيدلة ثلاثية الأبعاد والتعلم الآلي / الذكاء الاصطناعي في مراحله الأولى فقط. على الرغم من وجود بعض الأساليب بالفعل ، 30 ، 82-86 ، نتوقع عددًا متزايدًا من الدراسات والطرق التي تهدف إلى استخدام ميزات الصيدلة كوصف أو محاولة إنشاء حوامل دوائية ثلاثية الأبعاد من البيانات الضخمة. هناك اتجاه آخر نلاحظه وهو توافر خدمات الويب المتاحة مجانًا للفحص الافتراضي القائم على الصيدلة. 87-91

تعد التطورات الأخيرة في مجال الصيدليات ثلاثية الأبعاد واعدة وتتيح الفرصة لتوظيف العقاقير ثلاثية الأبعاد بطرق متزايدة باستمرار ومواقف أكثر تحديًا ، مثل التنبؤ بالعديد من العناصر ، أو حركيات ربط النمذجة ، أو تنشيط مستقبلات خاصة بالمسار. بشكل عام ، تمثل العقاقير ثلاثية الأبعاد جزءًا أساسيًا من مجموعة أدوات تصميم الأدوية بمساعدة الكمبيوتر وهي مناسبة تمامًا لتحديد الروابط الجديدة وفهم تفاعلها مع الهدف الجزيئي.


النماذج الحسابية لإعادة البرمجة الخلوية

في عام 2006 ، قام تاكاهاشي وياماناكا بتقييم عدد من الجينات المرشحة فيما يتعلق بإمكانية تحفيز تعدد القدرات في الخلايا الجسدية (تاكاهاشي وياماناكا ، 2006). إن اكتشاف أن الإفراط في التعبير عن أربعة عوامل (Oct4 و Sox2 و Klf4 و c-Myc) يمكن أن يوجه إعادة برمجة الخلايا الجسدية إلى خلايا جذعية مستحثة متعددة القدرات (iPSCs) شكّل نقلة نوعية في علم الأحياء التطوري. ومع ذلك ، لا تزال تفاصيل وآليات عملية إعادة البرمجة أثناء إنشاء iPSC بحاجة إلى توضيح كامل (تاكاهاشي وياماناكا ، 2013).

يتمثل أحد القيود الحالية لعملية إعادة البرمجة الخلوية في كفاءتها المنخفضة ، حيث يوجد نموذجان توضيحيان مفاهديان: النموذج الحتمي ، حيث تمتلك بعض الخلايا فقط القدرة على توليد iPSCs خلال فترة زمنية ثابتة وموحدة (زمن الوصول) ، و stochastic model, in which most or even all cells are competent for reprogramming, but the latency differs (Hanna et al., 2009 Yamanaka, 2009). Hanna et al. combined time-series experiments with computational modelling to gain insights into the nature of reprogramming (Hanna et al., 2009). In their experiments, they monitored the proportions of iPSCs generated and found that reprogrammed cells appear in most clonal populations, if cultured for a sufficiently long time. However, the time to conversion apparently differs between clones, supporting the view that reprogramming is a continuous, stochastic process. Accordingly, the authors developed a mathematical model that considers reprogramming as a one-step stochastic process with a constant cell-intrinsic rate. Fitting the model to their experimental data, this intrinsic rate was estimated for different experimental settings. The authors argued that Nanog overexpression accelerates the reprogramming kinetics through a mechanism most likely independent of the cell proliferation rate. However, in that study, the molecular changes during reprogramming were analysed in heterogeneous cell populations, making sequential events occurring in single cells inaccessible. Combining single-cell expression analysis with a Bayesian network model (see Glossary, Box 1), Buganim et al. demonstrated that the reprogramming process can best be described by two phases: an early stochastic phase with high variation in gene expression and a subsequent, more hierarchical phase of gene activation (Buganim et al., 2012). The network model predicted that the activation of Sox2 initiates a number of consecutive steps that finally lead to fully reprogrammed iPSCs. The authors applied the hierarchical model to predict sets of TFs capable to induce pluripotency. Subsequently, these sets were tested experimentally, demonstrating that all of them facilitate iPSC generation but with different efficiencies, ranging from 0.2% (a combination without Oct4, Klf4, c-Myc) to 22.2% (using Oct4, Nanog, Esrrb, Klf4 and c-Myc). Interestingly, there is limited correlation between those genes that can facilitate efficient reprogramming and those of which the expression is predictive of future iPSC generation. For example, the endogenous expression of Oct4 does not necessarily predict iPSC generation, whereas the expression of Utf1 and Esrrb does.

Given the importance of both the genetic and epigenetic control of pluripotency, Artyomov et al. developed a computational model of pluripotency induction that couples both layers of regulation (Artyomov et al., 2010). In this study, all genes responsible for a particular cellular identity (e.g. Oct4, Sox2 and Nanog for pluripotency) were described as a single ensemble module. Moreover, cellular states, arranged in a hierarchical tree-like structure, were described not only by the expression levels of master genes, but also by the state of their epigenome. Artyomov et al. defined a set of rules on how protein expression can modify the epigenetic state and vice versa during cell cycle progression. Simulating thousands of independent reprogramming experiments, the authors found rare pathways leading to successful reprogramming.

As briefly illustrated by the studies discussed above, a combination of dynamic single-cell expression data and computational models provides insights into the different phases of the reprogramming process. Although an optimisation of the process seems hardly possible within the stochastic phase, targeted activation of pathways or genes in the hierarchical phase can enhance the generation of fully reprogrammed iPSCs. Selecting cells or cell colonies that express predictive markers might help to further increase the proportion of iPSCs, especially because environmental cues and cell-cell communication, which can be manipulated experimentally, play pivotal roles (compare with section on spatio-temporal dynamics).

Whereas stimulating particular components of the pluripotency GRN is crucial for the re-acquisition of a pluripotent cell state, limiting its activity is essential for its maintenance, as shown by studies on mESC differentiation, which we will cover in the following section.


ملحوظات

[ PubMed ] [ DOI ] The MBP1 family proteins are the DNA binding subunits of MBF cell-cycle transcription factor complexes and contain an N terminal winged helix-turn-helix (wHTH) DNA binding domain (DBD). Although the DNA binding mechanism of MBP1 from Saccharomyces cerevisiae has been extensively studied, the structural framework and the DNA binding mode of other MBP1 family proteins remains to be disclosed. Here, we determined the crystal structure of the DBD of PCG2, the Magnaporthe oryzae orthologue of MBP1, bound to MCB-DNA. The structure revealed that the wing, the 20-loop, helix A and helix B in PCG2-DBD are important elements for DNA binding. Unlike previously characterized wHTH proteins, PCG2-DBD utilizes the wing and helix-B to bind the minor groove and the major groove of the MCB-DNA whilst the 20-loop and helix A interact non-specifically with DNA. Notably, two glutamines Q89 and Q82 within the wing were found to recognize the MCB core CGCG sequence through making hydrogen bond interactions. Further in vitro assays confirmed essential roles of Q89 and Q82 in the DNA binding. These data together indicate that the MBP1 homologue PCG2 employs an unusual mode of binding to target DNA and demonstrate the versatility of wHTH domains.


شاهد الفيديو: لماذا يوجد اكثر من 20 طريقة لترتيب مجموعة من الارقام! ماهي الخوارزميات (ديسمبر 2022).