معلومة

كيف يمكنني استخراج الليجند مع ذرات البروتين المجاورة من PDB مع المركب؟

كيف يمكنني استخراج الليجند مع ذرات البروتين المجاورة من PDB مع المركب؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا لست على دراية بعلم الأحياء وأنا قادم من مجال علوم البيانات ، لذا يرجى المعذرة لنقص المعرفة. ما أريده هو إنشاء تمثيل ثلاثي الأبعاد لـ voxel لذرات الترابط مع جزء مجاور من البروتين (يبدو أنه يسمى الجيب) من ملف PDB الذي يحتوي على معقد.

على سبيل المثال ، فليكن 10 جرامًا من RCSB (https://files.rcsb.org/download/10GS.pdb). على سبيل المثال ، يمكن أن يكون 4xit أو 4wkc.

ما خططت له هو تحديد كل من ذرات البروتين والجينات ، وحساب المركز الهندسي للرابط ، ثم حساب القرب لكل ذرة وملء بعض المكعب المحيط ثلاثي الأبعاد.

عندما أفتح PDB لهذا المجمع (10 جم) ، أرى ما أفهمه كموقعين محتملين للربط لـ ligand VWW ، وموقعين آخرين - لـ MES:

REMARK 800 SITE_DESCRIPTION: الموقع الملزم لـ RESIDUE VWW A 210 REMARK 800 REMARK 800 SITE_IDENTIFIER: AC2 REMARK 800 EVIDENCE_CODE: SOFTWARE REMARK 800 SITE_DESCRIPTION: BINDING SITE FOR RESIDUE VWW BARK3 210 REMARK 800 SITE_IDENTIFIER: موقع ملزم لـ RESIDUE MES A 211 REMARK 800 REMARK 800 SITE_IDENTIFIER: AC4 REMARK 800 EVIDENCE_CODE: SOFTWARE REMARK 800 SITE_DESCRIPTION: BINDING SITE FOR RESIDUE MES B 211

كيف يمكنني المضي قدما من هذه النقطة؟ هل يحتوي PDB هذا على ذرات لـ ligand VWW ، موجهة بشكل صحيح ، وكيف يمكنني التعرف عليها جنبًا إلى جنب مع البروتين المستهدف المجاور؟

أم أن صياغتي للمشكلة خاطئة تمامًا؟


قد تجد دليل RCSB لفهم بيانات PDB ووثائق تنسيق ملف PDB مفيدة. سأستعرض بعض المعلومات الموجودة في ملفات PDB التي تبدو مناسبة لك ، باستخدام مثالك لـ 10GS.

يتم تحديد الروابط في قسم غير المتجانسين:

HET VWW A 210 33 HET MES A 211 12 HET VWW B 210 33 HET MES B 211 12 HETNAM VWW L-GAMMA-GLUTAMYL-S-BENZYL-N - [(S) -CarBOXY (PHENYL) HETNAM 2 VWW METHYL] -L -CYSTEINAMIDE HETNAM MES 2- (N-MORPHOLINO) -EthANESULFONIC ACID FORMUL 3 VWW 2 (C23 H27 N3 O6 S) FORMUL 4 MES 2 (C6 H13 N O4 S)

تخبرك هذه السجلات بهوية الروابط المرتبطة بالبروتين (VWW و MES) ، وكم عدد الروابط (4 في المجموع) ، والاسم الكيميائي (في سجل HETNAM) والصيغة الكيميائية (سجل FORMUL). يعطي سجل HET أيضًا عدد سجلات HETATM المرتبطة (33 لـ VWW و 12 لـ MES). فيما يلي أول خمسة سجلات HETATM لـ VWW للسلسلة A:

HETATM 3265 N VWW A 210 15.088 10.798 23.547 1.00 14.90 N HETATM 3266 CA VWW A 210 15.010 9.987 24.792 1.00 20.92 C HETATM 3267 C VWW A 210 16.115 8.924 24.830 1.00 21.55 C HETATM 3268 O VWW A 210 16.520 17.515 25.940 CB VWW A 210 13.635 9.327 24.908 1.00 14.23 سي

يتوافق كل سجل HETATM مع ذرة في الرابطة ويعطي الإحداثيات الكيميائية لكل منها على المحاور X و Y و Z. على سبيل المثال ، يحدد السجل الأول ذرة نيتروجين عند الإحداثيات (15.088 ، 10.798 ، 23.547).

يتم تحديد الاتصال (أي الترابط التساهمي) بين الذرات في يجند في سجلات CONECT. فيما يلي الخمسة الأوائل من ملف PDB:

اتصال 3265 3266 اتصال 3266 3265 3267 3269 اتصال 3267 3266 3268 3273 اتصال 3268 3267 اتصال 3269 3266 3270

يخبرك هذا أن الذرة 3265 (أول نيتروجين في سجلات HETATM أعلاه) مرتبطة بالذرة 3266 (كربون). يرتبط Atom 3266 بالذرات 3265 ، 3267 ، 3269. إلخ ...

يتم تحديد ذرات البروتين في سجلات ATOM. مثل سجل HETATM ، تقدم هذه السجلات بعض معلومات التعريف (الرقم التسلسلي للذرة والنوع واسم البقايا ورقمها ، إلخ) بالإضافة إلى الإحداثيات في مساحة ثلاثية الأبعاد. لأغراضك ، يبدو أنه يمكنك فقط المرور عبر ذرات البروتين والعثور على تلك الموجودة ضمن مسافة عتبة معينة من ذرة في يجند (أو المركز الهندسي للرابط). ومع ذلك ، فإن ملف PDB هذا يحتوي بالفعل على بعض المعلومات حول مواقع الربط لهذه الروابط الأربعة في سجلات الموقع (فيما يلي الأربعة الأولى المقابلة للموقع AC1):

الموقع 1 AC1 15 TYR A 7 PHE A 8 ARG A 13 TRP A 38 SITE 2 AC1 15 LYS A 44 GLY A 50 GLN A 51 LEU A 52 SITE 3 AC1 15 PRO A 53 GLN A 64 SER A 65 TYR A 108 SITE 4 AC1 15 HOH A 229 HOH A 303 ASP B 98

تحتوي سجلات SITE أيضًا على سجلات REMARK 800 المقابلة (الواردة في السؤال). على سبيل المثال ، يوصف موقع AC1 بأنه موقع ملزم لـ RESIDUE VWW A 210 كما هو محدد بواسطة البرنامج. لذلك في هذه الحالة ، تعد سجلات SITE هذه قائمة من المخلفات التي تشكل موقع الربط للروابط الخاصة بكل منها. قد ترغب في أن تكون حذرًا إلى حد ما من سجلات SITE هذه لأنه (1) على حد علمي أنها ليست سجلات إلزامية في ملف PDB وبالتالي قد لا تكون موجودة دائمًا ، و (2) ليس من الواضح تمامًا كيفية إنشائها. في هذه الحالة ، يتم إنشاء البرامج ... ولكن أي برنامج ... أو أي خوارزمية؟ لقد بحثت سابقًا في سجل SITE الخاص بموقع ربط في بروتين أعرفه جيدًا ولاحظت بعض حالات الغياب الواضحة من قائمة المخلفات ، لذا خذ ذلك على أساس قيمته.


كيف يمكنني استخراج الليجند مع ذرات البروتين المجاورة من PDB مع المركب؟ - مادة الاحياء

لقطة بيانات تجريبية

  • الطريقة: & nbspحيود الأشعة السينية
  • القرار: نبسب2.19 Å
  • R-Value Free: & nbsp0.232 نبسب
  • R- قيمة العمل: & نبسب0.208 نبسب
  • R- القيمة المرصودة: & nbsp0.209 نبسب

التحقق من صحة wwPDBونبسب ونبسبتقرير ثلاثي الأبعاد وتقرير كامل

اللدونة الركيزة للببتيد الفطري alpha-N-Methyltransferase.

(2020) ACS Chem Biol & nbsp15: 1901-1912

  • PubMed: & nbsp32491837 & nbsp ابحث في PubMedSearch على PubMed Central
  • DOI: & nbsp10.1021 / acschembio.0c00237
  • الاقتباس الأساسي من الهياكل ذات الصلة: & nbsp
    6QZZ ، 6QZY ، 6TSC ، 6R00
  • ملخص PubMed: & nbsp

يمكن أن يؤدي مثيلة ذرات النيتروجين الأميد إلى تحسين الاستقرار والتوافر الفموي ونفاذية الخلايا للعلاجات الببتيدية. المواد الكيميائية ن -ميثيل الببتيدات يمثل تحديًا. Omphalotin A هو مركب ريبوزومي ، دودي كاببتيد كبير الحلقات مع تسعة عمود فقري ن -مثيلات.

يمكن أن يؤدي مثيلة ذرات النيتروجين الأميد إلى تحسين الاستقرار والتوافر الفموي ونفاذية الخلايا للعلاجات الببتيدية. المواد الكيميائية ن -ميثيل الببتيدات يمثل تحديًا. Omphalotin A هو مركب ريبوزومي ، دودي كاببتيد كبير الحلقات مع تسعة عمود فقري ن -مثيلات. يُشتق المنتج الطبيعي للفطريات من البروتين الأولي ، OphMA ، الذي يؤوي كلاً من الببتيد الأساسي والببتيد المعتمد على SAM α- ن مجال ميثيل ترانسفيراز. يقوم OphMA بتكوين جهاز homodimer و α- ن يقوم مجال -methyltransferase بتثبيت مجموعات الميثيل في العابرة على نواة دودي كاببتيد الكارهة للماء وبعض المخلفات الطرفية C الإضافية للبروتومرات. هذه هي العمود الفقري لما بعد الترجمة ن - تحدث الميثيلات بطريقة معالجة من الطرف N إلى الطرف C من الركيزة الببتيدية. نوضح أن OphMA يمكنه ميثيل المخلفات القطبية والعطرية والمشحونة عند إدخالها في الببتيد الأساسي. بعض هذه الأحماض الأمينية تغير كفاءة ونمط المثيلة. يمكن أن يعمل Proline ، اعتمادًا على سياق التسلسل الخاص به ، كإشارة توقف قابلة للضبط. سمحت الهياكل البلورية لمتغيرات OphMA بترشيد هذه الملاحظات. تشير نتائجنا إلى إمكانية السيطرة على هذه الفطريات α- ن - ميثيل ترانسفيراز لتطبيقات التكنولوجيا الحيوية.

الانتماء التنظيمي: نبسب

معهد علم الأحياء الدقيقة ، قسم علم الأحياء ، Eidgenössische Technische Hochschule (ETH) زيورخ ، زيورخ ، سويسرا.


كيف يمكنني استخراج الليجند مع ذرات البروتين المجاورة من PDB مع المركب؟ - مادة الاحياء

Consolv 1.0 صفحة المعلومات

معمل التحليل البنيوي للبروتين
قسم الكيمياء الحيوية والبيولوجيا الجزيئية
جامعة ولاية ميشيغان

هيكل البروتين
تحليل وتصميم أمبير
معمل

مقدمة

يعتبر Consolv 1.0 أداة للتنبؤ بما إذا كانت جزيئات الماء المرتبطة بسطح البروتين من المحتمل أن يتم حفظها أو إزاحتها في هياكل بلورية أخرى من نفس البروتين تم حلها بشكل مستقل. تم تطوير Consolv من قبل أعضاء مختبر التحليل والتصميم البنيوي للبروتين في جامعة ولاية ميتشيغان ، وتم دعمه جزئيًا من خلال منحة NSF DBI-9600831.

للحصول على مراجع الأدبيات المتعلقة بـ Consolv ، يرجى الاطلاع على القسم الخاص بتفاصيل الخوارزمية.

التركيب

يمكن تجميع Consolv ضمن أنظمة Unix. لتثبيت Consolv ، قم بتنفيذ الخطوات التالية:

    قم بتنزيل البرنامج من github.com/psa-lab/Consolv وفك ضغطه.

    استخدم السطرين التاليين لمترجم CC الخاص بـ SGI:

ثم استخدم الأمر التالي من الدليل حيث تم فك حزمة Consolv:

سيطلب منك أمر التثبيت دليلين: موقع ملف ahplist.dat وموقع ملفات Brookhaven Protein Data Bank (PDB). يجب عليك استخدام أسماء المسار الكاملة ، وعدم استخدام متغيرات البيئة أو أحرف توسيع الصدفة (على سبيل المثال ، لا تستخدم

    / usr / local / biochem / consolv / Consolv

استكشاف أخطاء البرامج النصية في شل وإصلاحها

العديد من الأوامر الفردية التي تشكل Consolv هي نصوص برمجية شل. تفترض هذه البرامج النصية أن C-shell و Bourne-shell و Korn-shell مثبتة في المواقع القياسية. إذا كنت تواجه صعوبة في تشغيل واحد أو أكثر من هذه البرامج النصية ، فيمكنك تحرير السطر الأول من كل نص برمجي للإشارة إلى موقع الصدفة الصحيح لنظامك. تتضمن نصوص Consolv التي تعتمد على مواقع الصدفة ما يلي:

النصي صدفة
واعظ / بن / ش
تثبيت / بن / ش
سومبريد / بن / ksh
بن / اللواتس / بن / csh
بن / Consolv2pdb / بن / ش
بن / استخراج / بن / csh

إذا لم يكن لديك ksh مثبتًا على نظامك ، فحاول استخدام sh بدلاً من ذلك. تحتوي بعض إصدارات sh على ميزات ممتدة مماثلة لتلك الموجودة في ksh.

تشغيل Consolv

نظرة عامة على الاستخدام

يمكن تشغيل Consolv في واحد من ثلاثة أوضاع. الاستخدام الأكثر شيوعًا لـ Consolv هو أخذ بنية بروتينية بلورية واحدة ، واستخراج المعلومات البيئية حول كل جزيء من جزيئات الماء في الهيكل ، ثم توقع ما إذا كان من المحتمل حفظ كل جزيء ماء في غلاف الترطيب الأول أو إزاحته في بنية محلولة بشكل مستقل من نفس البروتين. يتم تحقيق ذلك عن طريق تشغيل Consolv في وضع التطبيق.

وضع الاختبار يمكن استخدامها لاختبار الدقة التنبؤية لـ Consolv باستخدام زوج من الهياكل من نفس البروتين. يتطلب هذا الوضع تركيبين بلوريين تم حلهما بشكل مستقل من نفس البروتين ، متراكبين في نفس نظام الإحداثيات. كما هو الحال في وضع التطبيق ، يتم استخراج المعلومات البيئية للمياه في غلاف الماء الأول من الهيكل الأول ، ويتم توقع الحالة المحفوظة / المزاحة لكل جزيء ماء. ومع ذلك ، في وضع الاختبار ، يتم إجراء اختبار دقة إضافي باستخدام الهيكل الثاني. يتم تحديد حالة الحفظ / الإزاحة الفعلية لكل ماء قشرة أولى فيما يتعلق بالهيكل البلوري الثاني ، وتتم مقارنة التنبؤات التي قدمها Consolv بالحفظ الفعلي بين الهيكلين. قد يكون هذا الوضع مفيدًا في اختبار دقة Consolv على فئة معينة من البروتينات ، والتحقق من أن Consolv يعمل بشكل صحيح ، وما إلى ذلك.

في أي التطبيق أو وضع الاختبار، تم تحسين تنبؤات Consolv الافتراضية لجميع جزيئات الماء ذات الغلاف الأول. يمكن استخدام العلم "-a" لإرشاد Consolv إلى تحسين التنبؤات لجزيئات الماء في الموقع النشط فقط. ستكون التنبؤات الناتجة أكثر دقة لجزيئات الماء في الموقع النشط على حساب جزيئات الماء الأخرى ذات الغلاف الأول. يجب استخدام هذه العلامة عند الرغبة فقط في التنبؤ بالمياه القريبة من الموقع النشط. للحصول على تنبؤات لكل من جزيئات الماء في الموقع النشط وغير النشط ، قم بتشغيل Consolv مرتين: مرة باستخدام العلم "-a" ، ومرة ​​أخرى بدونها.

في وضع البيئة، لم يتم إجراء تنبؤات محفوظة / مزاحة. يتم استخراج المعلومات البيئية لجميع المياه من بنية بروتينية واحدة ووضعها في ملفات الإخراج ، ثم يتم التحكم فيها.

ملاحظة: الرجاء استخدام '-الخامس' علم لتنشيط الإخراج المطول.

تحضير ملفات الإحداثيات

وضع التطبيق

عادةً ما يتطلب تشغيل وحدة التحكم في وضع التطبيق عدم المعالجة المسبقة لملفات PDB. ومع ذلك ، إذا كان ملف PDB الخاص بك يتضمن إحداثيات هيدروجين واضحة ، فيجب إزالتها قبل تشغيل Consolv. يوجد نص بسيط ، يسمى pdbdehydrogen ، والذي تم تضمينه مع Consolv ، ويمكن استخدامه لهذا الغرض. لإزالة إحداثيات الهيدروجين من ملف PDB ، يمكنك استخدام هذا البرنامج النصي على النحو التالي:

بعد اكتمال هذه الخطوة ، تكون جاهزًا للمتابعة إلى القسم التالي: تشغيل وحدة التحكم في وضع التطبيق.

يتطلب وضع الاختبار عدة خطوات إعداد إضافية. بالنسبة لوضع التطبيق ، يجب إزالة أي إحداثيات واضحة للهيدروجين من ملفات الإحداثيات قبل تشغيل Consolv. يتطلب وضع الاختبار هيكلين تم حلهما بشكل مستقل من نفس البروتين ، ويجب أن يكون كلاهما في نفس نظام الإحداثيات. وبالتالي ، فإن الخطوة التالية في إعداد الهياكل لاستخدامها مع Consolv في وضع الاختبار هي تركيب الهيكلين في نظام إحداثيات مشترك. في تطوير واختبار Consolv ، تم تنفيذ هذه الخطوة باستخدام برنامج الرسومات الجزيئية InsightII من Molecular Simulations ، Inc. ومع ذلك ، فإن أي برنامج قادر على تركيب ذرات العمود الفقري للهيكلين وكتابة ملف بتنسيق PDB سيكون كافياً. نظرًا لأن التغييرات التوافقية الكبيرة في العمود الفقري للبروتين بين الهيكلين يمكن أن تؤثر على تحديد كونسولف للمياه المحفوظة ، فمن المستحسن أن يكون الانحراف التربيعي لمتوسط ​​الجذر أقل من 1.0 لذرات العمود الفقري.

عند التشغيل في وضع الاختبار ، يقوم Consolv بوضع علامات على ذرات الموقع النشط للبروتين بحيث يمكن تحليل نتائج الموقع النشط بشكل مستقل عن جزيئات الماء الأخرى ذات الغلاف الأول. يتطلب تحديد الموقع النشط أن يكون Consolv قادرًا على تحديد ذرات البروتين وذرات الترابط في ملف PDB - ويتم ذلك باستخدام معرف سلسلة PDB. معرف السلسلة هو معرف من حرف واحد موجود في العمود 22 من سجلات ATOM و HETATM لملف PDB. بالنسبة للروابط الببتيدية ، سيكون لمعظم ملفات PDB بالفعل معرفات سلسلة مستقلة للبروتين والرابط. بالنسبة للروابط المكونة بالكامل من HETATMS ، قد لا يكون للرابط معرف سلسلة على الإطلاق. عند تشغيل Consolv في وضع الاختبار ، سيطالبك بمعرف سلسلة البروتين ، ومعرف السلسلة الخاص بالرابط ، وسيستخدم هذه المعلومات لتحديد موقع الموقع النشط. إذا لم يكن للبروتين والرابطية معرفات سلسلة مميزة في ملفات PDB ، فيجب إضافتها باستخدام محرر نصوص. عند إضافة معرف السلسلة ، يكون من الأسهل استخدام معرف سلسلة واحد لجميع ذرات البروتين ، ومعرف سلسلة آخر لجميع ذرات الترابط.

يوضح المثال التالي العديد من سجلات ATOM و HETATM من ملف PDB مع معرف السلسلة "P" المخصص لذرات البروتين ومعرف السلسلة "I" (للمثبط) المخصص لذرات الترابط:

في المثال أعلاه ، يُعتبر Thio-NADP + (TAP) المربوط جزءًا من البروتين ، وبالتالي يتم تمييزه بمعرف سلسلة من "P" ، بينما يتم تمييز ذرات ليجند البيوبترين بمعرف سلسلة "I". بمجرد تراكب ملفي الإحداثيات بشكل صحيح وإضافة معرفات السلسلة ، يصبحون جاهزين للاستخدام بواسطة Consolv في وضع الاختبار. انقر هنا للانتقال إلى قسم تشغيل وحدة التحكم في وضع الاختبار.


وضع البيئة

كما هو الحال مع وضع التطبيق ، يلزم الحد الأدنى من التحضير لتشغيل Consolv في وضع البيئة. يجب إزالة أي إحداثيات واضحة للهيدروجين من ملف PDB كما هو موضح في القسم الخاص بالتحضير لتشغيل Consolv في وضع التطبيق. بمجرد إزالة أي هيدروجين من ملف PDB الخاص بك ، انقر هنا للحصول على تفاصيل حول تشغيل Consolv في وضع البيئة.

تشغيل Consolv في وضع التطبيق

بمجرد إعداد ملف إحداثيات البروتين كما هو موضح أعلاه ، يكون تشغيل Consolv في وضع التطبيق أمرًا سهلاً ، ما عليك سوى تنفيذ الأمر التالي:

أين protPDBCode هو رمز PDB للبروتين للعمل معه ، و ملف protPDB هو اسم المسار الكامل للملف الذي يحتوي على إحداثيات البروتين. إذا لم يتم تعيين رمز PDB للبروتين بعد ، فيمكنك استخدام أي مجموعة مكونة من 4 أحرف من الأرقام والحروف. يتم تضمين كود PDB في ملفات الإخراج لتحديد جزيئات الماء التي يتم تصنيفها.

إذا كان '-علم تم تضمينه ، يتم ضبط التنبؤات لجزيئات الماء في الموقع النشط. في هذه الحالة ، من المرجح أن تكون التنبؤات الخاصة بجزيئات الماء الموجودة في الموقع النشط للبروتين أو بالقرب منه صحيحة فقط. للحصول على تنبؤات دقيقة للمياه التي ليست قريبة من الموقع النشط ، قم بتشغيل Consolv بدون '-علم.

إذا لم يكن دليل Consolv في مسار التنفيذ ، فقد تحتاج إلى تحديد اسم المسار بالكامل إلى البرنامج النصي Consolv. فيما يلي مثال على تشغيل Consolv في وضع التطبيق حيث يوجد دليل Consolv / usr / local / Consolvوملف PDB pdb3apr.ent تم نسخه أو ربطه بالدليل الحالي:

يمكنك الآن استخدام ملفات سومبريد لعرض نتائج التنبؤ ، كما هو موضح في القسم الذي يصف ملفات الإخراج التي تم إنشاؤها بواسطة Consolv.

تشغيل Consolv في وضع الاختبار

يشبه تشغيل وحدة التحكم في وضع الاختبار التشغيل في وضع التطبيق ، ولكن هناك بعض التفاصيل الإضافية التي يجب تضمينها في سطر الأوامر. على وجه التحديد ، يحتاج Consolv إلى معرفة معرف السلسلة للبروتين والرابط. تُستخدم هذه المعلومات للعثور على ذرات بروتين الموقع النشط وجزيئات الماء وتسميتها. للحصول على تفاصيل حول تعيين معرفات السلسلة في ملف PDB ، راجع القسم الخاص بإعداد ملفات الإحداثيات للاستخدام مع Consolv.

يمكن تشغيل Consolv في وضع الاختبار باستخدام أي بنيتين تم حلهما بشكل مستقل من نفس البروتين. يجب أن يكون أحد الهيكلين على الأقل معقدًا بين البروتين والمثبط أو يجند آخر ، بحيث يمكن تحديد الموقع النشط للبروتين. يحتاج ملف PDB فقط لهذا المجمع إلى تعيين معرف السلسلة. بمجرد تحضير ملفات PDB ، يمكنك تشغيل Consolv في وضع الاختبار باستخدام سطر الأوامر التالي:

حيث يكون Consolv هو المسار الكامل لنص Consolv الرئيسي ، بروتبديب هو رمز PDB لبنية البروتين الخالية من الترابط (أو تلك التي لا تحتوي على معرف السلسلة المعين ، إن وجدت) ، cplxPDB هو رمز PDB للبنية المعقدة (التي يجب أن يكون لها معرف سلسلة معين) ، ملف بروتي هو اسم المسار الكامل لملف PDB لهيكل البروتين ، ملف cplx هو اسم المسار الكامل لملف PDB للهيكل المعقد ، بروتيد هو معرف السلسلة للبروتين في البنية المعقدة ، و معرف هو معرف السلسلة للرابط في الهيكل المعقد.

إذا كان '-علم تم تضمينه ، يتم ضبط التنبؤات لجزيئات الماء في الموقع النشط. في هذه الحالة ، من المرجح أن تكون التنبؤات الخاصة بجزيئات الماء الموجودة في الموقع النشط للبروتين أو بالقرب منه صحيحة فقط. للحصول على تنبؤات دقيقة للمياه التي ليست قريبة من الموقع النشط ، قم بتشغيل Consolv بدون '-علم.

يجب أن يعمل المثال التالي بشكل صحيح ، بافتراض ذلك / usr / local / Consolv يتم استبدال اسم المسار الصحيح لـ Consolv وملفات PDB pdb2apr.ent و pdb3apr.ent تم نسخها أو ربطها بالدليل الحالي:

يمكنك الآن استخدام ملفات سومبريد لعرض نتائج التنبؤ ، كما هو موضح في القسم الخاص بملفات الإخراج التي تم إنشاؤها بواسطة Consolv.

تشغيل Consolv في وضع البيئة

تشغيل وحدة التحكم في وضع البيئة مماثل للتشغيل في وضع التطبيق ، باستثناء الكلمة الأساسية لا مقياس يتم تضمينه باعتباره آخر معلمة سطر أوامر. على سبيل المثال ، إذا تم تثبيت Consolv في / usr / local / Consolvوملف PDB pdb2apr.ent موجود في الدليل الحالي ، ثم يمكنك استدعاء Consolv في وضع البيئة على النحو التالي:

يمكنك الآن استخدام ملفات سومبريد لعرض نتائج التنبؤ ، كما هو موضح في القسم الخاص بملفات الإخراج التي تم إنشاؤها بواسطة Consolv.

ملفات الإخراج

يتم تقسيم نتائج التصنيف التي تنتجها Consolv عبر عدة ملفات إخراج. لإنتاج ملخص يمكن قراءته من قبل الإنسان لهذه النتائج ، استخدم برنامج sumpred في دليل Consolv. تأكد من أنك في نفس الدليل مثل ملفات الإخراج من تشغيل Consolv ، ثم اكتب:

استبدال / usr / local / Consolv / مع الدليل الذي قمت بتثبيت Consolv فيه محليًا ، و PDBcode مع كود PDB للبروتين الذي تصنف من أجله جزيئات الماء. إذا قمت بذلك ، على سبيل المثال ، سومبريد 2 اب, سومبريد سوف نتوقع الملفات 2 أبريل و 2apr.act، وكلاهما من إنتاج Consolv ، ليكون موجودًا في الدليل الحالي.

سيعرض Sumpred ملخصًا على شاشتك. يمكنك إعادة توجيه هذا الإخراج إلى ملف بالطريقة المعتادة. على سبيل المثال:

تشمل التفاصيل المدرجة في الملخص رقم المخلفات لكل مياه ، وتصنيفها المتوقع (Disp = إزاحة ، صافية = محفوظة) ، وعدد الأصوات التي تم الإدلاء بها لكل فئة ، والتي يمكن أن تكون بمثابة مقياس للثقة في كل تنبؤ. للحصول على تفاصيل حول التصويت وعملية التصنيف ، راجع قسم تفاصيل الخوارزمية. إذا تم تشغيل Consolv في وضع الاختبار ، فسيتضمن الملخص أيضًا مقارنة تنبؤات Consolv بالحالة المحفوظة / المزاحة لكل ماء كما لوحظ من خلال تركيب الهيكلين ومقارنة مواضع جزيء الماء.

أثناء التشغيل ، ينتج Consolv ملفات إخراج متنوعة. تشمل الملفات الضرورية لـ sumpred * .pred و * .cons و * .env و * .actsite.hits. تحتوي الملفات الأخرى على نتائج وسيطة أو معلومات مساعدة حول البروتين. يتبع ملخص ملفات المخرجات Consolv. غالبًا ما تكون أسماء الملفات لملفات الإخراج الإضافية هذه من النموذج PDBcode. *، حيث PDB هو كود PDB للبروتين الذي أنتج ملف الإخراج هذا ، أو PDB ملف. *، حيث PDBfile هو اسم ملف PDB الذي تم استخدامه كمدخل إلى Consolv.


اسم الملف أساليب محتويات
PDBcode.env الجميع المعلمات البيئية لجميع المياه في الهيكل.
PDB ملف الجميع يسجل PDB جميع جزيئات الماء في الهيكل.
PDBcode.scl تطبيق،
اختبار
المعلمات البيئية للجميع أول قذيفة جزيئات الماء في الهيكل ، متدرجة على مدى [1.0 - 10.0].
PDBcode.pred تطبيق،
اختبار
التنبؤات المحفوظة / المزاحة لجميع المياه في الهيكل. هذا الملف غير مهيأ للتحليل البشري. يستخدم سومبريد لتلخيص نتائج التنبؤ.
PDBcode.active.hits اختبار يسجل PDB جميع جزيئات الماء النشطة في الموقع في الهيكل.
PDBcode.cons اختبار الحالة الفعلية المحفوظة / النازحة لكل ماء في الهيكل ، على النحو المحدد من خلال تراكب الهيكلين ومقارنة أوضاع المياه. 0 = نازح ، 1 = محفوظ.

التشخيص

تشبه رسالة التحذير الأكثر شيوعًا التي تظهر عند تشغيل Consolv ما يلي:

يشير هذا إلى أن Consolv غير متأكد من القيمة الدقيقة لاستخدامها في الماء الذري لذرة من النوع NH2A في سياق بقايا ARG. بالنسبة لمعظم ذرات البروتين ، يعني هذا غالبًا أنه تم استخدام تسمية غير عادية لهذه الذرة في ملف PDB. يعد هذا التحذير أكثر شيوعًا بالنسبة إلى HETATM ، نظرًا لأن مجموعة فرعية صغيرة فقط من الأنواع العديدة من HETATMs التي يمكن أن تظهر في ملف PDB معروفة لـ Consolv.

يتم تخزين قيم المحبة المائية الذرية لكل نوع ذرة معروف لـ Consolv في ملف ahplist.dat من المحتمل أن يكون هذا الملف مثبتًا في نفس الدليل مثل باقي Consolv ، ولكن يمكن تثبيته في مكان آخر ، كما هو موضح في القسم الذي يغطي تثبيت Consolv. إذا كنت ترغب في إضافة أنواع ذرات إضافية إلى هذا الملف ، فيمكنك تحرير الملف كما هو موضح في القسم التالي ، ملفات الإدخال والمعلمات القابلة للتعديل. إذا لم يعثر Consolv على تطابق تام للذرة والبقايا الموجودة في ahplist.dat، سيستخدم متوسط ​​قيمة الماء لجميع الذرات من نفس النوع. في المثال أعلاه ، تم تعيين نوع غير معروف من ذرة النيتروجين قيمة محبة للماء مساوية لمتوسط ​​القيمة لجميع أنواع ذرات النيتروجين. يتم أيضًا تعيين القيم المتوسطة المراد استخدامها في الملف ahplist.dat.

ملفات الإدخال والمعلمات القابلة للتعديل أمبير

بخلاف ملفات PDB التي تقوم بمعالجتها حاليًا ، تشير Consolv إلى ملف بيانات إضافي واحد فقط. هذا الملف هو ملف ahplist.dat الملف المذكور في القسم السابق. يحتوي هذا الملف على قيم الرطوبة الذرية للعديد من أنواع ذرات البروتين الشائعة و HETATMs في سياق المخلفات المختلفة. يمكن تحرير هذا الملف ليشمل أنواع ذرات جديدة وأسماء بديلة لأنواع ذرات موجودة. كل إدخال من هذا الملف له التنسيق التالي:

ذرة هو اسم الذرة ، تمامًا كما يظهر في ملف PDB ذرة أو حتم سجل. بصورة مماثلة، بقايا هو اسم البقايا ، ومع ذلك يمكن استخدام الرمز * لمطابقة أي اسم بقايا. ال القيمة هي القيمة المحبة للماء الذرية لتخصيصها للذرات من هذا النوع.

البرامج النصية وأدوات أمبير المقدمة

يتم توفير العديد من الأدوات الإضافية في الدليل الفرعي bin الخاص بدليل تثبيت Consolv ، بما في ذلك:

مقتطف

يمكن استخدام هذا البرنامج النصي لاستخراج مجموعة فرعية من الميزات المتاحة من ملف .env الذي تنتجه Consolv. الاستخدام:

حيث قد تتضمن قائمة الميزات أيًا من العلامات التالية أو كلها:

بطاقة شعار ميزة
الكثافة الذرية
الماء الذري
B- القيمة
# روابط الهيدروجين بذرات البروتين
# روابط الهيدروجين لجزيئات الماء الأخرى
إمكانية التنقل
صافي القيمة B لذرات البروتين المجاورة
متوسط ​​قيمة B لذرات البروتين المجاورة
علامة محفوظة / نازح
علامة الموقع النشط

على سبيل المثال ، لاستخراج معلومات الكثافة الذرية والماء الذري فقط من ملف .env لبروتياز الأسبارتيك 2 أبريل، يمكنك استخدام:

Consolv2pdb

يأخذ هذا البرنامج النصي تنبؤات Consolv المحفوظة / المزاحة ، وينتج ملفين بتنسيق PDB - أحدهما يحتوي على جميع المياه التي توقعها Consolv أن يتم حفظها ، والآخر يحتوي على جميع المياه المتوقع إزاحتها. يمكن أن يكون هذا مفيدًا لتصور نتائج تنبؤات Consolv عبر برنامج الرسومات الجزيئية. يتم تنفيذ البرنامج على النحو التالي:

يتوقع البرنامج النصي الملفات PDBcode.pred و PDBcode.env و PDBcode.ent يمكن العثور عليها في الدليل الحالي. ينتج ملفين: PDBcode.preddisp و PDBcode.predcons. كلاهما عبارة عن ملفات بتنسيق PDB تحتوي على جزيئات الماء فقط ، ويجب أن تكون قابلة للعرض بواسطة معظم برامج الرسومات الجزيئية.

تفاصيل حسابية

تم نشر العديد من الأوراق التي تصف خوارزمية التصنيف المستخدمة من قبل Consolv للتنبؤ بالحفاظ على موقع المياه ، والبيانات المستخدمة لتدريب المصنف ، ونتائج اختبار التحقق المتبادل من دقة المصنف. لمزيد من التفاصيل حول Consolv ، يرجى الاطلاع على المراجع التالية:

إم إل رايمر ، دبليو إف بانش ، إي دي جودمان ، بي سي سانشغرين ، وإل إيه كون. التحجيم والاختيار المتزامن للميزات باستخدام الخوارزمية الجينية (pdf). بروك. السابع كثافة العمليات. أسيوط. الخوارزميات الجينية (ICGA). ذ. بايك ، أد. دار نشر مورجان كوفمان ، سان فرانسيسكو ، 561-567 ، 1997.

يرجى ملاحظة أنك ستحتاج إلى برنامج Adobe Acrobat Reader لعرض ملفات pdf هذه. يمكنك تنزيل نسخة مجانية من برنامج Acrobat Reader من هنا.

معلومات اكثر

انقر هنا للاتصال بـ Kuhn Lab بخصوص الأسئلة وتقارير الأخطاء وما إلى ذلك.


كيف يمكنني استخراج الليجند مع ذرات البروتين المجاورة من PDB مع المركب؟ - مادة الاحياء

لقطة بيانات تجريبية

  • الطريقة: & nbspحيود الأشعة السينية
  • القرار: نبسب1.80 Å
  • R-Value Free: & nbsp0.188 نبسب
  • R- قيمة العمل: & nbsp0.152 نبسب

التحقق من صحة wwPDBونبسب ونبسبتقرير ثلاثي الأبعاد وتقرير كامل

الأساس الهيكلي لتعديل غطاء RNA بواسطة SARS-CoV-2.

(2020) Nat Commun & nbsp11: 3718-3718

  • PubMed: & nbsp32709886 & nbsp ابحث في PubMedSearch على PubMed Central
  • DOI: & nbsp10.1038 / s41467-020-17496-8
  • الاقتباس الأساسي من الهياكل ذات الصلة: & nbsp
    6WKS
  • ملخص PubMed: & nbsp

تسبب فيروس كورونا -2 المتلازمة التنفسية الحادة الوخيمة (SARS-CoV-2) ، العامل المسبب لمرض COVID-19 ، في ملايين الإصابات في جميع أنحاء العالم. في فيروسات كورونا السارس ، البروتين غير الهيكلي 16 (nsp16) ، بالاقتران مع nsp10 ، ميثيل 5'-end of mRNAs المشفرة فيروسيًا لتقليد mRNAs الخلوية ، وبالتالي حماية الفيروس من تقييد المناعة الفطري للمضيف.

تسبب فيروس كورونا -2 المتلازمة التنفسية الحادة الوخيمة (SARS-CoV-2) ، العامل المسبب لمرض COVID-19 ، في ملايين الإصابات في جميع أنحاء العالم. في فيروسات كورونا السارس ، البروتين غير الهيكلي 16 (nsp16) ، بالاقتران مع nsp10 ، ميثيل 5'-end of mRNAs المشفرة فيروسيًا لتقليد mRNAs الخلوية ، وبالتالي حماية الفيروس من تقييد المناعة الفطري للمضيف. نبلغ هنا عن الهيكل عالي الدقة للمجمع الثلاثي لـ SARS-CoV-2 nsp16 و nsp10 في وجود متناظر من الركيزة RNA ومانح الميثيل ، S-adenosyl methionine (SAM). يتم التقاط مغاير nsp16 / nsp10 في فعل مثيلة 2'-O لسكر الريبوز للنيوكليوتيدات الأولى لـ SARS-CoV-2 mRNA. نلاحظ تغييرات توافقية كبيرة مرتبطة بربط الركيزة حيث ينتقل الإنزيم من حالة ثنائية إلى حالة ثلاثية. يوفر نموذج الملاءمة المستحث هذا رؤى ميكانيكية في مثيلة 2'-O لغطاء mRNA الفيروسي. نكتشف أيضًا موقعًا بعيدًا (25 Å) لربط الترابط فريد من نوعه لـ SARS-CoV-2 ، والذي يمكن بدلاً من ذلك استهدافه ، بالإضافة إلى غطاء RNA وجيوب SAM ، لتطوير مضاد للفيروسات.


BANΔIT: تحليل B’-Factor لتصميم الأدوية والبيولوجيا الإنشائية

يمكن استخدام تحليل ملفات تعريف عامل B من هياكل بروتين الأشعة السينية لتصميم دواء قائم على الهيكل ، حيث ارتبطت التغييرات في تنقل البروتين بجودة تفاعلات البروتين الرابط. باستخدام BANΔIT (تحليل عامل B ومجموعة أدوات التفسير ΔB) ، قمنا بتطوير تطبيق متصفح قائم على JavaScript يوفر واجهة مستخدم رسومية لتطبيع وتحليل ملفات تعريف B’-factor. للتأكيد على قابلية الاستخدام لتطبيقات تصميم الأدوية العقلانية ، قمنا بتحليل مجموعة مختارة من مجمعات بروتينات بروتينية بلورية وأعطينا استنتاجات نموذجية لمزيد من تحسين الأدوية بما في ذلك تطوير نموذج B'-factor للدواء المدعوم من أجل الأنزيم البروتيني الرئيسي SARS CoV-2 مثبطات. BANΔIT متاح على الإنترنت على https://bandit.uni-mainz.de. يمكن تنزيل الكود المصدري من https://github.com/FBarthels/BANDIT.

تمثل الحركة المتأصلة للبروتينات تحديًا طويل الأمد في تصميم الأدوية ، لكن ملخصًا للأمثلة الحديثة أظهر أنه يمكن استغلال فهم العمليات الهيكلية الديناميكية لتصميم دواء عقلاني. 1 تحليل الهياكل البلورية للبروتين هو أداة روتينية لدراسات الترابط. في تصميم الأدوية المعتمد على التركيب ، تم التركيز على فهم التفاعلات الجزيئية من الإحداثيات ثلاثية الأبعاد ، لكن الهياكل البلورية للأشعة السينية تتضمن أيضًا بشكل طبيعي عوامل الإزاحة الذرية ، والمعروفة باسم B- أو Debye-Waller- أو عوامل درجة الحرارة ، التي تعطي معلومات الدقة الذرية عن التنقل في الهيكل. 2 ومع ذلك ، فإن توزيع عوامل B الخام غير منتظم بمقارنة مجموعات التصوير البلوري المختلفة ، لأنها تتأثر بشدة بالدقة والتعبئة البلورية وجودة طرق التنقية المستخدمة. 3 بسبب هذه الظروف ، من الضروري تطبيع عوامل B قبل أن يمكن مقارنتها بين هياكل البروتين المختلفة. العامل B الطبيعي (B’-factor) هو تعبير إحصائي للعامل B التجريبي الخام الذي تم تطوير طرق حساب مختلفة من أجله. 4-6

تم استخدام تحليل العامل B سابقًا لتحليل توزيع الموقع النشط مقابل بقايا الموقع غير النشطة ، 7 للتحقيق في المرونة في واجهات البروتين والحمض النووي ، 8 للتمييز بين مواقع ربط البروتين واتصالات التعبئة البلورية ، 9 لتقدير تقاربات ربط البروتين - الترابط ، 10 والعديد من التطبيقات الأخرى التي تم تلخيصها في المراجعات. 11 في الآونة الأخيرة ، تم استكشاف هذه المنهجية أيضًا لتصميم عقلاني لأن التغييرات في عوامل B تشير إلى تعزيز أو إضعاف التفاعلات الجزيئية على مستوى الدقة الذرية. 12-14 عادةً ما يؤدي ارتباط الروابط القابلة للانعكاس بأهدافها إلى تصلب سقالة البروتين وتتجلى في تقليل عامل B’-الذي وجد أنه يرتبط ارتباطًا تقريبيًا بقوة الربط للرابط. 15

The BANΔIT toolkit (https://bandit.uni-mainz.de) enables facile B’-factor analysis for users from medicinal and biological chemistry fields by accessing the graphical user interface through a web browser. For offline usage, the underlying source code can be downloaded from https://github.com/FBarthels/BANDIT. The open-source program package was realized in a client-side dynamic website environment with HTML/JavaScript and is distributed under LGPL license. Even if the program is accessed via the web appearance, the client-side content is generated on the user‘s local computer. By this, the submitted crystallographic data never leaves the user‘s computer, an important implication that underlies the fact many solved crystal structures are confidential. Besides data security, this approach is robust, offers excellent cross-platform usability and the client-side rendering takes less than a second. The BANΔIT implementation includes the following modules:

(i) Creating a B-factor record set from a PDB-file: The parse pdb library was developed to create a JavaScript recordSet, which is used for handling of either local PDB-files or fetching from the rcsb.org repository. The respective fileData is transferred to a parseBuffer, parsed by the library and finally accessible through a pdbObject.

Crystallographic B-factors are a quantity with atomic resolution, i. ه. there is an individual B-factor for each heavy atom of a structure. However, the most common approach to study protein mobility is the residue-wise analysis of B′-factors as the flexibility index. The choice of which B-factors should represent a single residue is guided by the respective application. وهكذا ، فإن tempFactors (B-factors) specified by the ATOM-records can be selectively extracted from a recordSet. The comparison of Cα B’-factor profiles is the gold standard in the characterization of backbone mobility that results from protein dynamics, but the normalization of an averaged value over all backbone heavy atoms (N, Cα, C, O) has also been reported in representative studies. 16 For the analysis of side-chain mobility, all heavy atoms of the structure were considered for B-factor normalization. 12, 17

(1)

(ii) Normalization of B-factors: B-factor normalization is the transformation of experimental B-factors so that the resulting distribution is defined in terms of the expected value and the variance, which allows the comparison of B’-factors for different datasets in a way that eliminates gross influences. The normalization procedure is carried out by the process pdb library and the normalized data are transferred to a tempSet, i. ه. أ recordSet of B′-factors per residue.

(2) (3) (4) However, both estimators used in the standard z-score, the sample mean and the standard deviation, can be disturbed by even a single outlier value. حداد وآخرون. found that experimental B-factors follow not a normal distribution, but a Gumbel distribution. 6 They developed an approach for the identification of outliers by the median absolute deviation (MAD) as a robust measure for the variability of experimental B-factors around the median (eq. 5). Following the recommendation of Iglewicz and Hoaglin, a modified z-score cut-off value of M(i)>3.5 was chosen to label B-factor outliers (eq. 6. 19 (5) (6) With raw B-factors filtered for outliers, a standard z-score with the arithmetic mean والانحراف المعياري can be calculated (eq. 7. (7) IBM developed a particularly robust modified z-transformation algorithm (MADه method) which completely relies on the median for calculating the z-score. 20 Depending on the value of the MAD, modified z-scores were calculated in one of two ways (eq. 8). Although this approach has found its way into the B-factor literature only rarely, 13 it might be advantageous because it is the least influenced by outliers. (8) (9) If a B’-factor profile resolution greater than a single residue is desired, the fluctuating atomic resolution of B′-factors was found to be a hindrance, e. ز. if B’-factors are used for the characterization of secondary structure motives. Since abrupt changes in flexibility within a closed backbone sequence are physically not to be expected, a smoothing method for B′-factors was implemented. 24 Smoothed -factors can be calculated by a moving average with a variable residue window size ن (eq. 10. (10)

(iv) Alignment of structures: B-factors are primarily normalized to be compared between different data sets. It is possible to calculate the difference only if two corresponding B′-factors exist, thus, incompletely resolved atomic records must be excluded by the process pdb library. To derive structural-biologically relevant statements ΔB′-values have to be finally checked for their significance in the ΔB′-population (p<0.05). 12, 25

To perform a comparative analysis, an alignment between the target data sets may be necessary. Based on the optimization algorithm proposed by Needleman and Wunsch a common sequence-based alignment was implemented for standard use on nearly identical proteins. 27 Furthermore, based on the MMLigner package, 28 which allows structural alignments built on Bayesian and information-theoretic principles, the possibility was implemented to align structurally conserved but sequentially different proteins. Since the MMLigner program has been developed in C++, the complementary JavaScript code was ported with the LLMV-JS compiler Emscriptem. 29

(11)

Based on the B′-factors, a scoring function was developed which assigns each residue to a category (A–G) according to its absolute B′-factor value (F>2.8>D>1.4>B>0.6>A>−0.6>C>−1.4>E>−2.8>G). Scores were calculated based on the similarity of the B′-factor categories (e. g. Gaps were penalized relatively high (f=3) to ensure correct alignment in domains with varying mobility.

(v) Visualization of the results: The graphical presentation of the calculated B’-factors was realized in the HTML and JavaScript environment for display in a web browser. The free-for-academic charting API canvasJS (https://canvasjs.com/) was used for data presentation and interactive B-factor profile analysis. The NGL WebGL-based molecular viewer was implemented for the interactive display of protein structures. 26 Furthermore, the data can also be exported in pdb- or csv-format for external processing. A screen dump of the toolkit's user interface and usage instructions are shown in Figure 1. For interaction hotspot analysis of B’-factor profiles across multiple structures these can be visualized in a heatmap format with the open-source charting API ApexCharts (https://apexcharts.com/).

User interface of the BANΔIT with numbered instruction steps for pairwise analysis of B’-factor profiles. (1) Choose 1 or 2 protein structures by either upload or fetch-by-id. (2) Select the set of atoms to be considered for normalization. (3) Check the options-toolbar for advanced algorithm settings. (4) For two structures may align them by one of the alignment methods. (5) Select the normalized data that should be displayed. (6) Analyze the B‘-factor profile plot. Interesting regions can be zoomed by dragging. (7) Analyze the 3D-models colored by their B’-factors in the NGLviewer. 26 (8) Save the B‘-factor profile plot. (9) Save the normalized PDB-records. (10) Switch to the list-viewer interface for multiple structure alignment and heatmap visualization

To demonstrate the scope of BANΔIT, we have briefly analyzed a selection of literature examples that have investigated the dynamic processes of protein-ligand binding by conventional techniques like nuclear magnet resonance spectroscopy (NMR) and molecular dynamic (MD) simulations. With our toolkit, we aimed to reproduce the statements regarding dynamics and flexibility by a retrospective analysis of corresponding crystallographic B-factors which have not yet received any attention. To demonstrate the applicability for relevant prospective studies, we have also developed a B′-factor-supported pharmacophore model for SARS CoV-2 main protease inhibitors based on a recently solved crystallographic fragment screening dataset.

Example 1 Tyrosine phosphatase 1E PDZ domain: Dhulesia وآخرون. described the changes in dynamic processes that occur in the second PDZ domain of the human tyrosine phosphatase 1E (PTP1E) upon binding of the small peptide RA-GEF2 by protein NMR and MD simulations. 31 The selective inhibition of PDZ-mediated protein-protein interactions was considered to be an approach for drug development in cancers that are based on abnormal activities in the underlying pathways. 32 The rational design of inhibitors of protein-protein interactions is still considered difficult because of the inherent protein flexibility. 33, 34 We see a special potential in our toolkit supporting rational drug design in this context.

The B’-factor analysis of the PTP1E crystal structures in the absence or presence of the RA-GEF2 ligand perfectly reflects the same results of the NMR-order parameter restrained MD calculations. 35 The β2/β3-loop (T28–G34) and a distal surface region (L66–E76) are significantly rigidified once the RA-GEF2 ligand binds (Figure 2A).

Presentation of the B′-factor analysis from representative drug design examples. (أ) Plot of ΔB′ for PTP1E apo-structure (PDB: 3LNX) ضد. PTP1E in complex with the RA-GEF ligand (PDB: 3LNY). ΔB′-values outside the salmon-colored horizontal box are statistically significant (p<0.05). (ب) Superposed crystal structures for PTP1E with and without the RA-GEF ligand colored by the B’-factors. (ج) Representation of the most rigidified residues in the RA-GEF2 PTP1E complex. Turquoise: PTP1E apo-structure أصفر: PTP1E holo-structure Oنطاق: RA-GEF2 peptide ligand. (د) Plot of ΔB′ for the Src kinase in complex with the conformationally constrained ligand (PDB: 1IS0) ضد. Src in complex with the natural ligand (PDB: 1SPS). (ه) Superposed crystal structures for the respective Src complexes with both ligands colored by the B’-factors. (F) The natural phosphopeptide ligand reveals a favourable cation-π interaction with K60. (جي) The cyclopropyl constraint (arrow) leads to a suboptimal cation-π interaction, which induces increased mobility in the neighboring residues (K60–L64). (ح) B’-factor analysis of SARS CoV-2 main protease in complex with multiple fragments. Clustering of 22 non-covalent complexes ضد. the non-liganded apo-structure (PDB: 5R8T). (أنا) Development of a B’-factor-based pharmacophore hypothesis. (ي) Superposition of selected crystal structures from a crystallographic fragment screening to the SARS CoV-2 main protease. In the center, aromatic structural elements are predominant. Sulfonamides interact with T190, A191 and P168 (PDB: 5R80, 5R81, 5RF1 Carbons colored in orange). DMSO molecules were also found in this S-4 pocket (PDB: 5REH, 5R82, 5RE9 Carbons colored in magenta). Various polar fragments interact with T45, S46 (PDB: 5REB, 5R7Y, 5R82, 5RGH Carbons colored in cyan). Pyridine containing ligands show interactions with H163 and E166 (PDB: 5RE4, 5R83, 5R84 Carbons colored in green).

In the ribbon model with a coloring relative to the Cα B’-factor of a residue (B-factor putty) the key mediators of rigidification (S29, R31, K72 and Q93) can be visualized (Figure 2B). This information might be useful to determine which residues should be kept flexible in an induced-fit docking protocol. 36 In cases where residues are characterized by high B’-factors, several conformations will probably exist in solution. A mechanistic model for ligand binding was developed from the rigidified residues: K72, which protrudes into the binding pocket in the apo-structure, is displaced by the ligand and rigidified via backbone interactions. S29 interacts with the ligand via the side-chain hydroxyl group and thus stabilizes the entire β2/β3-loop, resulting in a reorientation of R31 ultimately interacting with the distal Q93 (Figure 2C).

Example 2 Src kinase SH2 domain: In extensive NMR and MD studies of Src kinase ligand complexes, it was found that a comparison of natural and conformationally constrained ligands leads to NMR chemical shift deviations across the binding site. MD simulations supported these findings and the investigators concluded that the observed enthalpic penalty is a result of increased flexibility in the binding site. 37 By B′-factor analysis we could confirm these results and showed that there is a significant dynamic increase in the βD′-sheet (K60–L64, Figure 2D&E). Inspection of the ligand poses revealed this is a consequence of the poor cation-π interaction of K60 with the constrained ligand (Figure 2F&G). By this example, we showed B′-factor analysis can be helpful to understand thermodynamic ligand binding issues. Based on the results, it might be advisable to place the conformational constrain at a different position in the ligand.

Example 3 SARS CoV-2 main protease: At the Diamond Light Source of the UK national synchrotron facility a high throughput crystallographic fragment screening was performed (yet unpublished 38 ), which solved 44 covalent and 22 non-covalent fragment complexes of the SARS CoV-2 main protease (Mpro). Since a drug to treat COVID-19 is desperately needed in 2020, 39 our toolkit was used to develop a B′-factor-supported pharmacophore model of the 22 non-covalent fragment complexes in the active site binding pocket.

While it can be easily seen from the crystal structures that in the center of the active site pocket (S2- and S3-site) an overlap of aromatic core structures dominates, superposition of all fragment poses leads to a diverse pattern of interactions with distal residues of the substrate-binding site. 38 Common practice would be to examine the set of fragments for a superposition of structural features, 40 but this does not allow quantification of the interaction quality. Therefore, we have chosen a different approach and calculated ΔB′-factor profiles of all non-covalent fragment complexes versus the apo-structure. Hotspots of mobility changes due to specific ligand features were clustered and presented in a heat map (Figure 2H).

In total, three hotspots for ligand-induced protein rigidification were identified. We found that sulfonamides strongly stabilize the backbone atoms of T190, A191 and the side chain atoms of P168 in the S4-pocket. For some crystal structures where this pocket is not occupied by a ligand, analogously a DMSO molecule is located in this pocket, which has also a rigidifying effect. In general, the binding of sulfoxides and sulfonamides to this pocket seems to be preferred. Secondly, T45 and S46 at the edge of the S1’-pocket are also strongly rigidified by ligands that encompass various polar-decorated structural elements. However, a clear structural trend was not identified. Primarily aliphatic scaffolds with polar decoration such as 4-hydroxypiperidines, N-ethylmethanesulfonamides, 2-ethylamino pyridines or 2-methylthiadiazoles should be considered. A single complex (PDB: 5REH) showed significantly increased mobility of S46. However, since this ligand has no contact with S46 and a large part of the ligand is solvent-exposed, we believe that this is an artifact without relevance for ligand binding.

In contrast, the S1-pocket (H163, E166) was often occupied by heteroaromatic structural features such as pyridines. However, no significant change in the ΔB′ of the surrounding residues was observed. This can be explained by the fact that a water network is perturbated when ligands bind into this pocket. 41 A prospective analysis of this putative entropically dominated binding by water displacement is outside the scope of B′-factor analysis. From the combined results a B′-factor-supported pharmacophore model was developed, which might be complementary to upcoming conventional fragment clustering, linking and merging efforts (Figure 2I&J). 42

In conclusion, we demonstrated the BANΔIT can be used for rational drug design applications. It provides an additional tool based on a measure that is already existing in crystal structures. Especially in the combination with NMR- and MD-experiments, pioneering results in drug design can be expected in the future.

Conflict of Interest

Acknowledgements

This work has been supported by the Johannes Gutenberg-Universität Mainz. Open access funding enabled and organized by Projekt DEAL.


Finding carbohydrates in the archive

The RCSB PDB website offers different ways to access, analyze, and visualize carbohydrate data. The main search bar at RCSB.org may be used in many cases by entering the name of a component sugar, oligosaccharide, or polysaccharide. For example, try searches on "sucrose", "FRU", "heparin", "cellulose," etc. This will often return a list of entries that include the carbohydrate and also entries related to the carbohydrate. Use the "Unique Ligands" and "Unique branched monosaccharides" fields in the search result list to help you find the most relevant molecules.

You can also use the "Advanced Search" to refine your search.

  • For monosaccharides, use the "Chemical Components" category just as you would for any other ligand.
  • For oligosaccharides, use the "Oligosaccharide/Branched Molecular Features" category, which includes options for types, components, and common oligosaccharide descriptors.
  • For glycosylation, use the “Polymer Molecular Features” category which allows you to search for specific glycosylation types.

A few sample advanced searches:
Show me all entries with glycosylation
Use the advanced search category: "Polymer Molecular Features->Glycosylation site"
Select “exists”

Show me all entries with fructose in an oligosaccharide
Use the advanced search category: "Oligosaccharide/Branched Molecular Features->Oligosaccharide Component List"
Enter "FRU"

What is the largest oligosaccharide in the archive?
Use the advanced search category: "Oligosaccharide/Branched Molecular Features->Oligosaccharide Component Count"
This reports "Enter an integer between 2 and 36"
Enter a value of 36, which will return 3irl, the heparin structure shown in Figure 2


How can I extract ligand with neighboring protein atoms from PDB with complex? - مادة الاحياء

Experimental Data Snapshot

  • Method: X-RAY DIFFRACTION
  • Resolution: 1.62 Å
  • R-Value Free: 0.204 
  • R-Value Work: 0.188 
  • R-Value Observed: 0.189 

wwPDB Validationونبسب ونبسب3D Report Full Report

Encounter and extrusion of an intrahelical lesion by a DNA repair enzyme.

(2009) Nature 462: 762-766

  • PubMed: 20010681  Search on PubMedSearch on PubMed Central
  • DOI: 10.1038/nature08561
  • Primary Citation of Related Structures:  
    3GO8, 3GP1, 3GQ5, 3GPU, 3GPX, 3GPY, 3GPP, 3GQ3, 3GQ4
  • PubMed Abstract: 

How living systems detect the presence of genotoxic damage embedded in a million-fold excess of undamaged DNA is an unresolved question in biology. Here we have captured and structurally elucidated a base-excision DNA repair enzyme, MutM, at the stage of initial encounter with a damaged nucleobase, 8-oxoguanine (oxoG), nested within a DNA duplex .

How living systems detect the presence of genotoxic damage embedded in a million-fold excess of undamaged DNA is an unresolved question in biology. Here we have captured and structurally elucidated a base-excision DNA repair enzyme, MutM, at the stage of initial encounter with a damaged nucleobase, 8-oxoguanine (oxoG), nested within a DNA duplex. Three structures of intrahelical oxoG-encounter complexes are compared with sequence-matched structures containing a normal G base in place of an oxoG lesion. Although the protein-DNA interfaces in the matched complexes differ by only two atoms-those that distinguish oxoG from G-their pronounced structural differences indicate that MutM can detect a lesion in DNA even at the earliest stages of encounter. All-atom computer simulations show the pathway by which encounter of the enzyme with the lesion causes extrusion from the DNA duplex, and they elucidate the critical free energy difference between oxoG and G along the extrusion pathway.

Organizational Affiliation

Graduate Program in Biophysics, Harvard Medical School, Boston, Massachusetts 02115, USA.


Solvation

The next step is solvation of the newly created simulation box - as we are simulating under biological conditions, we use water as the solvent. Note that the system is charged (depending on the pH) - the solvation tool also adds sodium or chloride ions (replacing existing water molecules) as required to neutralize this.

Hands_on Hands-on: Solvation

  1. GROMACS solvation and adding ions tool with the following parameters:
    • param-file “GRO structure file”: output of GROMACS structure configuration أداة
    • param-file “Topology (TOP) file”: TOP output of Merge GROMACS topologies
    • “Water model for solvation”: SPC (generic three-point model)
    • “Add ions to neutralize system”: Yes, add ions
    • “Specify salt concentration (sodium chloride) to add, in mol/liter”: 0
    • “Generate detailed log”: نعم
  2. Rename the outputs to Solvated GRO and Solvated TOP .

1 إجابة 1

As I see in an example in the PDBIO package documentation in Biopython documentation:

Seems like PDBIO module needs an object of class Structure to work, which is in principle what I understand Superimposer works with. When you say it does not accept a list do you mean you have a list of structures? In that case you could simply do it by iterating throught the structures as in:

If what you have is a list of atoms, I guess you could create a Structure object with that and then pass it to PDBIO .

However, it is difficult to tell more without knowing more about your problem. You could put on your question the code lines where you get the problem.

يحرر: Now I have better understood what you want to do. So I have seen in an interesting Biopython Structural Bioinformatics FAQ some information about the Structure class, which is a little complex apparently. At first sight, I do not see a very easy way to create Structure objects from scratch, but what you could do is modify the structure you get from PDBIO substituting the atoms list with the result you get from Superimposer and then write the .pdb file using the same modified structure. So you could try to put your mutantAtoms list into the mutantStructure object you already have.


الملخص

Protein tyrosine phosphatase PTPN13, also known as PTP-BL in mice, represents a large multi-domain non-transmembrane scaffolding protein that contains five consecutive PDZ domains. Here, we report the solution structures of the extended murine PTPN13 PDZ3 domain in its apo form and in complex with its physiological ligand, the carboxy-terminus of protein kinase C-related kinase-2 (PRK2), determined by multidimensional NMR spectroscopy. Both in its ligand-free state and when complexed to PRK2, PDZ3 of PTPN13 adopts the classical compact, globular D/E fold. PDZ3 of PTPN13 binds five carboxy-terminal amino acids of PRK2 عبر a groove located between the EB-strand and the DB-helix. The PRK2 peptide resides in the canonical PDZ3 binding cleft in an elongated manner and the amino acid side chains in position P0 and P-2, cysteine and aspartate, of the ligand face the groove between EB-strand and DB-helix, whereas the PRK2 side chains of tryptophan and alanine located in position P-1 and P-3 point away from the binding cleft. These structures are rare examples of selective class III ligand recognition by a PDZ domain and now provide a basis for the detailed structural investigation of the promiscuous interaction between the PDZ domains of PTPN13 and their ligands. They will also lead to a better understanding of the proposed scaffolding function of these domains in multi-protein complexes assembled by PTPN13 and could ultimately contribute to low molecular weight antagonists that might even act on the PRK2 signaling pathway to modulate rearrangements of the actin cytoskeleton.


شاهد الفيديو: ما هو البروتين (ديسمبر 2022).