معلومة

البحث عن مجموعة بيانات من الببتيد النمطي وغير البروتيني

البحث عن مجموعة بيانات من الببتيد النمطي وغير البروتيني


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أقوم بإجراء تجارب للتنبؤ بالببتيد باستخدام التعلم الآلي. أحتاج بعض البيانات للاختبار. خلفيتي هي علوم الكمبيوتر.

أي نصيحة حول كيفية العثور على الببتيدات النمطية وغير البروتينية. لقد حصلت بالفعل على مجموعة بيانات واحدة "Y.pestis". ومع ذلك ، فأنا أبحث عن مجموعة بيانات أخرى (للتحقق). على سبيل المثال ، S.typhimurium أو S.oneidensis ، ولكن أي ببتيدات أخرى ستكون على ما يرام.

جربت أرشيف PRIDE ، لكنني لم أتمكن من معرفة كيفية الحصول على مجموعتي بيانات ؛ واحد للنمط البروتيني والآخر للنمط غير البروتيني

هو موضع تقدير أي نصيحة!

شكرا!


تغطية تسلسل البروتين 100٪: شكل حديث من السريالية في البروتينات

لا تهدف هذه المراجعة فقط إلى مناقشة الاحتمالات الحالية للحصول على تغطية تسلسلية بنسبة 100٪ للبروتينات ، ولكن أيضًا لتوضيح الحدود الحرجة لمثل هذه المحاولة. يبدو أن الهدف من تغطية التسلسل بنسبة 100 ٪ ، كما يوحي عنوان المراجعة بالفعل ، يبدو سرياليًا إلى حد ما إذا تم أخذ التعقيد والنطاق الديناميكي للبروتيوم في الاعتبار. ومع ذلك ، فإن مقاربات البندقية من أسفل إلى أعلى قادرة على تحديد بروتين كامل تقريبًا على أنه نموذجي تظهره الخميرة. ومع ذلك ، فإن هذا الإجراء يتجاهل بشكل أو بآخر حقيقة أن البروتين موجود كأنواع بروتينية مختلفة. يتطلب التحديد الواضح لأنواع البروتين تغطية تسلسلية بنسبة 100٪. علاوة على ذلك ، يجب إجراء فصل البروتين على أنواع البروتين وليس على مستوى الببتيد. لذلك ، فإن التنازلي هو استراتيجية جيدة لتحليل أنواع البروتين. يعتبر الفصل الكهربائي الكلاسيكي ثنائي الأبعاد متبوعًا بانقسام إنزيمي أو كيميائي ، وهو مزيج من أعلى إلى أسفل ومن أسفل إلى أعلى ، طريقة أخرى مثيرة للاهتمام. علاوة على ذلك ، تلخص المراجعة مزيدًا من التوليفات من أعلى إلى أسفل ومن أسفل إلى أعلى وإلى أي مدى يحسن الوسط إلى أسفل تحديد أنواع البروتين. ينصب الاهتمام أيضًا على استراتيجيات الانقسام بخلاف التربسين ، حيث لا يمكن الحصول على تغطية تسلسلية بنسبة 100 ٪ في التجارب من أسفل إلى أعلى إلا بمزيج من كواشف الانقسام.

هذه معاينة لمحتوى الاشتراك ، والوصول عبر مؤسستك.


1 المقدمة

في عصر بيولوجيا الأنظمة وتكامل البيانات ، تمثل البيانات البروتينية مكونًا حاسمًا لفهم "الصورة الكاملة" للحياة. لقد نضجت تقنيات البروتيوميات - لا سيما مناهج تحديد وتقدير البروتين المستندة إلى MS - بشكل كبير من خلال التطورات التراكمية في المنهجيات التحليلية عالية الإنتاجية 1-5 ، وإعداد العينات 6 ، وتحسين الأجهزة 7 ، وتوافر قواعد بيانات تسلسل البروتين 8 وأدوات التحليل الحسابي 1 ، 9. لذلك ، مع تطوير أساليب وأدوات تحليلية أكثر قوة وحساسية ، يمكن الآن تحديد وتقدير نسبة عالية من البروتينات المعبر عنها في حالة معينة في تجربة متوسطة 10 ، 11. في موازاة ذلك ، ونتيجة لذلك ، زاد حجم البيانات المنتجة في مختبرات البروتينات بعدة أوامر بحجم 12.

مقارنة بالمجالات الأخرى كثيفة البيانات مثل الجينوميات ، وترسيب البروتينات الأصلية وتخزينها ، كانت البيانات الموجودة في الموارد العامة أقل شيوعًا 13. هذا أمر مؤسف لأن الدراسات البروتينية عادة ما تكون أكثر تعقيدًا من نظائرها من الجينوميات. في الواقع ، يمكن أن يكون تفسير البيانات في علم البروتينات أكثر تعقيدًا بكثير مما هو عليه في علم الجينوم بسبب التنوع الكبير في الأساليب التحليلية 14 ، 15 ، وأدوات المعلوماتية الحيوية وخطوط الأنابيب 16 ، 17 ، والتحليل الإحصائي ذي الصلة 18 ، 19. ومع ذلك ، بفضل المبادئ التوجيهية التي روجت لها العديد من المجلات العلمية ووكالات التمويل 20 ، هناك إجماع متزايد في المجتمع حول الحاجة إلى النشر العام لبيانات البروتينات ، مما يسهل بالفعل التقييم وإعادة الاستخدام والتحليلات المقارنة واستخراج النتائج الجديدة من البيانات المنشورة 13 ، 21.

يتم زيادة تعقيد بيانات البروتينات عن طريق الربط البديل ، PTM ، وأحداث تدهور البروتين ، ويتم تضخيمه بشكل أكبر من خلال الترابط بين البروتينات في المجمعات وشبكات الإشارات التي تكون شديدة التباين في الزمان والمكان 1. من أجل معالجة هذا التعقيد ، يتم تطوير منهجيات تحليلية ومعلوماتية حيوية جديدة كل عام 22 ، 23 ، مما يعقد توحيد البيانات وترسبها. بالإضافة إلى ذلك ، فإن الجمهور المهتم ببيانات البروتينات غير متجانس للغاية. ويشمل ، علماء الأحياء الذين يوضحون آليات تنظيم بروتينات معينة ، أو باحثو التصلب المتعدد الذين يقومون بتحسين الأساليب التحليلية الحالية ، أو علماء الأحياء الحاسوبية الذين يطورون أدوات برمجية جديدة لتحليل وتفسير البيانات 24.

تتطلب مشاركة البيانات في البروتينات استثمارات كبيرة وبنية تحتية. تم تطوير العديد من المستودعات العامة ، ولكل منها أغراض مختلفة. قواعد البيانات الراسخة لبيانات البروتينات هي قاعدة بيانات آلة البروتين العالمية (GPMDB) 25 و PeptideAtlas 26 وقاعدة بيانات PRIDE 27. بالإضافة إلى ذلك ، توجد حاليًا موارد أخرى (تم تطوير العديد منها مؤخرًا) مثل ProteomicsDB 28 ، MassIVE (بيئة افتراضية تفاعلية لقياس الطيف الكتلي) ، Chorus ، MaxQB 29 ، PASSEL (PeptideAtlas SRM Experiment Library) 30 ، MOPED (نموذج كائن حي ، قاعدة بيانات التعبير عن البروتين ) 31 ، PaxDb 32 ، Human Proteinpedia 33 ، وخريطة البروتينات البشرية (HPM) 34. علاوة على ذلك ، هناك العديد من الموارد المتخصصة التي سيتم الاستشهاد بها بإيجاز فقط في هذا الاستعراض. من المهم أن نذكر هنا أنه لا يوجد مصدر بيانات بروتيني واحد سيكون مناسبًا بشكل مثالي لجميع حالات الاستخدام الممكنة وجميع المستخدمين المحتملين. للأسف ، تم إيقاف اثنين من الموارد المستخدمة على نطاق واسع بسبب نقص التمويل: Peptidome 35 و Tranche 36. كان لهذا تأثير سلبي على الجهود المبذولة لتعزيز مشاركة البيانات في الميدان ، حيث أدرك المجتمع أن الجهود المستثمرة في مشاركة البيانات قد ضاعت.

في الآونة الأخيرة ، تم تشكيل اتحاد ProteomeXchange (PX) 37 لتمكين تكامل أفضل للمستودعات العامة ، وتعظيم فوائدها للمجتمع العلمي من خلال تنفيذ خطوط تقديم موحدة ونشر لمعلومات البروتينات. بحلول أغسطس 2014 ، أصبحت PRIDE و PeptideAtlas و PASSEL و MassIVE الأعضاء النشطين في الكونسورتيوم.

الهدف من هذه المراجعة هو تقديم نظرة عامة محدثة عن الحالة الحالية لمستودعات وقواعد بيانات البروتينات ، مما يوفر نقطة انطلاق قوية لأولئك الذين يرغبون في تقديم البيانات و / أو التنقيب عن البيانات. هناك عدد قليل من المراجعات المقارنة المتاحة في الأدبيات 24 ، 38-41 ، ولكن هناك حاجة إلى تحديث لأن هذا كان مجالًا ديناميكيًا إلى حد كبير خلال السنوات القليلة الماضية. في هذه المخطوطة ، لن نقوم بتضمين مراجعة شاملة لقواعد معرفة البروتين ، مثل مصدر البروتين العالمي (UniProt) 42 و neXtProt 43 ، لكننا سنشرح كيفية إتاحة معلومات بروتينات MS في هذه الموارد.


القياس النسبي القائم على قياس الطيف الكتلي القائم على الببتيد

يمكن تقسيم تقنيات القياس الكمي النسبي القائمة على قياس الطيف الكتلي إلى فئتين عامتين: تلك التي تعمل بدون ملصق ، حيث يمثل العد الطيفي أو تحديد شدة الأيونات للببتيدات البديلة المشتقة من البروتين مقياسًا لوفرة البروتين الأصلي [14] ، و تلك التي تستخدم الأساليب القائمة على النظائر للتحليل المقارن للبروتينات الموسومة بالنظائر التفاضلية كيميائيًا أو استقلابيًا [15]. تدمج الطرق القائمة على النظائر نسخًا ثقيلة من جزيئات معينة في الببتيدات ، إما عن طريق الاشتقاق الكيميائي أو عن طريق وضع العلامات الأيضية. اعتمادًا على تقنية الاشتقاق الكيميائي المستخدمة ، يتم تحديد كمية الببتيدات ذات العلامات التفاضلية في وضع MS أو MS / MS [9 ، 16 ، 17 ، 18 ، 19 ، 20 ، 21 ، 22 ، 23 ، 24]. وبالتالي ، فإن علامة التقارب المشفرة بالنظائر غير متساوية الضغط (ICAT) - الببتيدات ذات العلامات المعدنية ، الببتيدات ذات العلامات المعدنية (MeCAT) ، الببتيدات ذات العلامات الخاصة بالبقايا مثل 13 C / 15 N وسم ثنائي ميثيل لـ N-termini و ε-amino يمكن قياس مجموعات من اللايسين و O 16 / O 18 الببتيدات المسمى بشكل كافٍ بواسطة MS.

من ناحية أخرى ، تتطلب الببتيدات المشتقة بعلامة متساوية الضغط للتقدير الكمي النسبي والمطلق (iTRAQ) أو مع "علامات الكتلة الترادفية" (TMTs) المتناظرة قياسًا ترادفيًا على مستوى MS. تُستخدم هذه الأساليب التي تركز على الببتيد بشكل أساسي لتحديد الاختلافات النسبية في شدة الذروة لنفس المادة التحليلية بين عينات متعددة. كانت التطبيقات على السموم نادرة حتى الآن ، بما في ذلك القياس الكمي النسبي للسموم من النوع A والنوع B من نفس الأنواع من سي. سكوتولاتوس وسموم ثعبان غير مرتبطين جغرافيا من أمريكا الشمالية والجنوبية ، ج. مرحبا و B. colombiensis، على التوالي [25]. في الآونة الأخيرة ، التحليلات المقارنة للسم أثناء انتقال حديثي الولادة إلى الكبار بوثروبس جاراكا [26] و غلويديوس بريفيكاودوس [27].

طريقة التمثيل الغذائي - وضع العلامات على النظائر المستقرة للأحماض الأمينية في الثقافة (SILAC) يوفر استراتيجية تجريبية قوية في ظروف معينة (الدراسات البروتينية في خطوط الخلايا المستزرعة في الجسم الحي البروتيني الكمي باستخدام الفئران SILAC) [28]. ومع ذلك ، قد لا يمثل خيارًا ممكنًا عند العمل مع عينات البروتين ، مثل السموم المعزولة من الكائنات الحية غير القابلة للتوسيم الأيضي.


المواد والأساليب

تصميم الدراسة

في هذه التجربة المعشاة ذات الشواهد ، تعرض 100 مشارك سليم لأسطوانة افتراضية في يومين منفصلين. في اليوم الثاني ، تم تعيين المشاركين عشوائيًا إما للعلاج الوهمي (أي التحفيز الوهمي لنقطة الوخز بالإبر الوهمية ن = 60) ، أو العلاج النشط (أي ، التحفيز الكهربائي للأعصاب عبر الجلد (TENS) لنقطة الوخز بالإبر "PC6" ن = 10 ) ، أو بدون علاج (ن = 30). تم تضمين مجموعة العلاج النشط (البيانات التي لم يتم تحليلها) للسماح بالإعطاء الأعمى لتدخل العلاج الوهمي ، وهو نهج شائع في دراسات العلاج الوهمي [12]. عملت مجموعة عدم المعالجة على التحكم في تأثير الدواء الوهمي للتغيرات التي تحدث بشكل طبيعي من اليوم الأول إلى اليوم الثاني. تم إجراء التوزيع العشوائي بمساعدة الكمبيوتر بواسطة شخص غير مشارك في التجارب ، والذي أعد مظاريف عشوائية مرقمة ومختومة ومعتمة بالتسلسل. تم إجراء تدخلات الدراسة في تصميم واحد أعمى ، بينما كان المشاركون في مجموعة التحكم في عدم المعالجة بالضرورة غير معماة. جميع المشاركين شريطة موافقة خطية مستنيرة. تمت الموافقة على بروتوكول الدراسة من قبل اللجنة الأخلاقية لكلية الطب في Ludwig-Maximilians-University Munich (رقم 402-13) وتم تسجيله بأثر رجعي في سجل التجارب السريرية الألماني (رقم DRKS00015192).

تصميم الدراسة (أ) والإجراءات التجريبية (ب).

مشاركون

تتألف معايير التضمين من العمر بين 18 و 50 عامًا ، ووزن الجسم الطبيعي ، والرؤية والسمع الطبيعية أو المصححة إلى الطبيعية. كانت معايير الاستبعاد هي الغرسات المعدنية أو الجهاز المزروع ، ووجود مرض حاد أو مزمن ، وتناول الأدوية بانتظام (باستثناء موانع الحمل الهرمونية ، وأدوية الغدة الدرقية ، وأدوية الحساسية). علاوة على ذلك ، تم استبعاد المتطوعين عندما قدموا درجات للقلق والاكتئاب أعلى من الدرجة الفاصلة ذات الصلة سريريًا وفقًا لـ "مقياس القلق والاكتئاب بالمستشفى" [HADS 13] ، عندما سجلوا أقل من 80 في "استبيان حساسية دوار الحركة" [MSSQ 14] ، أو عندما أصيبوا بغثيان أقل من معتدل (& lt5 على مقياس تقييم رقمي مكون من 11 نقطة (NRS) ، مع "0" يشير إلى "لا غثيان" و "10" يشير إلى "غثيان أقصى يمكن تحمله") خلال 20 - التعرض لمدة دقيقة لمحفز الفطر المقزز في يوم الاختبار المسبق. كانت مجموعات العلاج الوهمي ولا توجد مجموعات علاج قابلة للمقارنة في الأساس فيما يتعلق بالخصائص الاجتماعية والديموغرافية والسريرية (الجدول 1).

طريقة تجريبية

تم تلخيص الإجراء التجريبي في الشكل 1 ب. تم اختبار كل مشارك في يومين منفصلين على الأقل 24 ساعة في نفس اليوم بين 14.00 و 19.00 ساعة بعد فترة صيام لا تقل عن 3 ساعات. بدأت الجلسة في اليوم الأول بفترة راحة مدتها 20 دقيقة ثم تم تشغيل منبه vection لمدة 20 دقيقة. في اليوم الثاني بعد فترة راحة مدتها 10 دقائق ، تم تخصيص المشاركين بشكل عشوائي للعلاج أو عدم العلاج. بالنسبة للمشاركين في مجموعات العلاج ، تم إجراء إجراء معياري لمعالجة التوقع وتم تشغيل العلاج المخصص لمدة 20 دقيقة. بقي المشاركون في مجموعات لا علاج دون علاج. انتهت الجلسات في كلا يومي الاختبار بفترة نقاهة مدتها 20 دقيقة. في كلا اليومين ، تم تسجيل مخطط كهربية القلب ، مخطط كهربية القلب ، وتيرة التنفس ، ومخطط كهربية الدماغ (بما في ذلك مخطط كهربية القلب) ، وصنف الأشخاص شدة الغثيان الملحوظ وأعراض داء الحركة الأخرى (مرض التصلب العصبي المتعدد). تم جمع عينات البلازما لتقييم البروتينات وعينات اللعاب لقياس الكورتيزول (لم يتم الإبلاغ عن النتائج هنا) أثناء خط الأساس وفي نهاية محفز vection.

التدخلات

تم تنفيذ العلاج الوهمي والتدخلات النشطة عن طريق جهاز التحفيز الكهربائي للأعصاب عبر الجلد (TENS) القابل للبرمجة (وحدة EMS / TENS الرقمية SEM 42 ، سانيتاس ، أوتينفايلر ، ألمانيا). للتدخل النشط ، تم وضع الأقطاب الكهربائية حول "PC6" ، وهي نقطة وخز بالإبر تم التحقق من صحتها لعلاج الغثيان [15 ، 16] ، وتم تشغيل برنامج التحفيز الكهربائي للعصب عبر الجلد لمدة 20 دقيقة. بالنسبة للعلاج الوهمي ، تم ربط الأقطاب الكهربائية القريبة والبعيدة بنقطة غير الوخز بالإبر في الجانب الزندي من الساعد والتي تم قبولها عمومًا لتمثيل نقطة وهمية في سياق أبحاث الوخز بالإبر [17]. تم تطبيق نوعين من التحفيز الوهمي: تلقى 30 مشاركًا (15 ذكرًا و 15 أنثى) تحفيزًا دقيقًا بكثافة منخفضة جدًا عن طريق تشغيل برنامج التدليك لجهاز TENS ، بينما لم يتلق 30 مشاركًا (15 ذكرًا و 15 أنثى) أي تحفيز كهربائي على الاطلاق. نظرًا لأن تدخلتي العلاج الوهمي قللت من الغثيان والتصلب المتعدد إلى حد مماثل [11] ، تم دمج المشاركين من كلا المجموعتين في التحليلات الحالية في مجموعة علاج وهمي واحد (ن = 60).

تحريض الغثيان

تم إحداث الغثيان من خلال العرض المرئي القياسي للخطوط السوداء والبيضاء بالتناوب مع حركة دائرية من اليسار إلى اليمين عند 60 درجة / ثانية. تستحث هذه الترجمة الأفقية من اليسار إلى اليمين إحساسًا دائريًا حيث يتعرض الأشخاص لإحساس زائف بالترجمة إلى اليسار [18 ، 19]. تم عرض المحفز المقزز على شاشة شبه أسطوانية وشبه شفافة موضوعة حول المتطوع على مسافة 30 سم من العين. يحاكي هذا التحفيز المدخلات المرئية التي توفرها أسطوانة الحركة البصرية الدوارة ، والتي تُستخدم عادةً للحث على الإصابة (الحركة الذاتية الوهمية) وبالتالي الغثيان [20 ، 21]. لأسباب أمنية ، تم إيقاف منبه vection إذا أشارت معدلات الغثيان إلى غثيان شديد (تصنيفات 9 أو 10 على 11 نقطة NRS).

القياسات السلوكية والنفسية الفسيولوجية

تم تصنيف شدة الغثيان المتصورة في الأساس وكل دقيقة خلال فترة الغثيان على 11 نقطة NRS ، مع "0" تشير إلى "عدم الغثيان" و "10" تشير إلى "أقصى قدر ممكن من الغثيان". تم تقييم أعراض مرض التصلب العصبي المتعدد باستخدام استبيان "الأعراض الذاتية لمرض الحركة" (SSMS) [مقتبس من 14] ، مع درجات من 0 إلى 3 مخصصة لإجابات لا شيء ، طفيفة ، معتدلة ، وشديدة لأعراض الدوخة والصداع ، الغثيان / الرغبة في التقيؤ والتعب والتعرق ووعي المعدة على التوالي.

تم تسجيل إشارة مخطط كهربية القلب والنشاط التنفسي (للتحكم في مخطط كهربية الجهاز التنفسي) وإشارة مخطط كهربية القلب (لم يتم الإبلاغ عن النتائج هنا) باستخدام جهاز BIOPAC MP 150 (BIOPAC Systems Inc. ، Goleta ، CA ، الولايات المتحدة الأمريكية) و AcqKnowledge 4.1 برنامج للحصول على البيانات. تم تسجيل إشارة مخطط كهربية القلب باستخدام قطبين من Ag / AgCl (Cleartrace ، Conmed ، Utica ، NY ، الولايات المتحدة الأمريكية) تم وضعهما في المواضع القياسية على الجلد فوق البطن [22]. تم تنظيف الجلد باستخدام هلام رملي لتحضير الجلد لتقليل مقاومة الجلد قبل وضع القطب الكهربائي (Nuprep، Weaver & amp Co.، Aurora، CO، USA). تم توصيل الأقطاب الكهربائية بوحدة مكبر الصوت BIOPAC EGG100C ، وتم ترقيم الإشارة بمعدل 15.625 عينة في الثانية وتصفيتها باستخدام مرشح تمرير النطاق تناظري يتكون من مرشح تمرير منخفض من الدرجة الأولى 1 هرتز و 5 ميجاهرتز من الدرجة الثالثة. مرشح -مرور. تم إجراء التحليل الطيفي في آخر 300 ثانية من فترتي خط الأساس والغثيان في كل يوم اختبار ، على التوالي. قبل تحويل فورييه السريع ، تم فصل كل حقبة بيانات خطيًا وكانت نهاياتها مستدقة إلى الصفر باستخدام نافذة هامنج. تم تحديد القدرة الطيفية ضمن النطاق الترددي المعياري (2.5 إلى 3 دورات في الدقيقة) وعرض النطاق الترددي للمعدة (3.75 إلى 9.75 دورة في الدقيقة) لثلاث فترات متداخلة (الدقائق 1 إلى 3 ، 2 إلى 4 ، 3 إلى 5) [23]. أخيرًا ، تم حساب متوسط ​​"النسبة العادية إلى سرعة الدوران" (NTT) على أنها متوسط ​​النسبة من القدرة الطيفية المعيارية المعوية إلى القدرة الطيفية في تسرع المعدة في الفترات الثلاثة التي تستغرق دقيقة واحدة. من المعروف أن NTT ينخفض ​​أثناء الغثيان الناجم بصريًا ، مما يشير إلى تعزيز النشاط الكهربائي للعضل التسرع في المعدة و / أو انخفاض النشاط الكهربائي العضلي المعياري المعدي [24-26]. تم تعديل بيانات NTT قبل التحليل الإحصائي للحصول على توزيعات طبيعية تقريبًا.

تم تسجيل تخطيط القلب الكهربائي كجزء من مخطط كهربية للدماغ مكون من 32 رصاصًا (لم يتم الإبلاغ عن النتائج هنا) للتحكم في حركات عين المشاركين أثناء تحفيز خط الأساس والتحفيز من أجل التأكد من اتباعهم للإرشادات الموحدة ، وهي النظر مباشرة إلى الأمام خلال خط الأساس وإلى بشكل طبيعي اتبع الترجمة الأفقية من اليسار إلى اليمين للخطوط السوداء والبيضاء دون تحريك الرأس أثناء التعرض لمحفز vection ، على التوالي. تم تقييم تخطيط القلب الكهربائي الأفقي والرأسي باستخدام نظام ActiveTwo (BioSemi ، أمستردام ، هولندا).

التحليل البروتيني

تم جمع عينات الدم لتقييم البروتينات في 2.7 مل من أنابيب EDTA (S-Monovette ، Sarstedt ، ألمانيا) من الأوردة المضادة للقدمين وتم تدويرها في جهاز طرد مركزي عند 4 درجات مئوية لمدة 10 دقائق عند 3000 جم. تم تخزين عينات البلازما à 100 ميكرولتر في 0.5 مل من أنابيب LoBind البروتين (إيبندورف ، ألمانيا) عند -70 درجة مئوية حتى التحليل البروتيني.

تم تحليل عينات البلازما باستخدام مجموعة أدوات PreOmics 'iST (PreOmics GmbH ، Martinsried ، ألمانيا) وفقًا لمواصفات الشركات المصنعة. باختصار ، تم تقليل البلازما غير المستنفدة وألكيلتها واحتضانها لمدة 3 ساعات عند 37 درجة مئوية باستخدام Lys-C و trypsin. تم تجفيف الببتيدات الناتجة للتخزين قصير المدى عند -80 درجة مئوية. قبل القياس ، تم تعليق الببتيدات في 2٪ أسيتونيتريل و 0.5٪ حمض ثلاثي فلورو أسيتيك. تمت إضافة مجموعة معايرة الذوبان عالي الدقة (HRM) (Biognosys ، Schlieren ، سويسرا) إلى جميع العينات وفقًا لتعليمات الشركة الصانعة.

تم الحصول على بيانات قياس الطيف الكتلي في وضع الاستحواذ المستقل عن البيانات (DIA) على مطياف الكتلة ذات المجال العالي النشط Q (Thermo Fisher Scientific ، Dreireich ، ألمانيا). لكل قياس تم تحميل 0.5 ميكروغرام من الببتيدات تلقائيًا إلى نظام الفصل السريع المقترن عبر الإنترنت ونظام كروماتوجرافيا السائل عالي الضغط (Ultimate 3000 ، Thermo Fisher Scientific ، Dreireich ، ألمانيا). تم استخدام عمود مصيدة نانو (قطر داخلي 300 ميكرومتر × 5 مم ، معبأ بحزم PepMap100 C18 ، 5 ميكرومتر ، 100 LC Packings ، Sunnyvale ، CA) قبل الفصل عن طريق كروماتوجرافيا الطور العكسي (Acquity UPLC M-Class HSS T3 Column 75μm القطر الداخلي × 250 مم ، 1.8 ميكرومتر ووترز ، إشبورن ، ألمانيا) عند 40 درجة مئوية. تمت إزالة الببتيدات من العمود عند 250 نيوتن / دقيقة باستخدام زيادة تركيز الأسيتونيتريل (في 0.1٪ حمض الفورميك) من 3٪ إلى 40٪ على تدرج مدته 45 دقيقة.

تتألف طريقة HRM DIA من مسح مسح من 300 إلى 1500 م / ض بدقة 120.000 وهدف التحكم التلقائي في الكسب يبلغ 3e6 أو 120 مللي ثانية كحد أقصى لوقت الحقن. تم إجراء التجزئة عن طريق التفكك التصادمي عالي الطاقة بقيمة مستهدفة تبلغ 3e6 أيونات محددة بالتحكم التلقائي التنبئي في الكسب. تم عزل الببتيدات السليفة باستخدام 17 نافذة متغيرة تمتد من 300 إلى 1500 م / ض بدقة 30.000 مع هدف التحكم التلقائي في الكسب 3e6 ووقت الحقن التلقائي. كانت طاقة الاصطدام الطبيعية 28 وتم تسجيل الأطياف في نوع الملف الشخصي.

تحليل احصائي

تم إجراء الإحصائيات باستخدام MATLAB R2018b. لجميع الاختبارات الإحصائية ، مستوى دلالة ص تم افتراض 0.05 (ثنائي الذيل). تم التحقق من افتراضات الوضع الطبيعي لجميع النتائج قبل التحليل الإحصائي.

تدابير الغثيان.

لكل متغير سلوكي وفسيولوجي (غثيان ، MS ، NTT) ، تم حساب الدرجات المعدلة باليوم (DAS) قبل التحليلات الإحصائية. تم حساب DAS على النحو التالي: DAS = (m22 م21) - (م12 م11) حيث م22 هو القياس 2 في اليوم 2 ، م21 هو القياس 1 في اليوم 2 و m12 وم11 هما القياس الثاني والأول في اليوم الأول ، على التوالي. تعرض DAS لكل غثيان ، MS ، و NTT لتحليلات منفصلة للتباين (ANOVAs) ، مع تضمين "المجموعة" (مجموعة الدواء الوهمي ، المجموعة الضابطة) و "الجنس" (ذكر ، أنثى) كعوامل بين المواضيع.

تحليل بيانات DIA.

يتطلب تحليل البيانات لملفات DIA مقارنة أطياف الكتلة بمكتبة طيفية مصممة خصيصًا لقياسات قياس الطيف الكتلي المعتمدة على البيانات السابقة. بحثنا في ملفات DIA الخاصة بنا مقابل مكتبة داخلية تم إنشاؤها من بيانات قياس الطيف الكتلي المختارة التي تضم 57 ملفًا من مستحضرات البلازما والمصل ، والمزودة بمجموعة معايرة HRM. تم تحليل الملفات المعتمدة على البيانات باستخدام Proteome Discoverer (الإصدار 2.1 ، ThermoFisher Scientific). تضمنت عُقد محرك البحث المضمنة Mascot (الإصدار 2.5.1 ، Matrix Science ، لندن ، المملكة المتحدة) ، Byonic (الإصدار 2.0 ، Proteinmetrics ، San Carlos ، CA) ، Sequest-HT ، و MSAmanda. تم حساب معدلات الاكتشاف الخاطئ للببتيد (FDR) لجميع محركات البحث باستخدام عقدة الراشح ، وتم تصفية التعريفات الناتجة لتلبية مستوى الببتيد 1 ٪ FDR (باستثناء Byonic) وتم دمجها في ملف نتيجة متعدد الإجماع يحافظ على 1 عتبة٪ FDR. تم إنشاء مكتبة طيفية الببتيد في Spectronaut (الإصدار 9 ، Biognosys) بالإعدادات الافتراضية باستخدام ملف النتائج المدمج لـ Proteome Discoverer. تم تجهيز Spectronaut بقاعدة بيانات Swissprot البشرية (الإصدار الرابع ، تسلسل 20165 ، www.uniprot.org) مع عدد قليل من البروتينات المسننة (على سبيل المثال ، متواليات الببتيد Biognosys HRM). احتوت المكتبة الطيفية النهائية التي تم إنشاؤها في Spectronaut على 1،811 مجموعة بروتينية و 10،445 ببتيدات نمطية و 26،805 سلائف ببتيد.

مجموعة بيانات الببتيد.

تم تحليل بيانات قياس الطيف الكتلي لـ DIA باستخدام برنامج Spectronaut 9 الذي يطبق الإعدادات الافتراضية مع الاستثناءات التالية: كان التحديد الكمي مقصورًا على الببتيدات النمطية ، وتم تعيين تصفية البيانات على Qvalue المتناثرة للتحليل القائم على الببتيد. يتضمن إعداد Qvalue المتناثر جميع الملاحظات التي تمرر Qvalue مرة واحدة على الأقل وينشئ مصفوفة بحد أدنى من القيم المفقودة. تم إنشاء مجموعة بيانات الببتيد المستخدمة لتحليل التباين المشترك (ANCOVA) عن طريق إزالة الببتيدات بقيم مفقودة & gt 10٪. ثم تم تطبيع البيانات عن طريق تعيين الوسيط إلى واحد ، وتم تحويل الشدة (logN) لمزيد من التحليلات.

مجموعة بيانات البروتين.

بالنسبة للتحليل القائم على البروتين ، تمت إضافة شدة الببتيدات النمطية إلى كثافة البروتين الخاصة بها. لضمان أفضل جودة للبيانات في مصفوفة بروتينية كاملة ، تم ملء البيانات على النحو التالي. تم ضبط تصفية البيانات على Qvalue. يراعي إعداد Qvalue الملاحظات الفردية التي تتجاوز عتبة Qvalue وتقوم بإنشاء مصفوفة تحتوي على قيم مفقودة. لتقليل عدد القيم المفقودة ، استخدمنا القيم التي تم إنشاؤها من إعداد Qvalue المتناثر ، والتي تمثل آثار كتلة حقيقية في أوقات الاحتفاظ المعنية. تم حذف البروتينات ذات القيم المفقودة & gt5٪. تم تطبيع البيانات أخيرًا بتعيين الوسيط إلى واحد ، وتم تحويل الشدة (logN) لمزيد من التحليلات. تم حساب تغييرات الطية لكلا اليومين كطوى log2 بين القياس 2 و 1.

تم إيداع بيانات بروتيوميات قياس الطيف الكتلي في اتحاد ProteomeXchange عبر مستودع شريك PRIDE [27] مع معرف مجموعة البيانات PXD020563.

شبكة تفاعل البروتين.

تم إنشاء شبكة تفاعل البروتين باستخدام StringDB الإصدار 1019 باستخدام الإعدادات الافتراضية (ثقة متوسطة). تشير الحواف إلى مصادر التفاعل ، التنقيب عن النصوص والتجارب وقواعد البيانات والتعبير المشترك والجوار والتواجد المشترك.

تحليلات التخصيب GO.

تم إجراء تحليلات التخصيب GO باستخدام ملفات التعليقات التوضيحية GO من http://www.geneontology.org/ ، الإصدارات / 2017-03-11. اقتصر التحليل على GO Biological Process فقط. تم تقدير مصطلحات GO المخصبة بشكل كبير باستخدام اختبار التوزيع الهندسي الفائق مع قاعدة بيانات Proteomics Spectronaut 9 الكاملة (1470 معرف بروتين فريد) كخلفية. تمت إزالة المصطلحات الزائدة عن الحاجة بالكامل من القائمة. لتشكيل مجموعات وظيفية تمثيلية ، تم دمج المصطلحات المتشابهة باستخدام مؤشر Jaccard J_ij = (g_i∩g_j) ⁄ (g_i∪g_j) ، حيث gi و gj هما المنتجات الجينية المخصصة لأزواج مخصبة كبيرة من مصطلحات GO i و j ، على التوالى. تم تجميع شروط GO مع مؤشر Jij & gt 0.4.

تشريح تباين البروتين بالعوامل التجريبية.

لتقدير تكوين التباين لتغيرات البروتين في اليوم الثاني اعتمادًا على DASs الثلاثة ، استخدمنا نموذج الانحدار الخطي: مع DASs كمتغيرات توقع ومجموعة (grp) والجنس كمتغيرات مشتركة فئوية. للتعامل مع البيانات المفقودة المتبقية ، استخدمنا التضمين المتعدد لإنشاء 5 مجموعات بيانات كاملة. تم احتساب القيم المفقودة عن طريق المطابقة التنبؤية باستخدام حزمة R 'الفئران' (rundata ، m = 5 ، maxit = 100،000 ، meth = 'pmm' ، البذور = 50 ، pred = predMat). استخدمنا وظيفة الوزن "bisquare" لاكتشاف وإزالة القيم المتطرفة من النموذج. تم تقدير نسبة التباين الكلي الموضح بواسطة نموذج الانحدار من خلال مقارنة مجموع انحدار المربعات بالمجموع الإجمالي للمربعات. تم حساب تكوين التباين بشكل منفصل لكل مجموعة بيانات محتسبة. تم تلخيص النتائج بأخذ المتوسطات لكل بروتين.

تغييرات البروتين المرتبط بالغفل.

لتقدير الفرق في وفرة البروتين التي يسببها الدواء الوهمي في اليوم الثاني بينهما المجموعات ، قمنا بتطبيق ANCOVA وتعديلها للاختلافات الفردية في تغييرات طيات البروتين أثناء التجربة الأساسية في اليوم الأول. لزيادة القوة الإحصائية ، تم إجراء ANCOVA على نسب السجل (القياس 2 مقابل القياس 1) للببتيدات بدلاً من بيانات البروتين. وبالتالي ، بالنسبة للبروتينات الفردية الكبيرة ، يمكننا زيادة حجم العينة حتى 1000 ضعف (S1 Dataset). لكل مصطلح GO المخصب للبروتينات المحددة بواسطة ANCOVA ، اخترنا جميع البروتينات ذات الصلة التي تم تنظيمها أيضًا بشكل كبير وإنشاء نموذجين للانحدار الخطي للتنبؤ بـ DAS الثلاثة (الغثيان ، NTT ، MS) لمجموعات التحكم والغفل. تم استخدام دالة الوزن "bisquare" لإزالة القيم المتطرفة من النموذج.

توقع المستجيبين للعلاج الوهمي.

استند التنبؤ بالمستجيبين للعلاج الوهمي على بيانات خط الأساس للبروتين في اليوم الثاني. تم تضمين المشاركين فقط الذين كانت لديهم مجموعة بيانات بروتينية كاملة بعد المعالجة المسبقة. تم إجراء ANOVA أحادي الاتجاه على مستوى البروتين للاختيار المسبق للبروتينات في خط الأساس لليوم الثاني والتي تم التعبير عنها بشكل تفاضلي بين المستجيبين للعلاج الوهمي وغير المستجيبين للعلاج الوهمي للغثيان والتصلب المتعدد ، على التوالي. تم تعريف المستجيبين للعلاج الوهمي على أنهم مشاركين في مجموعات الدواء الوهمي أظهروا انخفاضًا بنسبة 50٪ في الغثيان / التصلب المتعدد من اليوم الأول إلى اليوم الثاني. بعد ذلك ، أجرينا اختيار ميزة متسلسلة لتحديد البروتينات الإضافية ذات القدرة على التنبؤ بالمستجيبين الجيدين. استخدمنا أخيرًا آلة متجه دعم خطي لتوليد نموذجين تنبؤيين لكل من درجات الغثيان. تضمن النموذج الأول بروتينات ANOVA والتنبؤ من تحديد الميزات المتسلسلة ("ANOVA plus model"). كمرجع نموذج فارغ ، استخدمنا نموذجًا يعتمد على البروتينات المختارة عشوائيًا ("نموذج عشوائي"). تم إجراء منحنيات خصائص تشغيل المستقبل (ROC) ومتوسط ​​المساحة تحت تقدير المنحنى (AUC) باستخدام التحقق من صحة k-fold مع k = 10 ، مع 10 تباديل مستقل.


3 مناقشة

على حد علمنا ، تقدم دراستنا وبياناتنا الحالية أول كشف عن مرض التصلب العصبي المتعدد والتقدير الكمي للشكل البروتيني I179T PSA الناتج عن rs17632542 SNP في البول بعد DRE. يمكن جمع هذا السائل القريب من البروستات بسهولة ومعالجته باستخدام طرق عالية الإنتاجية لأحجام عينات سريرية صغيرة على دفعات كبيرة من خلال بروتوكول MStern المُحسَّن لدينا. يتطلب كل مقايسة فقط حجم الحد الأدنى من 250 ميكرولتر. لزيادة الإنتاجية ، يمكن دمج علامات مراسل متساوي الضغط ، على سبيل المثال ، علامة الكتلة الترادفية ، مما يسمح باقتناء MS واحد لتوفير معلومات التركيب الجيني الدقيقة والكمية لما يزيد عن 11 فردًا في وقت واحد. بالإضافة إلى ذلك ، يمكن تقصير أطوال التدرج بشكل كبير ، وتحسين الظروف الكروماتوغرافية للسرعة إذا لزم الأمر. في الواقع ، معلمات الاستحواذ قيد التحسين للسماح بوقت تشغيل أقصر بنسبة 75٪ لكل عينة دون أي تغييرات في الأجهزة (الشكل S4 ، معلومات الدعم).

كانت دقة تحديد ليس فقط وجود متغير I179T ، ولكن أيضًا ببتيد WT المقابل الذي يسمح بتحديد النمط الجيني 100٪. هذه نقطة مهمة حيث أظهرت الدراسات التي شملت أكثر من 1300 مريض أن مستويات المستضد البروستاتي النوعي في المصل تكون أقل للأفراد الذين يحملون نسختين من الأليل النادر مقارنة بالأفراد غير المتجانسين ، وأن المستويات أعلى بين الأفراد من النوع البري متماثل الزيجوت. [19] التوقع العام بأن الأفراد متماثلي اللواقح من الأليل النادر يؤدي إلى انخفاض مستويات PSA واضح من كل من PSA في الدم ، وقياس MS لببتيد PSA الضبط كما هو موضح في الشكل 3. ومع ذلك ، لم يكن الاختلاف المتماثل الزيجوت WT والفرق متغاير الزيجوت تمت ملاحظته بسهولة في بياناتنا ، لكننا نشك في أن هذا قد يظهر بأرقام عينات أكبر.

على الرغم من أننا لا نستطيع أن نكون متأكدين من عدد حالات PCa التي كان من الممكن علاجها بشكل مختلف لو كان وجود وتقدير rs17632542 SNP معروفًا ، إلا أن الفحص متعدد الإرسال القائم على البول والذي يتضمن نهجنا الحالي سيسمح بتحديد سريع ودقيق للتعبير عن النمط الجيني . في الواقع ، قد تساعد القدرة على تقييم التعبير البروتيني الخاص بالأليل في تصنيف المخاطر المرتبطة بتغاير الزيجوت في هذا الموقع. توجد نظريات مختلفة بما في ذلك تقليل نصف العمر بسبب عدم استقرار البروتين المتغير والنقص العام في الإفراز. قد يساعد أخذ عينات من بول ما بعد DRE في علاج هذه المشكلات حيث يساعد تدليك البروستاتا أثناء DRE في إطلاق PSA بين بروتينات البروستات الأخرى قبل جمع العينة مباشرةً. [30] يوضح الشكل 3 أن تركيزات PSA بشكل عام بين المرضى المصابين تكون أعلى في هذا السائل القريب منها في المصل. على الرغم من أننا نقر بأن التطبيع قد يحتاج إلى النظر فيه مثل البروتين uromodulin لمراعاة التباين في تركيزات العينة.


JPT Peptide Technologies GmbH

JPT Peptide Technologies GmbH was established in 2004 as a spin-off of Jerini AG, a Berlin based peptide drug discovery company. In 2008, JPT became a wholly owned subsidiary of BioNTech AG, Mainz (Germany), a company that develops novel immune therapy and diagnostic approaches for various cancers. JPT Peptide Technologies GmbH is a leading provider of innovative peptide-based services, and catalog products & kits, as well as a research and development partner for projects in Immunology, Proteomics and Drug Discovery. JPT's head office and production sites are located in Berlin, Germany. All of its production and services are performed in Berlin/ Germany in accordance with DIN EN ISO 9001:2015 guidelines. Together with its US-subsidiary based in Acton, near Boston, Massachusetts, JPT is serving a worldwide customer base in the pharmaceutical and biotechnology industries, as well as researchers in universities, governmental and non-profit organizations. Over the past decade, JPT has developed a portfolio of proprietary technologies and a series of unique products and services which support research efforts in proteomics, all development phases of novel vaccines or immunotherapies and peptides based drug discovery. Since 2009, JPT is actively involved in R&D partnerships and contract research projects focusing on seromarker discovery & validation, development of immune monitoring tools and diagnostics, vaccine target discovery, peptide lead identification & optimization, biomarker quantification by targeted proteomics, enzyme substrate identification & sensitivity profiling.

Certifications & Qualifications

Our Services (24)

ادارة مشروع

JPT’s interdisciplinary team of 50 experts in peptide and medicinal chemistry, bioinformatics and assay development combines scientific expertise and creativity with unique and proprietary high throughput synthesis and assay technologies. The company structure, with various but focused expertise, provides an integrated and comprehensive one-stop-source for peptide related R&D projects and enables efficient interaction structures. An experienced project management team with a track record of successful R&D projects for over more than a decade as well as a DIN ISO 9001:2015 certified Quality Management System ensures professional project execution at short cycle times.

In addition to innovative peptide related catalog products and services, JPT applies its know-how and expertise in collaborative partnerships with companies and non-profit organizations. Depending on the goals, complexity and risk of a given project, JPT offers a variety of business models that range from fee-for-service and FTE based contract research to collaborative partnerships and risk sharing project models.

Quantitative Proteomics

Functional proteomics aims for the elucidation of the biological function of proteins or protein groups and classes on a proteome-wide level.

This includes the characterization of enzyme activities as well as protein/protein interactions and post-translational modifications at proteins. Combining our technologies and expertise, we are able to map changes in signaling pathways as a consequence of cell-treatment or changes in environmental conditions. This can be done either by the large-scale measurement of enzymatic activities of kinase, phosphatase, protease or other protein modifying enzymes or by measurement of epigenetic modifications at proteins.

We have also developed innovative ways in evaluating and presenting complex data sets which is vital for the optimal exploitation of experimental results.

Targeted Mass Spectrometry (MRM/SRM)

Multiple Reaction Monitoring/Selected Reaction Monitoring Mass Spectrometry

Discovery or shotgun proteomics usually targets the identification of large sets of proteins in complex samples. In targeted proteomics, high selectivity quantitative assays for lower numbers of proteins are developed, e.g. MRM assays. The significance of targeted proteomics is exemplified by the fact that it was selected as Nature Method of the Year 2012.

Multiple reaction monitoring (MRM), which is one of the most frequently used targeted proteomics approaches detects precursor and product ion pairs, furnishing assays for the detection and quantitation of proteins in biological samples spiked with proteotypic peptide standards.

JPT has been providing tools for targeted proteomics for years.
SpikeTides™ are cost-effective peptides that allow high-speed SRM assay and MRM assay development and protein quantitation with almost unlimited coverage through entire proteomes. Thousands of proteotypic SpikeTides™ can be prepared economically at unmatched turnaround times (10 000 peptides per week). Absolutely quantified SpikeTides™ (SpikeTides™ TQL) use a new approach for absolute quantification that is significantly more cost effective than using traditional AAA quantified standard peptides. SpikeTides™ also enable the monitoring of cellular regulation by incorporation of post-translational modifications. See the scheme on the bottom of the page for a graphical overview on how SpikeTides™ are used in discovery and targeted proteomics experiments.

In addition, JPT offers complete proteomic studies in collaboration with its partners. Please feel free to discuss all aspects of your project with our experts.
Our Bioinformatics expertise allows for intelligent peptide library design that, in combination with our technologies, helps to solve complex problems in target discovery and validation as well as biomedical research.


Concluding Remarks and Perspectives

The use of LC-MS/MS strategies is the most useful and promising path to improve the identification and quantification of immunogenic peptides. Despite the methodological difficulties, it proves to be a fast, sensitive, and reproducible method. In addition, it can be extended to several other allergenic food matrices, like dairy, nuts, and seafood. Thus, knowing the profile of allergenic proteins of cereals is necessary as a basis, not only for future applications of MS in the quantification of gluten in food, but also to ensure the safety of consumers regarding food labeled cereal- or gluten-free.

Although the declaration of gluten-containing cereals on products labeled gluten-free is mandatory worldwide, there is no certified reference material available for gluten. The available reference material contains only gliadins that underestimate the gluten content, besides the problem of reproducing a new batch with similar properties and composition. The majority of MS-based studies have been conducted with the final objective to establish a reference material for gluten analysis starting from the study of specific grain peptide markers. Therefore, targeted high-resolution MS/MS methods allowed the quantification of low levels of specific marker peptides from different species and protein types.

When comparing LC-MS/MS methods to ELISA for gluten detection, ELISA still remains the method of choice in most cases, because it is fast, comparatively cheap, suitable for routine analyses, and does not require highly specialized equipment. However, several studies have shown that ELISA may underestimate gluten contents especially in processed foods that have been extensively heat-treated or hydrolyzed. Untargeted LC-MS/MS is recommended to screen for the presence of gluten-derived peptides in products such as beer, malt vinegar, and fermented sauces. However, there are some points that will equally all analytical methods, because gluten extractability has been shown to be reduced substantially in heat-treated foods and processing-induced post-translational protein modifications will lead to reduced gluten detectability irrespective of the analytical method used.

The use of modern MS-based techniques, combining orthogonal separations with high sensitivity and reliable certified references materials will hopefully help to better comprehend the effect of food processing or plant breeding on gluten immunogenicity. Continued efforts in this area will also help to solve the questions about the selection of relevant target epitopes and even antibodies, taking account the high protein polymorphism and the fact that patients react individually to different proteins and present variable sensitivities.


Missing Protein Detection and Strategies

) developed a novel protein extraction method for human alveolar bone obtained from impacted third-molar extractions: solubilizing osteoid, releasing hydroxyapatite-bound and collagen-bound proteins, and then digesting insoluble cross-linked proteins with trypsin, followed by LysC in urea. All extracts were digested by four proteases for MS analysis (trypsin, LysargiNase, GluC, AspN) with TAILS employed to identify mature and neo N-termini, and a search parameter for hydroxyproline was included. Many tissue-specific MPs were expected. A quite extensive identification of peptides and proteins was demonstrated, with many interesting observations and proteins detected for the first time in bone. However, only one MP, pannexin-3 (Chr 11q24.2), was identified that met HPP Guidelines. The authors also identified proteotypic peptides from 17 proteins previously classified as PE1 from non-MS methods, which the authors term non-MS PE1 proteins, of which two met the HPP Guidelines v2.1 in full to now be classified as PE1 proteins with complete MS evidence. Furthermore, the bone N-terminome provided insight into the proteolysis during bone development. This workflow is applicable to similar mineralized tissues. The paucity of tissue-specific MPs may be a clue that unusual PTMs and protein complexes drive tissue-specific features.

) observed that PE2,3,4 MPs have lower mean and median molecular weights (38 kDa/∼345 aa 34 kDa/310 aa) than PE1 proteins (66 kDa/600 aa 50 kDa/455 aa). They devised a workflow to enrich low-molecular-weight proteins from human placenta samples using a C18 solid-phase extraction column and fractionation with SDS-PAGE gel or a 50 kDa cutoff filter and the use of LysargiNase, a mirror protease to trypsin. In so doing, the authors identified three MPs (TRNP1, LCE6A, IGFL2), with lengths from 80 to 227 aa, with pairs of proteotypic peptides confirmed by parallel reaction monitoring (PRM). A fourth candidate corresponding to the extracellular functional domain in a cleaved isoform of UMODL1 did not have PRM confirmation. A similar approach had been applied to the testis in the 2018 special issue.(16)

) took advantage of combinations of trypsin, LysC, and GluC to enhance the MP identification in the human testis using a search engine called Open-pFind, which identified more peptide-spectrum matches (PSMs), peptides, and MP candidates than MaxQuant, pFind, and Proteome Discoverer, mostly due to PTMs, and also more small proteins with <100 aa. They report the promotion of five MP candidates verified with two uniquely mapping, non-nested peptides of ≥9 aa confirmed with synthetic peptides, meeting the HPP Guidelines v2.1, from a much larger number of MP candidates. Two already had a singleton peptide in PeptideAtlas. The authors provide detailed biological annotations for the five MPs.

) extended their bioinformatic strategy utilizing the SRMAtlas (http://www.srmatlas.org/) as a source of spectra for synthetic proteotypic peptides to confirm stranded or singleton peptides in the Global Proteome Machine (GPM, www.thegpm.org/). GPM results are not incorporated into PeptideAtlas, but some primary data sets can be found at PRIDE via ProteomeXchange (http://www.proteomexchange.org/). Starting from SRMAtlas, the authors identified 6736 non-nested synthetic peptides corresponding to 1644 of the 2129 neXtProt PE2,3,4 MPs as of 2019-01 using the neXtProt uniqueness checker. Then, they searched GPM for two or more of these non-nested proteotypic peptides of ≥9 aa from the same proteomic study. A total of 51 new MP candidates were identified in 35 different studies, of which 23 (with 55 total peptides) were reported as validated after careful spectral matching. The release by the PSI Universal Spectrum Identifier should facilitate such matching of spectra between SRMAtlas and GPM or other sources of studies not already incorporated by PeptideAtlas. The synthetic peptides experimentally analyzed in SRMAtlas were selected according to their physicochemical properties of length, hydrophobicity, and charge state as having a high likelihood of detectability as natural peptides from biological specimens. The authors provide an interesting discussion of the features of the MPs identified through this approach.

) assess some of the challenges of finding members of by far the largest class of missing proteins, the 405 PE2,3,4 predicted protein-coding genes for human olfactory receptors (ORs), leaving aside a similar number of PE5 entries that are mostly pseudogenes. There are four PE1 OR proteins in the neXtProt 2019-01 release based on protein–protein interaction data (OR1D2, OR2AG1) or genetic or biochemical data (OR1D2, OR2J3). There is not a single OR validated as PE1 with MS evidence, despite many claims over the years and the publication of proteotypic peptides for these in the SRMAtlas. The authors noted confined spatiotemporal or development expression, a very low copy number of transcripts, gene silencing, and limited access to the olfactory epithelium as potential explanations. Here they focused on the hydrophobic seven-pass transmembrane structure of these G-protein-coupled receptors, the inaccessibility of the few Lys and Arg sites for tryptic digestion, and the limited hydrophilic domains. Hypothetically, 58% of ORs might be capable of generating pairs of proteotypic tryptic peptides if and only if the abundance was sufficient and the appropriate specimens were obtainable. No OR was detected in a 2018 special issue paper on the olfactory epithelium in which five other MPs were detected.(16)

) address the question of whether MPs are undetected because their abundance is too low (technical insensitivity) or because the coding gene is not transcribed and the transcript is not translated, including major differences across tissues and cellular heterogeneity (biological explanation). They introduce a quantitative polymerase chain reaction (qPCR)-based approach for detecting low-abundance transcripts by extending the number of cycles from 30 to 40 or more and confirming with Sanger amplicon sequencing. They argue that this qPCR method, which is coupled to RNA-seq, enabled the detection of low-abundance transcripts from Chr 18. In principle, this approach could be integrated into C-HPP initiatives as an optional tool when high-quality samples and proper RNA-seq data sets and primers are available.

) describe the publications and strategies of the Chr 18 team in response to the C-HPP neXt-MP50 and neXt-CP50 Challenges to identify missing proteins and annotate uncharacterized PE1 proteins for function, which together represent the “dark proteome”. The authors address two key technical challenges: the low analytical sensitivity of proteomic technologies and the greater complexity of the proteome versus the genome. Beyond shotgun and targeted MS, they suggest nanotechnologies combined with atomic force microscopy (AFM) and greater attention to proteoforms arising from sequence variants, splicing, and chemical PTM. AFM chips with affinity reagents may be useful enrichment tools. They provide insight into the feasibility of detecting low-abundance proteins.

) 3 from placenta, Lin et al. (

) and 23 from the SRMAtlas/GPM analyses, Elgoushy et al. (

)), is much smaller than last year, when there were 104 MPs from specific studies plus 107 candidates from MassIVE in the 2018 HPP Special Issue.(17) When the full Sun et al.(18) data set was reanalyzed by PeptideAtlas, 73 MPs were confirmed, whereas only 14 had been validated with synthetic peptides in the original paper (Omenn et al.(19)). As previously pointed out,(15) there are still many predicted proteins that may not be detectable by the current sample preparation and MS methods. Nevertheless, there is very substantial annual progress from the work of the entire proteomics community, as documented in the metrics paper by Omenn et al. (

), which showed large gains in PE1 proteins (462 in 2017, 224 in 2018) and substantial reductions in PE2,3,4 proteins (431 in 2017, 213 in 2018) during each of the past 2 years. We await the 2020-01 releases from PeptideAtlas and neXtProt to confirm the promotion of these and other MPs found in community-supplied data sets.


الملخص

The Human Proteome Project (HPP) aims deciphering the complete map of the human proteome. In the past few years, significant efforts of the HPP teams have been dedicated to the experimental detection of the missing proteins, which lack reliable mass spectrometry evidence of their existence. In this endeavor, an in depth analysis of shotgun experiments might represent a valuable resource to select a biological matrix in design validation experiments. In this work, we used all the proteomic experiments from the NCI60 cell lines and applied an integrative approach based on the results obtained from Comet, Mascot, OMSSA, and X!Tandem. This workflow benefits from the complementarity of these search engines to increase the proteome coverage. Five missing proteins C-HPP guidelines compliant were identified, although further validation is needed. Moreover, 165 missing proteins were detected with only one unique peptide, and their functional analysis supported their participation in cellular pathways as was also proposed in other studies. Finally, we performed a combined analysis of the gene expression levels and the proteomic identifications from the common cell lines between the NCI60 and the CCLE project to suggest alternatives for further validation of missing protein observations.

قضية خاصة

This article is part of the Chromosome-Centric Human Proteome Project 2017 special issue.


شاهد الفيديو: statistiek mediaan in frequentietabellen in klasse (ديسمبر 2022).