معلومة

كيف تفسر بيولوجيا مجموع وزن المسار في شبكة تنظيم الجينات الموزونة والموجهة؟

كيف تفسر بيولوجيا مجموع وزن المسار في شبكة تنظيم الجينات الموزونة والموجهة؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لقد فكرت في طرح هذا السؤال على Bioinformatics SE و Mathematics SE و Stats SE ، ومع ذلك فقد حكمت على أن سؤالي ينتمي إلى Biology SE لأنني مهتم بتفسير بيولوجي (خاص بالمجال) بدلاً من تطوير إضافي لـ الرياضيات أو البرامج.

سؤالي يتعلق بتطبيق نظرية الرسم البياني على علم الأحياء ، لذلك سأقوم أولاً بوصف الرسم البياني في خصائصه الرياضية وكيف تعكس الخصائص البيولوجية.

الرسم البياني

لنفكر في الرسم البياني الموزون والموجه الذي تمثل عقده الجينات وتمثل حوافه العلاقة الثنائية ينظم الجين أ الجين ب. يتم فرض اتجاه الحواف من أجل عكس ذلك ينظم الجين أ الجين ب لا يعني ذلك ينظم الجين ب الجين أ. يجب أن تمثل مقادير الأوزان بعض المقاييس لمدى "قوة" أحد الجينات في تنظيم آخر ، وعلامات الأوزان تمثل ما إذا كان التنظيم هو زيادة التنظيم (إيجابي) أو تنظيم سفلي (سلبي). بالنسبة لهذا الرسم البياني ، تعتبر الحواف التي يبلغ وزنها صفرًا مكافئة لـ "بدون تنظيم" ويجب استبعادها من الرسم البياني.

تحليل المسار

حصر أنفسنا في المسارات التي لا تزور نفس العقدة مرتين ، ما هو التفسير البيولوجي لمجموع الأوزان (للحواف) لمسار بين عقدتين في الرسم البياني سالف الذكر؟

لدي حدس متضارب. على سبيل المثال ، لماذا تكون هذه الأوزان مضافة؟ أنا لا أفرض أن مثل هذه الأوزان يجب أن تكون معاملات ارتباط ، على سبيل المثال ، لكنها تستخدم بشكل شائع أوزانًا في الشبكات غير المضافة ، لذا فهي تستدعي بعض الاعتبار في الحالة الأكثر عمومية. إذا لم تكن مضافة ، فإن جمعها ليس بالضرورة ذا معنى. بشرط أن تكون ذات مغزى في المقام الأول ، فإن استنتاجي الآخر هو أن معنى مثل هذا الجمع سيعكس قوة التنظيم "غير المباشر"


هناك قدر كبير من استخدام الأساليب النظرية للرسم البياني في تنظيم الجينات ، لذلك أقترح أن تبدأ من هناك وتقف على أكتاف العمالقة بدلاً من إعادة اختراع الجاذبية:

https://scholar.google.com/scholar؟hl=ar&q=graph+theoretic+gene+regulation

على الرغم من أن هذا ليس مجال خبرتي ، أعتقد أن الشيء الأكثر وضوحًا بالنسبة لي كعالم أحياء وخبير إحصائي هو:

المبالغ مضللة في الأنظمة غير الخطية

علم الأحياء غير خطي للغاية. ربما يمكنك الحصول عليها أقرب لخطي في الرسم البياني الذي تصفه إذا كانت الأوزان تعكس نسب تحويل السجل: هذا التحول يجعل نظام الضرب خطيًا. لكن حتى بعد هذا التحول ، فأنت تضع افتراضات جوهرية. الطريقة الوحيدة للتحقق من هذه الافتراضات ستكون إما باستخدام نموذج أكثر تعقيدًا للنظام الأساسي (نظرًا لأن الرسم البياني الذي تصفه مجردة تمامًا) أو بالطريقة القديمة: عن طريق التجربة.


نهج تدفق الشبكة للتنبؤ بأهداف الأدوية من بيانات ميكروأري وجينات المرض والشبكة التفاعلية - دراسة حالة عن سرطان البروستاتا

النهج المنهجي لاكتشاف الأدوية هو تخصص ناشئ في مجال أبحاث بيولوجيا الأنظمة. ويهدف إلى دمج بيانات التفاعل والبيانات التجريبية لتوضيح الأمراض ويثير أيضًا قضايا جديدة في اكتشاف الأدوية لعلاج السرطان. ومع ذلك ، لا يزال اكتشاف الهدف الدوائي في مرحلة التجربة والخطأ التجريبية ، وهي مهمة صعبة لتطوير نموذج تنبؤ يمكنه الكشف بشكل منهجي عن أهداف الأدوية المحتملة للتعامل مع الأمراض المعقدة.

أساليب

نقوم بدمج التعبير الجيني وجينات المرض وشبكات التفاعل لتحديد أهداف الأدوية الفعالة التي لها تأثير قوي على جينات المرض باستخدام نهج تدفق الشبكة. في التجارب ، نعتمد مجموعة بيانات ميكروأري التي تحتوي على 62 عينة من سرطان البروستاتا و 41 عينة طبيعية ، و 108 جينات معروفة لسرطان البروستاتا ، و 322 هدفًا من الأدوية المعتمدة التي تم علاجها في الإنسان المستخرج من قاعدة بيانات DrugBank لتكون بروتينات مرشحة لبيانات الاختبار الخاصة بنا. باستخدام طريقتنا ، نعطي الأولوية للبروتينات المرشحة ونتحقق من صحتها لأهداف أدوية سرطان البروستاتا المعروفة.

نتائج

نجحنا في تحديد أهداف الأدوية المحتملة التي ترتبط ارتباطًا وثيقًا بالأدوية المعروفة لعلاج سرطان البروستاتا ، كما نكتشف أيضًا المزيد من الأهداف الدوائية المحتملة التي تثير انتباه علماء الأحياء في الوقت الحالي. نشير إلى أنه من الصعب اكتشاف أهداف الأدوية بناءً على تغييرات التعبير التفاضلي فقط نظرًا لحقيقة أن تلك الجينات المستخدمة كأهداف للأدوية قد لا يكون لها دائمًا تغييرات كبيرة في التعبير. مقارنة بالطرق السابقة التي تعتمد على سمات طوبولوجيا الشبكة ، فقد تبين أن الجينات التي لها إمكانات كأهداف للأدوية ترتبط ارتباطًا ضعيفًا بالنقاط الحرجة في الشبكة. بالمقارنة مع الطرق السابقة ، فإن نتائجنا لها متوسط ​​دقة متوسط ​​أعلى وترتيب أيضًا موضع أهداف العقاقير حقًا أعلى. وبذلك يتحقق من فعالية طريقتنا.

الاستنتاجات

لا تعرف طريقتنا الطرق المثالية الحقيقية في شبكة المرض ولكنها تحاول إيجاد التدفق الممكن لإعطاء تأثير قوي على جينات المرض من خلال المسارات الممكنة. نجحنا في صياغة تحديد تنبؤ هدف المخدرات باعتباره مشكلة تدفق قصوى على الشبكات البيولوجية واكتشاف الأهداف المحتملة للعقاقير بطريقة دقيقة.


مقدمة

تمثل المسارات البيولوجية مجموعات من الكيانات الجزيئية الحيوية ، مثل الجينات والبروتينات ، وتفاعلاتها المتتالية التي ترتبط بوظائف خلوية معينة [1]. تعد وفرة وتوافر المسارات المشروحة عنصرًا أساسيًا في سد الفجوة بين ديناميكيات المستوى الجزيئي والبصيرة البيولوجية عالية المستوى [2-5]. على الرغم من أن التغييرات في الجزيئات الفردية قد تؤدي إلى اختلافات في البرامج الخلوية ، إلا أن العديد من الوظائف البيولوجية تنشأ من السلوك المنهجي للكيانات والتفاعلات. يضع مفهوم بيولوجيا الأنظمة هذا استخدام المسارات في قيمة كبيرة للاكتشاف والعلاج والتشخيص والتنبؤ في الدراسات الطبية الحيوية [6-9].

يصف مصطلح "تحليلات المسار" فئة من النماذج التي تعزز شبكات التفاعل البيولوجي لدراسة البيانات على المستوى الجزيئي ، مثل التعبير الجيني. تم بناء العديد من هذه الأدوات على فرضية مجموعة راسخة من الأدبيات التي تشير إلى أن موضع الجينات / البروتينات في شبكات التفاعل المرتبطة بها يمكن أن يحدد أهميتها في الأنظمة البيولوجية ذات الأهمية [10-12]. على سبيل المثال ، تستخدم العديد من نماذج تحليل إثراء المسار المستندة إلى الشبكة (N-PEM) مفاهيم نظرية الرسم البياني لتحديد أولويات التعبيرات التفاضلية الطوبولوجية المهمة في المسارات وإنتاج تفسيرات وظيفية [13-21].

نماذج مركزية الرسم البياني هي الطرق الرئيسية لتقييم المواقف الطوبولوجية لكيانات الشبكة الفردية [22]. في حين تم استخدام هذه النماذج بنجاح في تحليلات المسار للتفسير الوظيفي ، فإن تجريداتهم من منظمات الشبكة لا تلتقط بالضرورة السمات الطوبولوجية الرئيسية للمسارات ، مما يشير إلى إمكانية إجراء تقييم أكثر صلة من الناحية البيولوجية للمسارات. تظهر المسارات البيولوجية ، وخاصة مسارات الإشارات ، كمنظمة من المنبع إلى المصب ، مما يشير إلى ترتيب زمني وكيميائي حيوي للتفاعلات بين الجينات والبروتينات المرتبطة. في نموذج الرسم البياني الموجه ، يتم تمثيل عناصر المسار الرئيسي في الغالب كعقد بدون حواف واردة ويتم تمثيل عناصر المصب كعقد بدون حواف خارجية. وبالتالي ، فإن نموذج المركزية القياسية للرسوم البيانية الموجهة ، مثل PageRank و Katz ، لا يعين أي أهمية طوبولوجية لعناصر المصب ، والتي ثبت أن العديد منها عناصر أساسية للوظائف البيولوجية.

الهدف من هذه الدراسة هو إظهار حدود نماذج المركزية القياسية كميًا وتوفير بديل معقول لتحسين فائدة التقييمات الطوبولوجية للمسارات. نحن نفترض أن نموذج المركزية الموجهة الذي يفسر الوضع الطوبولوجي للعناصر الرئيسية في نهايات المسار والمصب ، يمكن أن يوفر توصيفًا أكثر وضوحًا للشبكات البيولوجية. لتحقيق هدفنا ، نقوم أولاً بإضفاء الطابع الرسمي على نماذج المركزية القياسية إلى ثلاث فئات من أطر العمل المصدر والمصدر وغير الموجهة. يشير إطار عمل المصدر إلى نسخة من نماذج المركزية التي يمكنها التقاط أهمية العقدة كمرسل للمعلومات ، والتي تتعلق بنماذج الرسم البياني الموجهة المستخدمة في تحليلات المسار النموذجية. يهدف إطار عمل Sink إلى التقاط لتحديد المستقبِلات المهمة للمعلومات / الإشارات البيولوجية. نقدم بعد ذلك مفهوم مركزية المصدر / المغسلة (SSC) ، وهو إطار عمل مرن يعمل من خلال تطبيق أي نموذج مركزية على الرسم البياني والرسم البياني المنقول في وقت واحد ، والجمع بين ملفي التعريف الناتج. ينتج SSC درجة مركزية لكل عقدة في شبكة تحدد أهمية كل جين في بداية المسار وفي اتجاه مجرى النهر أثناء حساب ترتيب واتجاه التفاعلات.

في دراسة أولية حديثة ، ذكرنا أن إطار عمل SSC لنماذج المركزية المشتركة يوفر توصيفًا أكثر إفادة لمواقف عناصر المسار الرئيسية على عكس النماذج الموجهة القياسية [23]. على وجه الخصوص ، أظهرنا أن درجات المركزية التي تنتجها SSC لها ارتباط أقوى وعلاقة خطية وصفية أكثر مع احتمال أن يكون الجين مهمًا بناءً على وظائف بيولوجية معروفة مسبقًا. في دراسة أخرى ، أظهرنا تطبيقًا لتعديل SSC لمركزية Katz في تحليل التخصيب المستند إلى الشبكة لإعطاء الأولوية للتعبير التفاضلي للجينات الطوبولوجية المهمة. في هذه الحالة ، أظهرنا أن إطار عمل SSC ينتج تفسيرًا وظيفيًا أكثر ملاءمة من الناحية البيولوجية للبيانات الجينومية للأمراض [24]. بعد ذلك في دراسة حديثة ، Zaffaroni et al. استفاد من تعديل SSC لمركزية Katz للتنبؤ بمسارات السائق للانتقال الخلوي [25 ، 26].

في هذه الدراسة ، قمنا بتوسيع نمذجة SSC إلى نماذج مركزية طيفية متعددة والتحقق من صحتها باستخدام بيانات خلفية إضافية ومحدثة. على وجه الخصوص ، نتحرى عن مجموعة من نماذج مركزية الرسم البياني القياسية وامتدادات SSC الخاصة بهم لوصف تنظيم الجينات المهمة المعروفة مسبقًا. بالنسبة للجينات المهمة مسبقًا ، فإننا نركز على جينات السرطان البشرية والجينات القاتلة للفأر ، والمعروفة أيضًا باسم الجينات الأساسية ، أي الجينات التي تؤدي ضربتها قاضية إلى موت الكائنات الحية. الأساس المنطقي لاختيار الجينات المرتبطة بالسرطان هو الحدس الذي يعتبر السرطانات أمراضًا للمسارات ، أي أن السرطانات مدفوعة أساسًا باضطراب / تغيير في المسارات [7 ، 27]. وبالتالي ، يمكن أن يؤدي الخلل الوظيفي في واحد أو أكثر من الجينات المرتبطة بالسرطان إلى خلل وظيفي في المسارات المرتبطة بها [7]. لذلك ، قد يكشف فهم الموقع الطوبولوجي للجينات المرتبطة بالسرطان عن نظرة ثاقبة فيما يتعلق بالتنظيم الطوبولوجي لمحركات / منظمات المسار الرئيسية. الأساس المنطقي لاختيار الجينات القاتلة للفأر هو وجود مؤلفات مستفيضة حول العلاقة بين المركزية والفتاك في شبكات تفاعل البروتين والبروتين ، حيث ثبت أن المركزية الأعلى ترتبط باحتمالية أعلى لكونها قاتلة (ضرورية) [28-30 ].

من وجهات نظر متعددة ، نظهر أن امتدادات SSC ، مقارنة بالنماذج القياسية ، تنتج إطارًا طوبولوجيًا أكثر وصفًا لمواقع جينات السرطان في المسارات البشرية ، وكذلك الجينات الأساسية في مسارات الفئران. تظهر هذه النتائج أن منهجية SSC تساهم في تحليلات المسار البيولوجي وطرق الاستدلال من خلال توفير إطار أكثر واقعية لقياس أوضاع الشبكة.


مقدمة

مفهوم

كانت الدراسة العملية لسيناريوهات إعادة ترتيب الجينوم محدودة بسبب الافتقار إلى النماذج الرياضية القادرة على دمج القيود البيولوجية ، حيث ركزت النماذج التأسيسية على سيناريوهات الطول الأدنى لتحويل جينوم إلى آخر. في العصر الحديث ، حيث تتزايد باستمرار مجموعة الجينومات المجمعة والمفصلة بالكامل ، هناك حاجة لتطوير نماذج رياضية أكثر تفصيلاً تأخذ بعين الاعتبار البيانات من تجارب بيولوجية متعددة.

تتمثل إحدى طرق دمج المعلومات البيولوجية في استدلال السيناريوهات التطورية في النظر في النماذج التي من المحتمل أن تحدث إعادة ترتيب الوزن وفقًا لاحتمالية حدوث نقطة توقف في بعض المناطق الجينية أكثر من غيرها. تحقيقًا لهذه الغاية ، بدأ بلانشيت وآخرون دراسة الانعكاسات الموزونة بطول الطول في أواخر التسعينيات. [1]. Baudet et al. قدم ملخصًا للعمل المنجز في هذا المجال ، جنبًا إلى جنب مع العمل على الانعكاسات التي تتمحور حول أصل النسخ المتماثل [2]. في الآونة الأخيرة ، نشر تانيير سلسلة من الأوراق التي تركز على ترجيح المناطق بين الجينات بطولها في النيوكليوتيدات. في [3] ، بيلر وآخرون. أشار إلى أنه وفقًا لنموذج Nadeau-Taylor للكسر العشوائي المنتظم [4 ، 5] ، من المرجح أن تحدث نقطة توقف في منطقة أطول بين الجينات. أوراق لاحقة بقلم فيرتين وآخرون. [6] ، وبولتو وآخرون. [7] عرض النتائج الحسابية للنماذج التي تأخذ في الاعتبار طول المناطق الجينية. باستخدام بيانات Hi-C [8] ، Veron et al. جنبًا إلى جنب مع دراستنا الخاصة ، أوضحنا أهمية ترجيح أزواج نقاط التوقف وفقًا لمدى قربها من الفضاء المادي [9 ، 10]. من أجل استخدام هذا القيد المادي ، قمنا بتقسيم المناطق الجينية إلى مناطق محلية مشتركة ، وطورنا خوارزميات لحساب المسافات التي تقلل من عدد عمليات إعادة الترتيب التي تعمل على نقاط التوقف بين مناطق مختلفة [11 ، 12].

يعتمد الكثير من هذا العمل على النموذج النظيف رياضيًا لإعادة ترتيب الجينوم المسمى قص مزدوج وربط، أو DCJ [13 ، 14]. يتم تقسيم الجينوم إلى ن الكتل التركيبية المتعامدة التي سوف نسميها ببساطة الجينات. يتم تمثيل كل جين بطرفين ، ويتم تمثيل كل كروموسوم بترتيب هذه الأطراف. يتم إقران الأطراف المتجاورة في هذا الترتيب ، وتحدث التحولات في هذه الأزواج عن طريق تبديل الأطراف بين زوجين. يمكن تفسير DCJ بشكل طبيعي كنموذج تحرير رسم بياني باستخدام امتداد الرسم البياني لنقطة التوقف، حيث توجد حافة بين الأطراف الجينية أ و ب لكل زوج متجاور. تحل عملية DCJ محل زوج الحافة ( كبير <, كبير > ) من الرسم البياني بواسطة ( كبير <), كبير > ) أو ( كبير <, كبير > ). تسمى عملية تحرير الحافة على الرسم البياني أ 2 فاصل.

تضع هذه الورقة إطارًا عامًا لترجيح إعادة الترتيب. تستند النتائج إلى مشكلة تحويل الرسم البياني المسمى إلى آخر من خلال سيناريو العمليات ، كل مرجح بوظيفة عشوائية ( varphi ). تتطلب المشكلة ، المسماة ( varphi ) - سيناريو التكلفة الدنيا البخل (أو ( varphi ) -MCPS) ، سيناريو بحد أدنى لعدد فواصل 2 ، بحيث يكون مجموع تكاليف العمليات تم تصغيره.

تطبيقات إطار عملنا

في حين أن إطار عملنا عام ، فإننا نستخدمه لجعل دراستين سابقتين أكثر عملية. الدراسة الأولى هي عملنا المتعلق بإمكانية إعادة ترتيب نقاط الانكسار إلى القرب المادي في النواة [11]. يعتمد هذا العمل على فرضية أنه يمكن الخلط بين نقطتي توقف عندما تكون قريبة فعليًا. يقوم النموذج في هذه الدراسة بتسمية حواف الرسم البياني لنقطة التوقف (المقابلة للمناطق الجينية) بـ "ألوان" ثابتة ، وتكلفة DCJ لها وزن واحد إذا كانت الملصقات مختلفة ووزن صفر إذا كانت متطابقة. باستخدام دالة التكلفة هذه ، قمنا بتلوين المناطق بين الجينات من خلال تجميعها وفقًا لقربها المادي ، كما هو مستدل من بيانات Hi-C. على الرغم من أن تقنية التجميع هذه أثبتت جدواها من الناحية البيولوجية [10 ، 12] ، إلا أنها بعيدة كل البعد عن المثالية نظرًا لأن الكثير من المعلومات التي قدمتها بيانات Hi-C تُفقد في وضع العلامات ، وليس من الواضح على الفور كيفية حساب أفضل التجمع. تتجاوز نتائجنا هنا تعقيد التجميع من خلال السماح لكل DCJ أن يتم ترجيحه بالقيم المأخوذة مباشرة من خرائط جهات الاتصال Hi-C. نعطي خوارزمية لـ ( varphi ) -MCPS على رسم بياني لنقطة التوقف مع تسميات ( varphi ) تعسفية وحواف ثابتة ، تعمل في (O (n ^ 5) ) الوقت في أسوأ الحالات ولكن لديه تعقيد معلمات أفضل في الممارسة (انظر المثال 1). نقدم في قسم "الأمور العملية" أسبابًا أخرى تجعل أوقات تشغيل هذه الخوارزمية عملية.

الدراسة الثانية التي قمنا بتحسينها هي دراسة Bulteau et al. [7]. يعتمد قيدهم البيولوجي على عدد النيوكليوتيدات في المناطق الجينية التي تحتوي على نقاط توقف يحسبونها سيناريوهات شحيحة تقلل من عدد النيوكليوتيدات التي يتم إدخالها وحذفها في المناطق الجينية. تقتصر الخوارزمية الخاصة بهم على الحالات التي يكون فيها الرسم البياني لنقطة التوقف يحتوي على دورات فقط (ولا توجد مسارات - يشار إليها أحيانًا باسم مشترك الذيل الجينوم). باستخدام خوارزمية (O (n log n) ) ، يعطي إطار العمل الخاص بنا خوارزمية (O (n ^ 3) ) على أي رسم بياني لنقطة التوقف (انظر المثال 3).

هذا مثال على كيفية تبسيط إطار عملنا لتصميم الخوارزمية على DCJs الموزونة. بالنسبة لوظيفة الوزن التي تلتزم بمعاييرنا العامة لقسم "فواصل محدودة التكلفة" ، يحتاج مصممو الخوارزميات المستقبلية الآن فقط إلى التركيز على تطوير خوارزمية فعالة تعمل على دورة واحدة من الرسم البياني لنقطة التوقف. بفضل Theorem 3 ، سيحصلون على خوارزمية متعددة الحدود تعمل على مثيل عام مجانًا. "α-تقريب ل φيوضح قسم -MCPS "أن الأمر نفسه ينطبق على خوارزميات التقريب.

تستند هذه الورقة إلى النتائج العامة التي نحصل عليها من التحولات الموزونة للرسوم البيانية المتعددة ذات العلامات الحوافية. يمكن للتحويلات المسموح بها تغيير اتصال الرسم البياني من خلال فاصل 2 أو تغيير تسميات الحافة أو كليهما. هذا النموذج لا يثبت فقط أنه قوي بما يكفي لاستيعاب النتائج المذكورة سابقًا ، ولكنه يقدم أيضًا مزايا أخرى. إنه مرن بدرجة كافية بحيث يمكن أن تستند تكاليف DCJ إلى تسميات الحواف في الرسم البياني لنقطة التوقف ، أو على تسميات الرؤوس ، أو مزيج من الاثنين معًا.أيضًا ، نظرًا لأن عمليات الإدخال والحذف لجين واحد يمكن تمثيلها على أنها تقاربات "شبحية" [15] ، فإن كل هذه الورقة تنطبق على الجينومات حيث قد تكون الجينات مفقودة في جينوم واحد أو آخر. يمكن تطبيق معظم النتائج على الجينومات ذات الجينات المكررة (كما هو موضح في الشكل 1).

رسومات بيانية متعددة الألوان ثنائية الحافة لأوليريان للجينوم (أ = كبير ( <3_),1_>,<1_,2_>,<2_,3_> كبير) ) ( كبير ( <4_)>,<4_,1_>,<1_> كبير) ) (ب = كبير ( <1_,2_>,<2_,1_> كبير) ) ( كبير ( <3_),2_>,<2_,1_>,<1_,3_> كبير) ) و (أ '= كبير ( <3_),2_>,<2_,1_>,<1_,2_>,<2_,3_> كبير) ) ( كبير ( <4_)>,<4_,1_>,<1_> كبير) ). تمثل الحواف المجاورة لقمة خاصة ( circ ) نقاط نهاية الكروموسومات الخطية (على سبيل المثال ، الحواف السوداء ( <1_)، circ > ) و ( <4_t ، circ > )). تتم إضافة حواف إضافية للجينات المفقودة (مثل الحافة السوداء ( <2_),2_> ) والحافة الرمادية ( <4_h، 4_t > )) تسمى جوار الأشباح في [15]. في الجينوم أ و (A ') ، يتكرر الجين 1 مرتين ، وتتحول العملية أ في (A ') هو إدخال للجين 2 ، يتوافق مع 2-break (G (A ، B) rightarrow G (A' ، B) ). سيناريو DCJ يحول (A ') إلى جينوم خطي ب يتضمن حذف الجين 4

نموذجنا والنتائج العامة

أساس هذه الورقة هو نموذج لسيناريوهات تقييد التكلفة لتحولات الرسم البياني بدرجة الحفاظ ، تسمى فواصل 2 ، والتي تُعرف أيضًا باسم مقايضات الحواف ، أو المفاتيح ، أو إعادة الأسلاك ، أو التقلبات [16]. يحول الفاصل 2 رسمًا بيانيًا عن طريق استبدال حافتين () و () بواسطة () و (). تمت دراسة هذه التحولات ليس فقط في بيئة مقيدة لإعادة ترتيب الجينوم [14 ، 17] وفرز السلاسل بواسطة عمليات تبديل رياضية [18 ، 19] ، ولكن أيضًا في الإعدادات العامة لتوليد الشبكات العشوائية [16] وتصميم الشبكة [20] ، 21].

نتائجنا تدور حول تحويل رسم بياني متعدد تعسفي جي في واحد آخر ح لها نفس تسلسل الدرجة. نجد أنه من الملائم التفكير في مكان ما ، حيث يتم منحنا رسمًا بيانيًا متعدد الألوان ذي حافتين أويلريان مع حواف سوداء ورمادية ، والحواف السوداء من جي والرمادي من ح. نقوم بتحويل اتصال الحواف السوداء إلى اتصال الحواف الرمادية باستخدام سلسلة من فواصل 2. لذلك ، كلما استخدمنا الكلمة رسم بياني, طريق (على التوالى دورة) ، فنحن نشير إلى رسم بياني متعدد الألوان ثنائي الحواف ، وهو مسار (دورة على التوالي) يتناوب بين الحواف السوداء والرمادية. بطبيعة الحال ، أ تحلل دورة الرسم البياني عبارة عن قسم من حواف الرسم البياني متعدد الألوان ذي الحوافين بأولر في مجموعة من الدورات المتناوبة. أ الرسم البياني لنقطة التوقف رسم بياني برأس لكل طرف جيني - كل حادث لحافة رمادية واحدة وحافة سوداء واحدة بالضبط - جنبًا إلى جنب مع رأس نقطة نهاية كروموسوم واحد ( دائري ) يمكن أن يصل ارتفاعه إلى 2ن (انظر الشكل 2). يقدم قسم "سيناريوهات DCJ للجينومات والرسوم البيانية لنقاط التوقف" الرسم البياني لنقطة التوقف بالتفصيل ، ويحدد نموذج القص المزدوج والربط (DCJ).

يعتمد نموذجنا في ترجيح فواصل 2 بشكل أساسي على تسمية الرسم البياني ، وهي مجموعة ( mathcal ) من العمليات الصالحة ، ودالة الوزن ( varphi: mathcal rightarrow mathbb _ + ). بشكل تقريبي ، يمكن تحويل الرسم البياني للإدخال المسمى من خلال سلسلة من العمليات في ( mathcal ) ، حيث يمكن لعملية ما تغيير اتصال الحواف السوداء للرسم البياني ، و / أو تغيير تسميات الحواف. تحدد أي دالة وزن ( varphi ) مشكلة تحسين ( varphi ) -MCPS ، والتي تطلب سيناريو يقلل الوزن الإجمالي للعمليات. يتضمن هذا النموذج العديد من نماذج DCJ الموزونة التي تمت دراستها مسبقًا ، كما هو موضح في قسم "أمثلة على مشاكل DCJ المقيدة التكلفة في الأدبيات".

تم بناء العمود الفقري لنتائجنا من النظريات المتعاقبة التي تتحدث عن قابلية التحلل إلى مشاكل فرعية لمثيل ( varphi ) -MCPS. يوضح Lemma 3 أن السيناريو البخل من فواصل ثنائية تحويل الحواف السوداء إلى اللون الرمادي يعني ضمناً أقصى حل لدورة متناوبة بين الحواف (أو MAECD) [22]. تقول النظرية 1 أنه يمكن إيجاد الحل الأمثل لـ ( varphi ) -MCPS باستخدام حلول لمشكلة MAECD ، بحيث إذا كان يمكن حل ( varphi ) -MCPS في دورة بسيطة بالتناوب ، فيمكن أن يكون تم حلها في أي حالة. تقول النظرية 2 أن الحل الأمثل لـ ( varphi ) -MCPS في دورة بديلة بسيطة يمكن إيجاده باستخدام حل لمشكلة ( varphi ) -MCPS على ما نسميه دائرة، أي دورة متناوبة لا تزور نفس الرأس مرتين (انظر الشكل 4).

في ظل نموذج الجينوم الشائع ، حيث يحدث كل جين مرة واحدة بالضبط في كل جينوم ، توجد علاقة بين سيناريوهات DCJ البخل وحلول MAECD على الرسم البياني لنقطة التوقف [14 ، 23]. نستغل هذا الرابط في قسم " ( varphi ) -MCPS لرسم بياني لنقطة التوقف". تربط النظرية 3 كل شيء معًا ، ويظهر التحليل المطفأ أنه ، في ضوء خوارزمية (O (r ^ t) ) لحساب ( varphi ) -MCPS على دائرة بها ص يمكن حساب الحواف ( varphi ) -MCPS على الرسم البياني لنقطة التوقف في (O (n ^)) زمن.

في ظل نموذج جينوم أكثر عمومية ، والذي يسمح بإجراء تغييرات في عدد نسخ الجينات (مثل عمليات الإدراج والحذف والازدواجية) ، لا يزال العمود الفقري لنتائجنا قائماً بسبب التمثيل الملائم للجينات المفقودة على أنها جوار الأشباح في رسم بياني متعدد الألوان ثنائي الحافة بأولر [15] (انظر الشكل 1). جميع نتائجنا تحتوي على أزواج من الجينوم مع جينات غير مكررة ، ولكن محتوى جيني غير متكافئ. في الواقع ، لا يزال بإمكان الرسم البياني لنقطة التوقف (أي الرسم البياني بدرجة محدودة لمعظم العقد) تمثيل زوج الجينوم في هذه الحالة.

أثبت كابرارا أن MAECD عبارة عن NP-Hard للرسوم البيانية متعددة الألوان ثنائية الحواف لأويلريان حيث تقع كل قمة على حافتين رماديتين وحافتين أسودتين على الأكثر (وهذا هو الحال عندما يكون هناك نسختان من كل جين) [22]. نقدم برنامج خطي عدد صحيح بسيط (أو ILP) يحل ( varphi ) -MCPS لهذه الأنواع من الرسوم البيانية ، مع إعطاء طريقة لحل ( varphi ) -MCPS على الدائرة. من المحتمل أن يكون ILP هذا صعبًا بشكل عام ، نظرًا لأن عدد المتغيرات أسي في عدد الدورات المتناوبة البسيطة. في حالة الرسوم البيانية لنقطة التوقف على جينومات معينة ، قد لا يكون هذا دائمًا مستعصيًا على الحل ، حيث قد يكون عدد الجينات المكررة محدودًا. راجع قسم "الأمور العملية" لمناقشة هذه الأمور العملية.


نتائج ومناقشة

ركزنا على الخلل في تنظيم الجينات في سرطان الكبد حيث يكون الالتهاب الكبدي بي في متوطن. تم تنزيل بيانات Microarray من قاعدة بيانات GEO [GEO: <"type": "entrez-geo"، "attrs": <"text": "GSE22058"، "term_id": "22058" >> GSE22058] [22] ، وتم فحص ملامح التعبير على مستوى الجينوم لكل من miRNAs و mRNAs.

نموذج بناء الشبكة

أولاً ، تم إنشاء شبكة مرشحة من خلال الجمع بين التفاعلات المستهدفة المتوقعة والتفاعلات المدعومة تجريبياً التي تشمل كل من TFs و miRNAs. نظرًا لأن هذا النوع من الشبكات يحتوي على الكثير من الضوضاء ولا يتعلق بأنسجة معينة ، فقد قمنا بإعادة تصفية التفاعلات باستخدام نموذج التعبير المشترك استنادًا إلى بيانات المصفوفة الدقيقة.

كثيرا ما تستخدم نماذج التعبير المشترك لتأسيس العلاقات بين الجينات المعبر عنها في أنسجة معينة [23]. في هذه النماذج ، إذا كان هناك جينان يشتركان في ملفات تعريف تعبيرية متشابهة ، كما تم قياسها بواسطة معاملات ارتباط بيرسون المهمة ، فإن الجينين مرتبطان في الشبكة. في هذه الخطوة ، قمنا فقط بحساب معاملات الارتباط بين المنظمين والأهداف في الشبكة المرشحة. إذا كان لدى TF / miRNA أنماط تعبير مشابهة أو معكوسة لبعض الجينات ، فهناك احتمال كبير أن ينظم TF / miRNA هذه الجينات. نظرًا لأن نموذج التعبير المشترك لا يمكنه معرفة ما إذا كان التنظيم مباشرًا أم غير مباشر ، وأن التفاعلات من الشبكة المرشحة يمكن أن توفر فقط تفاعلات مادية محتملة ، فمن الضروري لتكامل مصدري البيانات تقديم دليل أقوى للوائح الجينات. وبالتالي ، يمكن اعتبار GRN النهائي بمثابة تقاطع بين الشبكة المرشحة و GRN التي تم إنشاؤها بواسطة نموذج التعبير المشترك. استبعدنا أولاً القيم المتطرفة في بيانات ملف تعريف التعبير ، ثم حسبنا معاملات الارتباط بين المنظمين والأهداف باستخدام طريقة بيرسون. يجب أن تستوفي اللوائح النهائية بين المنظمين والأهداف الشروط الثلاثة التالية: 1) يوجد تفاعل مستهدف متوقع أو تفاعل مدعوم تجريبيًا 2) يجب أن يكون معامل الارتباط بين ميرنا وأهدافه سالبًا 3) القيمة المطلقة لمعامل الارتباط هي أكبر من القطع.

اختيار حدود معاملات الارتباط

هناك نوعان من المنظمين في GRN و TFs و miRNAs ، ووجدنا أن قوة التنظيم تختلف بين الاثنين. إذا تم فصل GRN إلى شبكة حيث تتصرف TFs فقط كمنظمين ، وشبكة حيث تكون miRNAs فقط هي المنظم ، بموجب نفس قطع الارتباط ، يكون عدد miRNAs أقل بكثير من عدد TFs (الشكل & # x200B (الشكل 1 ). 1). على سبيل المثال ، عندما يتم تعيين القطع للقيمة المطلقة للارتباط بين المنظمين والأهداف على 0.6 ، يكون عدد TFs هو 101 ، بينما يتم الاحتفاظ بعشرة miRNAs فقط في GRN. إذا أخذنا نفس القطع لكل من TFs و miRNAs ، فسيكون هناك فرق كبير بين عدد هذين النوعين من المنظمين ، ويكون GRN النهائي متحيزًا للغاية لصالح TFs. ربما يكون الاختلاف في آلية TFs و miRNAs لتنظيم النسخ هو السبب وراء قوة التنظيم المختلفة. نتيجة لذلك ، تم اختيار قطع علاقات الترابطات حيث تكون TFs هي المنظمين والقطع لعلاقات الترابط حيث تكون miRNAs هي المنظمين بشكل مستقل.

عدد المنظمين في GRN ، حيث يتم أخذ TFs أو miRNAs فقط كمنظمين.

تمت معالجة اختيار القطع من خلال معيار طوبولوجي [24] ، مما يعني أن GRN النهائي يجب أن يكون خاليًا من المقياس تقريبًا. تعتبر الشبكة الخالية من المقاييس شائعة في الشبكات البيولوجية حيث تتصل كمية صغيرة جدًا من العقد بالعديد من العقد المجاورة ، بينما تحتوي الغالبية المتبقية من العقد على وصلات صغيرة للغاية [25]. تسمى العقد التي تحتوي على عدد كبير من الاتصالات بالعقد المحورية وهي مهمة داخل الشبكة. من المعروف أن بعض TFs و miRNAs الهامة تنظم العديد من الأهداف التي تؤدي إلى توليد السرطان ، وهم المنظمون المحوريون في GRNs.

يتم تقييم خصائص الشبكة الخالية من المقاييس من توزيع درجة العقدة. درجة العقدة هي عدد العقد المجاورة التي تتصل بها العقدة مباشرة. في شبكة خالية من المقاييس ، يتم دائمًا تمثيل توزيع الدرجات كتوزيع لقانون السلطة [26] أو توزيع قانون القوة الأسي المقتطع [27]. قمنا بتركيب توزيع الدرجات لـ GRN المبني من قطع مختلفة لمعاملات الارتباط لتوزيع قانون الطاقة والتوزيع الأسي المقتطع لقانون الطاقة. ال ر تم استخدام القيمة 2 لقياس جودة الملاءمة لهذين التوزيعين. نظرًا لأن GRN عبارة عن شبكة موجهة ، يتم تقسيم توزيع الدرجات إلى توزيع داخلي وتوزيع خارجي. يوضح الشكل & # x200B الشكل 2 2 كيف يؤثر قطع القيمة المطلقة للارتباطات ر 2 وحجم GRN. بالنسبة لشبكات GRN حيث تكون TFs فقط جهات تنظيمية ، إذا لم يتم دمج بيانات التعبير (cutoff & # x02009 = & # x020090) ، فإن كلا من التوزيع الداخلي والتوزيع الخارجي لا يعد قانونًا للسلطة (ر 2 & # x02009 & # x02248 & # x020090). بعبارة أخرى ، شبكات GRN المبنية فقط من الشبكات المرشحة ليست خالية من المقاييس ، وبالتالي قد لا يكون لها معنى بيولوجي. يحدث نفس الشرط أيضًا للتوزيع خارج الدرجة لـ GRNs حيث تكون miRNAs فقط هي المنظمين. يسلط الضوء على أهمية استخدام بيانات التعبير. في معظم الظروف ، مع زيادة قطع الارتباط المطلق ، ر 2 يزداد بينما يتناقص حجم GRN ، وبالتالي فإن المقايضة بين الارتفاع ر يتم عمل قيمتين والحجم الصحيح لـ GRN. لقد اخترنا قطعًا بمعيار أن ر تصل القيمة 2 أولاً إلى حالة مستقرة لكل من التوزيع الداخلي والتوزيع الخارجي. في هذه الدراسة ، تم تعيين الحد الفاصل للقيمة المطلقة للارتباط للتفاعلات حيث تكون TFs هي منظمات على 0.6 ، وتم ضبط ذلك بالنسبة لـ miRNAs على 0.45.

اختيار القطع للارتباطات بين المنظمين والأهداف حسب المعيار الطوبولوجي. يمثل الصف الأول GRN حيث تكون TFs فقط هي المنظمين ، بينما يمثل الصف الثاني GRN حيث تكون miRNAs فقط هي المنظمين. يشير القطع إلى القيمة المطلقة لمعامل الارتباط.

نظرة عامة على الشبكة

بعد دمج التفاعلات المستهدفة المتوقعة والتفاعلات المدعومة تجريبياً ونموذج التعبير المشترك ، تم إنشاء الشبكة باستخدام 1844 عقدة. احتوى أكبر مكون متصل على 1691 عقدة (91.7 & # x02009٪ من جميع العقد) وتم استخدامه لتحليل المصب (الشكل & # x200 ب (الشكل 3). 3). احتوت GRN التي تم إنشاؤها من أكبر مكون متصل على 80 miRNAs و 64 TFs و 4199 تفاعلًا ، والتي تتكون من 1111 لائحة من miRNAs إلى الجينات ، و 74 لائحة من TFs إلى miRNAs و 3014 لائحة من TFs إلى الجينات. من بين GRN ، كان هناك 484 تفاعلًا مدعومًا ببيانات تجريبية. يمكن العثور على قائمة الجوار الكاملة لشبكة GRN في ملف إضافي 1.

شبكة تنظيم الجينات في سرطان الكبد. تمثل الألوان المختلفة العقد في وحدات الشبكة المختلفة. يتناسب حجم العقد مع الدرجة الخارجية للعقد. تمثل الحواف السوداء اللوائح في GRN الأساسية ، ويتناسب عرض الحواف في GRN الأساسي مع قيم الحافة الفاصلة المحسوبة من GRN العالمية.

وحدات الشبكة

تمتلك الجينات في الشبكات البيولوجية دائمًا بنية ترتبط فيها الجينات بشكل أوثق [28]. يُطلق على هذا النوع من الشبكات الفرعية اسم وحدة الشبكة أو المجتمع. استخدمنا خوارزميات walktrap [29] للعثور على شبكات فرعية متصلة بكثافة حيث تم أخذ القيم المطلقة للارتباطات كوزن للحواف. أكبر ست وحدات (تمت تغطيتها 79.7 & # x02009٪ من جميع العقد في GRN) موضحة في الشكل & # x200B الشكل 3 ، 3 ، وملخص للوحدات الست مدرج في الجدول & # x200B الجدول 1. 1. يتم توضيح خرائط الحرارة لملف تعريف التعبير للمنظمين والأهداف في الوحدات الست في الشكل & # x200B الشكل 4 4.

الجدول 1

فهرسمقاسالمنظمين الرئيسيينوظائف الجينات المستهدفة
1 419 RUNX3 ، RUNX2 ، POU2AF1 ، POU2F2 ، FLI1 ، BHLHB3 ، PRDM1 استجابة مناعية،
غشاء بلازمي،
تنشيط الخلية
2 328 HAND2، TCF4، FOXF1، FOXF2، ARID5B، FOXL1 منطقة خارج الخلية ،
ارتباط الخلية
3 270 miR-150 و miR-142 و miR-155 و miR-181a و miR-342 و miR-27a و miR-146a و miR-199a و miR-214 و HNF4A ميتوكوندريا
الأكسدة والاختزال،
مغلف الميتوكوندريا
4 152 AR و miR-127 و miR-377 و miR-323 و miR-299 و miR-221 و miR-433 و miR-376a و miR-136 و miR-18a و miR-296 و miR-154 و miR-431 ، ميل -382 ، ميل -369 ، ميل -200 ب الأكسدة والاختزال،
عملية التمثيل الغذائي العامل المساعد ،
عملية التمثيل الغذائي الستيرويد
5 103 NR1I3 ، NR1I2 ، ESR1 الأكسدة والاختزال،
ميكروسوم ،
عملية التمثيل الغذائي للأحماض الدهنية
6 75 E2F1 ، E2F7 دورة الخلية،
الانقسام المتساوي،
كروموسوم،
التجويف النووي
3, 4, 5525NR1I3، miR-150، miR-142، miR-155، miR-181a، AR، NR1I2، miR-342، miR-27a، miR-146a، HNF4A، miR-199a، miR-218، miR-214، miR- 127، miR-132، ESR1، miR-377، SOX4، miR-323، miR-299، miR-221، miR-23aميتوكوندريا
الأكسدة والاختزال،
ملزمة العامل المساعد ،

يتم فرز المنظمين حسب عدد الأهداف. يتم سرد المنظمين الذين ينظمون أكثر من 80 & # x02009٪ من الجينات في كل وحدة. تم تطبيق إثراء علم الجينات بواسطة DAVID لإيجاد الوظائف المشتركة للجينات. حجم كل وحدة يتوافق مع عدد العقد. يمكن العثور على نتائج الإثراء التفصيلية في الملف الإضافي 2.

خريطة الحرارة لقيم التعبير عن الجينات في الوحدات الست. خريطة الحرارة لقيم التعبير عن الجينات في الوحدات الست المحددة في الشبكة الموضحة في الشكل & # x200B الشكل 3. 3. لكل شكل ، تتوافق الصفوف مع الجينات والأعمدة تتوافق مع عينات في خرائط الحرارة. قيم التعبير هي لوغاريتم لقيمة النسبة باستخدام الأساس 2. العمود الأول أمام كل خريطة حرارة هو ر- قيمة كل جين ولون ر- تمثل القيمة ما إذا كان الجين منظمًا (أحمر) أو خاضعًا للتنظيم (أخضر). لكل خريطة حرارة ، يتم توضيح ملف تعريف التعبير للأهداف والمنظمين بشكل منفصل. يتم توضيح التعبير الخاص بالمنظمين المُدرجين في الجدول & # x200B Table1 1 فقط.

بالنسبة لسرطان الكبد الناجم عن التهاب الكبد B ، يتم تثبيط الاستجابة المناعية للمضيف لإزالة مسببات الأمراض غير الطبيعية. ترتبط الجينات المستهدفة في الوحدة 1 ارتباطًا وثيقًا بالاستجابة المناعية ، ومعظم الجينات خاضعة للتنظيم المنخفض. هناك سبعة منظمات رئيسية في الوحدة 1 ، حيث تم تنظيم RUNX3 و POU2AF1 و POU2F2 و FLI1 و PRDM1 بشكل كبير (ص-القيمة & # x02009 & # x0003c & # x020091e-6). تم اقتراح أن يكون RUNX3 مثبطًا للورم ، وغالبًا ما يتم إسكات جينه في السرطان [30]. يعمل POU2F2 ، بعامله POU2AF1 ، كعامل بقاء الخلية في الخلايا المناعية ، ويلعب دورًا مركزيًا في النسخ اللمفاوي النوعي لجينات الغلوبولين المناعي [31]. يمكن أن يؤثر FLI1 على موت الخلايا المبرمج في الخلايا السرطانية [32] ، و PRDM1 هو جين مرشح لقمع الورم مرتبط بجهاز المناعة [33].

عادة ما يتم قمع التصاق الخلايا في السرطانات. انخفاض التصاق الخلايا يسمح للخلايا السرطانية بتعطيل التركيب النسيجي ، مما يؤدي إلى السمات المورفولوجية للأورام الخبيثة [34]. تخضع الجينات المستهدفة في الوحدة 2 المتعلقة بالأنشطة خارج الخلية للتنظيم المنخفض. هناك ستة منظمات رئيسية في الوحدة 2 ، حيث HAND2 و TCF4 و FOXF1 و ARID5B (ص-value & # x02009 & # x0003c & # x020091e-3) خاضعة للتنظيم بشكل كبير ، وتم تنظيم FOXF2 بشكل كبير -القيمة & # x02009 & # x0003c & # x020091e-4). تم الإبلاغ عن HAND2 لتنظيم إعادة تشكيل المصفوفة خارج الخلية [35]. TCF4 هو عامل رئيسي في مسار Wnt ويشارك في تكاثر خلايا سرطان الكبد [36]. تم الإبلاغ عن نقص FOXF1 لتقليل التصاق الخلية [37] ، و FOXF2 مهم لإنتاج المصفوفة خارج الخلية [38].

الميتوكوندريا هي عضية رئيسية في استقلاب الخلية. إنه ليس مصنعًا للطاقة فحسب ، بل إنه ينظم أيضًا مسارات موت الخلايا. في الخلايا السرطانية ، نتيجة للتكاثر السريع ، يتم كبح الفسفرة المؤكسدة بحيث تستهلك الميتوكوندريا كمية أقل من الأكسجين [39]. في نتائجنا ، ترتبط الأهداف في الوحدتين 3 & # x020135 في الغالب بوظائف الميتوكوندريا ، مثل الاختزال التأكسدي والتمثيل الغذائي.من بين المنظمين ، كانت miR-150 و miR-146a و miR-199a و miR-214 جنبًا إلى جنب مع NR1I3 و AR و NR1I2 و ESR1 خاضعة للتنظيم بشكل كبير -value & # x02009 & # x0003c & # x020091e-6) و miR-221 تم تنظيمهما بشكل كبير (ص-القيمة & # x02009 & # x0003c & # x020091e-12). تم الإبلاغ عن MiR-150 لتثبيط سرطان الكبد عن طريق التنظيم السلبي لـ c-Myb [40]. يرتبط تعدد الأشكال في miR-146a بخطر الإصابة بسرطان الكبد [41] ، بينما يستحث miR-199a موت الخلايا المبرمج ويثبط مسار ERK [42]. يحفز MiR-214 بقاء الخلية عن طريق استهداف مسار PTEN / Akt لقمع موت الخلايا المبرمج [43] ، ويساهم الإفراط في التعبير عن mir-221 في تكوين أورام الكبد [44]. يرتبط الأندروجين بـ HCC ، وبالتالي فإن مستقبله ، AR ، يلعب أيضًا دورًا مهمًا [45]. ترتبط NR1I2 و NR1I3 بعملية التمثيل الغذائي للدهون وتوليد سرطان الكبد [46]. أخيرًا ، يرتبط ESR1 بقابلية الإصابة بسرطان الكبد HCC في ناقلات HBV [47].

من السمات الشائعة أن تكاثر الخلايا يتم تنشيطه في الأنسجة السرطانية ، وبالتالي من المتوقع أن يتم تنظيم جميع الجينات المرتبطة بدورة الخلية (الوحدة 6). تم تنظيم اثنين من المنظمين ، E2F1 و E2F7 ، بشكل كبير (ص-value & # x02009 & # x0003c & # x020091e-16) ، وهي TFs معروفة في عائلة E2F التي تتحكم في دورة الخلية [48].

للتلخيص ، تنظيم الجينات معياري حيث أن كل مجموعة من المنظمين تنظم عمليات بيولوجية محددة. بالإضافة إلى ذلك ، فإن هذين النوعين من المنظمين لهما تقسيم واضح للسيطرة. لقد أظهرنا أن miRNAs تتحكم في الوظائف البيولوجية المتعلقة بالميتوكوندريا والاختزال التأكسدي ، بينما تتحكم TFs في الاستجابة المناعية والأنشطة خارج الخلية ودورة الخلية.

الوظائف المرتبطة بـ MiRNA في GRN

للحصول على نظرة ثاقبة حول وظائف miRNAs في GRN ، أجرينا تحليل TAM [49]. تأخذ أداة TAM قائمة من miRNAs ، وتعيد الوظائف المخصبة مقارنةً بالميكروبات البشرية الكاملة. تم سرد نتائجنا للوظائف المرتبطة بـ miRNA المخصب في الجدول & # x200B Table2 2 (FDR & # x02009 & # x0003c & # x020090.01). كما هو متوقع ، ترتبط معظم الوظائف ارتباطًا وثيقًا بالسرطان ، مثل onco-miRNAs وتكاثر الخلايا. أيضًا ، وجدنا أن الوظائف المتعلقة بالاستجابة المناعية يتم إثرائها من أجل miRNAs. ومع ذلك ، وفقًا لتحليلنا لوحدات الشبكة ، فإن TFs مسؤولة بشكل أساسي عن الاستجابة المناعية. من هذا استنتجنا أنه قد تكون هناك آلية تنظم من خلالها miRNAs هذه TFs وتنظم هذه الوظائف المرتبطة بـ TF بشكل غير مباشر. سيتم مناقشة هذا المفهوم في الأقسام التالية بالتفصيل. بالإضافة إلى ذلك ، وجدنا أن miRNAs في GRN غنية جدًا في HCC (ص-value & # x02009 = & # x020095.75e-12 ، باستخدام HMDD [50] كفئة ميرنا).

الجدول 2

إثراء الوظائف المرتبطة ميرنا في GRN

شرطص-القيمةفرانكلين روزفلت
تنظيم الخلايا الجذعية الجنينية البشرية (hESC) 8.46e-14 3.64e-12
إشعال 1.00e-08 2.15e-07
عملية تصنيع كريات الدم 8.00e-08 1.15e-06
موت الخلايا المبرمج 2.70e-07 2.90e-06
ذات الصلة بدورة الخلية 4.90e-07 3.81e-06
تنظيم الهرمونات 5.60e-07 3.81e-06
Onco-miRNAs 6.20e-07 3.81e-06
استجابة مناعية 1.60e-06 8.60e-06
مثبطات ورم ميرنا 2.21e-06 1.06e-05
موت الخلية 4.70e-06 2.02e-05
تمايز الخلايا 2.40e-05 9.39e-05
تولد الأوعية الدموية 3.06e-05 1.10e-04
حركية الخلية 2.34e-04 7.48e-04
الانتقالية الظهارية الوسيطة 2.60e-04 7.48e-04
كمون فيروس نقص المناعة البشرية 2.61e-04 7.48e-04
تنمية الدماغ 2.97e-04 7.99e-04
إعادة عرض الكروماتين 3.36e-04 8.31e-04
الجهاز المناعي 3.48e-04 8.31e-04
التمثيل الغذائي للكربوهيدرات 1.04e-03 2.35e-03
مسار Akt 1.29e-03 2.78e-03
تجديد العظام 1.72e-03 3.53e-03
تكوين القلب 3.13e-03 6.12e-03
تكاثر خلوي3.95e-037.39e-03

شبكة تنظيم الجينات الأساسية

على الرغم من أن كل وحدة شبكة يمكن أن توفر تحكمًا محددًا في الوظائف البيولوجية ، للحفاظ على سلامة نظام البيولوجيا ، فإن التبعية موجودة بين الوحدات. إلى جانب نمطية تنظيم الجينات ، يجب أن تكون هناك آلية مركزية لتنظيم نمط التعبير لكل وحدة على مستوى أعلى. وهكذا ، قدمنا ​​مفهوم GRN الأساسي الذي يحتوي على أهم اللوائح بين المنظمين وسلوكيات ankd كمركز تحكم لـ GRN العالمية.

شبكة GRN الأساسية هي الشبكة الفرعية المستخرجة من GRN العالمية ، حيث العقد في GRN الأساسية هي فقط TFs و miRNAs. تتميز الحواف في GRN الأساسي بأعلى مسافة بين الحواف (أكبر من 99 & # x02009 ٪ كمية) محسوبة من GRN العالمية. يتم تعريف Edge-betweenness من خلال عدد المسارات الأقصر التي تمر عبر حافة في الشبكة ، وفي سياق GRN ، تقيس الحافة البينية عدد الأهداف التي قد يؤثر عليها التنظيم. في جوهر GRN ، كان هناك 32 عقدة و 42 حافة. من بينها ، تم دعم تسعة تفاعلات من خلال التجارب السابقة. على وجه الخصوص ، يمكن الاستدلال على 17 تفاعلًا إضافيًا مدعومًا تجريبيًا من GRN الأساسي بشكل غير مباشر (يمكن العثور على القائمة في ملف إضافي 3). تم توضيح GRN الأساسي في الأشكال & # x200B الأشكال 3 و & # x200B و 5 ، 5 ، ويمكن العثور على القائمة المجاورة لـ GRN الأساسية في الملف الإضافي 4.

شبكة تنظيم الجينات الأساسية. تمثل الألوان المختلفة الوحدات النمطية المختلفة التي تنتمي إليها العقد. لون كل وحدة هو نفس اللون الموضح في الشكل & # x200B الشكل 3. 3. تمثل الحواف السوداء التفاعلات التي تدعمها التجارب.

يغطي عدد الحواف في GRN الأساسي فقط 1.0 & # x02009٪ من جميع الحواف في GRN العالمية ، ولا يؤثر حذف هذه الحواف على اتصال GRN العالمي. وبالتالي ، يمكن استنتاج أن السمات المحلية للشبكة لن تتأثر بشبكة GRN الأساسية. ومع ذلك ، فإن مجموع المسافة بين الحافة يستهلك 65.8 & # x02009 ٪ من مجموع الحافة البينية في GRN العالمية. هذا يعني أن معظم المعلومات يتم التحكم فيها بواسطة شبكة GRN الأساسية ، وستؤثر على معظم العقد في GRN العالمية. عند حذف هذه الحواف المهمة ، سيتم تغيير السمات العامة للشبكة وسيكون النظام عرضة للفشل.

الدور الأساسي GRN & # x02019 له جانبان. أولاً ، يقوم بتعديل الشبكة التنظيمية على المستوى الأعلى. يقسم الشبكة بأكملها إلى طبقتين بحدود واضحة. في الطبقة السفلية ، يتم تصنيع البروتينات تحت تنظيم TFs و miRNAs ، لتلعب أدوارًا داخل الخلايا أو خارجها. أثناء وجوده في الطبقة العليا ، يتحكم GRN الأساسي في نوع البروتينات التي سيتم التعبير عنها في أي وقت وفي أي موقع خلوي. نتيجة لذلك ، يتم تنظيم GRN بالكامل كنظام يمكن التحكم فيه وموزع. ثانيًا ، يمكن لشبكة GRN الأساسية تحسين التكرار في الشبكة التنظيمية. يمكن للمنظمين والعلاقات التنظيمية في GRN الأساسي التحكم في أكثر من وحدة واحدة ، وتتأثر لوائح البروتينات غير المنظمة بـ GRN الأساسية من خلال مجموعة متنوعة من المسارات. لذلك ، عندما لا يعمل مسار التنظيم مع بعض البروتينات ، فسيقوم النظام بتعيين مسارات أخرى لمعالجة اللوائح من أجل تجنب الانهيار الكلي الناجم عن جزء صغير من الضرر. بالإضافة إلى ذلك ، يوجد عدد كبير من حلقات التغذية المسبقة والتغذية المرتدة في شبكة GRN الأساسية ، والتي تساهم في مرونة ومرونة واستقرار شبكة GRN الأساسية ، وكذلك في استقرار الشبكة التنظيمية بأكملها.

في GRN الأساسية ، ترتبط معظم الهيئات التنظيمية بالسرطانات. PBX1 [51] ، TWIST1 [52] ، HNF4A [53] ، ERG [54] ، FOXA2 [55] ، NR2F2 [56] ، FLI1 [57] ، GLI2 [58] ، RARB [59] ، RUNX3 [30] ، تم الإبلاغ عن BHLHB3 [60] و RUNX2 [61] و TCF4 [36] و FOXF1 [62] المتعلقة بالسرطانات. بعد الاستعلام عن قاعدة بيانات مرض microRNA البشري (HMDD) [50] ، وجدنا miR-21 [63] ، miR-199a [42] ، miR-155 [64] ، miR-142 [65] ، miR-181a [66] ، miR-146a [41] ، و miR-150 [40] تم الإبلاغ عن وجود جزيئات من الحمض النووي الريبوزي (miRNA) مرتبطة بالسرطانات. على وجه الخصوص ، هناك دليل مباشر على تورط TWIST1 و HNF4A و GLI2 و RARB و RUNX3 و TCF4 و FOXF1 و miR-21 و miR-199a و miR-155 و miR-142 و miR-146a و miR-181a و miR -150 في جيل HCC.

تنظيم مستوى النسخ للمسارات البيولوجية

في النظام الخلوي الكامل ، توجد عدة أنواع من الشبكات البيولوجية: شبكات التمثيل الغذائي التي تحتوي على تفاعلات كيميائية بين المستقلبات والإنزيمات ، وشبكات تفاعل البروتين البروتين التي تحتوي على تعديل البروتين ونقل الإشارات ، وشبكة تنظيم الجينات. الهدف من التحكم في GRN هو تنظيم كمية البروتينات النهائية ، والتأثير بشكل أكبر على تفاعل البروتين والبروتين وشبكات التمثيل الغذائي. بالنسبة لنوع من الشبكات البيولوجية المحددة ، فإن المسارات عبارة عن مجموعة من الجينات والجزيئات التي تعمل معًا في شكل تفاعلات التمثيل الغذائي والبروتين - البروتين للقيام بوظائف بيولوجية معينة. قد يشرح كيف تتأثر المسارات في الأمراض من وجهة نظر التنظيم الجيني للمسارات. وبالتالي ، توقعنا لوائح مسارات KEGG بواسطة GRN. وجدنا مسارات مخصبة من جميع الجينات في GRN ، والمسارات الهامة مذكورة في الجدول & # x200B Table3 3 (FDR & # x02009 & # x0003c & # x020090.05). ترتبط معظم المسارات المخصبة ارتباطًا وثيقًا بسرطان الخلايا الكبدية ، مثل استقلاب الأحماض الدهنية ، المرتبط بالأورام [67] والتصاق الخلايا. مثال على تنظيم مسار التمثيل الغذائي للأحماض الدهنية موضح في الشكل & # x200B الشكل 6 ، 6 ، حيث الجزء العلوي هو مستوى GRN والجزء السفلي هو مستوى المسار. قد يوفر رؤى لشرح كيفية تغيير استقلاب الأحماض الدهنية تحت سيطرة GRN. للاطلاع على اللوائح الخاصة بجميع المسارات المهمة حسب شبكة GRN الأساسية ، يمكن للقراء الرجوع إلى الملف الإضافي 5.


Ahn AC ، Tewari M ، Poon CS ، Phillips RS (2006) التطبيقات السريرية لنهج النظم. بلوس ميد 3: e209

Akutsu T، Miyano S، Kuhara S (2000) استنتاج العلاقات النوعية في الشبكات الجينية والمسارات الأيضية. المعلوماتية الحيوية 16: 727-734

Aldana M (2003) الديناميات المنطقية للشبكات ذات الهيكل الخالي من المقاييس. الظاهرة الفيزيائية اللاخطية 185: 45-66

Aldana M ، Balleza E ، Kauffman S ، Resendiz O (2007) المتانة وقابلية التطور في الشبكات التنظيمية الجينية. J Theor Biol 245: 433-448

Alon U (2007) زخارف الشبكة: النظرية والمقاربات التجريبية. نات القس جينيه 8: 450-461

Astbury WT (1961) البيولوجيا الجزيئية أو بيولوجيا البنية التحتية. طبيعة 190: 1124

Balaji S ، lyer LM ، Aravind L ، Babu MM (2006) الكشف عن بنية موزعة مخفية وراء شبكات تنظيم النسخ الخالية من المقاييس. جيه مول بيول 360: 204-212

Barabási AL (2007) شبكة الطب - من السمنة إلى "المرض". N Engl J Med 357: 404-407

Barash Y ، Calarco JA ، Gao W ، Pan Q ، Wang X ، Shai O ، Blencowe BJ ، Frey BJ (2010) فك شفرة الربط. Nature 465: 53-59

Bartel DP (2009) MicroRNAs: التعرف على الأهداف والوظائف التنظيمية. الخلية 136: 215-233

Basso K، Margolin AA، Stolovitzky G، Klein U، Dalla-Favera R، Califano A (2005) الهندسة العكسية للشبكات التنظيمية في الخلايا البائية البشرية. نات جينيه 37: 382-390

Bergmann FT، Sauro HM (2008) مقارنة نتائج المحاكاة لمحاكيات قادرة على SBML. المعلوماتية الحيوية 24: 1963-1965

Bornholdt S (2005) القليل هو أكثر في نمذجة الشبكات الجينية الكبيرة. Science 310: 449-450

Box GEP، Draper NR (1986) بناء النموذج التجريبي وسطح الاستجابة. جون وايلي وأولاده ، إنك

Brazhnik P، de la Fuente A، Mendes P (2002) شبكات الجينات: كيفية وضع الوظيفة في علم الجينوم. اتجاهات التكنولوجيا الحيوية 20: 467-472

توفر طوبولوجيا شبكة التعبير المشترك للجينات Carter SL و Brechbuhler CM و Griffin M و Bond AT (2004) إطارًا للتوصيف الجزيئي للحالة الخلوية. المعلوماتية الحيوية 20: 2242-2250

Chen T، He HL، Church GM (1999) نمذجة التعبير الجيني باستخدام المعادلات التفاضلية. Pac Symp Biocomput 4: 29-44

Chen TY، Ho JWK، Liu H، Xie X (2009) نهج مبتكر لاختبار برامج المعلوماتية الحيوية باستخدام الاختبار المتحولة. المعلوماتية الحيوية BMC 10:24

Choi JK ، Yu U ، Yoo OJ ، Kim S (2005) تحليل التعايش التفاضلي باستخدام بيانات المصفوفات الدقيقة وتطبيقها على سرطان الإنسان. المعلوماتية الحيوية 21: 4348-4355

Conant GC، Wagner A (2003) التطور المتقارب لدارات الجينات. نات جينيه 34: 264-266

de Jong H (2002) نمذجة ومحاكاة النظم التنظيمية الجينية: مراجعة الأدبيات. J كومبوت بيول 9: 67-103

de la Fuente A (2010) من "التعبير التفاضلي" إلى "الشبكات التفاضلية" - تحديد الشبكات التنظيمية المختلة في الأمراض. اتجاهات جنت 26: 326 - 333

de la Fuente A، Brazhnik P، Mendes P (2002) ربط الجينات: استنتاج شبكات الجينات الكمية من بيانات المصفوفة الدقيقة. اتجاهات جينيه 18: 395-398

de la Fuente A، Bing N، Hoeschele I، Mendes P (2004) اكتشاف ارتباطات ذات مغزى في البيانات الجينومية باستخدام معاملات الارتباط الجزئي. المعلوماتية الحيوية 20: 3565–3574

D’haeseleer P، Wen X، Fuhrman S، Somogyi R (1999) النمذجة الخطية لمستويات تعبير mRNA أثناء تطور الجهاز العصبي المركزي والإصابة. Pac Sym Biocomput 4: 41-52

Dojer N ، Gambin A ، Mizera A ، Wilczynski B ، Tiuryn ​​J (2006) تطبيق شبكات Bayesian الديناميكية على بيانات التعبير الجيني المضطرب. المعلوماتية الحيوية BMC 7: 249

Endy D ، Brent R (2001) نمذجة السلوك الخلوي. طبيعة 409: 391-395

Evans TW، Gillespie CS، Wilkinson DJ (2008) مجموعة اختبار النماذج العشوائية المنفصلة SBML. المعلوماتية الحيوية 24: 285-286

Franke L، van Bakel H، Fokkens L، de Jong ED، Egmont-Petersen M، Wijmenga C (2006) إعادة بناء شبكة جينات بشرية وظيفية ، مع تطبيق لتحديد أولويات الجينات المرشحة الموضعية. Am J Hum Genet 78: 1011-1025

فريدمان إن (2004) استنتاج الشبكات الخلوية باستخدام نماذج بيانية احتمالية. Science 303: 799-805

Friedman N ، Linial M ، Nachman I ، Pe’er D (2000) استخدام شبكات bayesian لتحليل بيانات التعبير. J كومبوت بيول 7: 601-620

Gardner TS، di Bernardo D، Lorenz D، Collins JJ (2003) استنتاج الشبكات الجينية وتحديد الوضع المركب للعمل من خلال التنميط التعبيري. Science 301: 102-105

Gat-Viks I، Tanay A، Raijman D، Shamir R (2006) منهجية احتمالية لدمج المعرفة والتجارب على الشبكات البيولوجية. J Comput Biol 13: 165–181

Glass L، Kauffman SA (1973) التحليل المنطقي لشبكات التحكم البيوكيميائية غير الخطية المستمرة. J Theor Biol 39: 103-129

Goss PJ، Peccoud J (1998) النمذجة الكمية للأنظمة العشوائية في البيولوجيا الجزيئية باستخدام شبكات بيتري العشوائية. Proc Natl Acad Sci USA 95: 6750-6755

Guelzim N ، Bottani S ، Bourgine P ، Képès F (2002) الهيكل الطوبولوجي والسببي للشبكة التنظيمية لنسخ الخميرة. نات جينيه 31: 60-63

هوكينز آر دي ، هون جي سي ، رين بي (2010) الجيل التالي من علم الجينوم: نهج تكاملي. نات ريف جينيه 11: 476-486

Helikar T ، Konvalina J ، Heidel J ، Rogers JA (2008) عملية صنع القرار الناشئة في شبكات تحويل الإشارات البيولوجية. Proc Natl Acad Sci USA 105: 1913-1918

Heymans M ، Singh AK (2003) اشتقاق أشجار النشوء والتطور من تحليل التشابه لمسارات التمثيل الغذائي. المعلوماتية الحيوية 19: i138-i146

Hill AV (1910) التأثيرات المحتملة لتجمع جزيئات الهيموجلوبين على منحنيات تفككه. J Physiol 40: الرابع - السابع

Ho JWK، Charleston MA (2007) نمذجة تطور شبكات تنظيم الجينات. في: وقائع المؤتمر الدولي الثامن حول بيولوجيا الأنظمة (ICSB’07) ، ص 44

Ho JWK، Koundinya R، Caetano T، dos Remedios CG، Charleston MA (2008a) استنتاج نشاط الكريات البيض التفاضلي من المصفوفات الدقيقة للأجسام المضادة باستخدام نموذج متغير كامن. معلومات الجينوم 21: 126 - 137

Ho JWK، Stefani M، dos Remedios CG، Charleston MA (2008b) تحليل التباين التفاضلي للتعبير الجيني وتطبيقه على الأمراض البشرية. المعلوماتية الحيوية 24: i390 – i398

Hofmeyr JHS ، Cornish-Bowden A (1997) معادلة هيل القابلة للانعكاس: كيفية دمج الإنزيمات التعاونية في النماذج الأيضية. Comput Appl Biosci 13: 377–385

Huang S (2004) بالعودة إلى علم الأحياء في بيولوجيا الأنظمة: ما الذي يمكن أن نتعلمه من شبكات الجزيئات الحيوية؟ موجز Funct Genomic Proteomic 2: 279–297

Huang S (2010) تحديد سلالة الخلية في فضاء الدولة: توفر طريقة عرض الأنظمة المرونة للقواعد الكنسية العقائدية. بلوس بيول 8: e1000380

Huang S ، Ernberg I ، Kauffman S (2009) عوامل جذب السرطان: نظرة أنظمة للأورام من ديناميكيات شبكة الجينات ومنظور تنموي. خلية سيمين ديف بيول 20: 869-876

Husmeier D (2003) حساسية وخصوصية استنتاج التفاعلات التنظيمية الجينية من تجارب المصفوفات الدقيقة مع شبكات بايزي الديناميكية. المعلوماتية الحيوية 19: 2271 - 2282

Jiang C ، Pugh BF (2009) تحديد المواقع النووية وتنظيم الجينات: التقدم من خلال علم الجينوم. نات القس جينيه 10: 161 - 172

Kanehisa M، Goto S (2000) KEGG: موسوعة كوتو للجينات والجينومات. الأحماض النووية الدقة 28: 27-30

Karlebach G ، Shamir R (2008) نمذجة وتحليل شبكات تنظيم الجينات. نات ريف مول سيل بيول 9: 770-780

Kauffman S (1969) الاستقرار الأيضي والتكوين اللاجيني في شبكات الجينات المشيدة عشوائيًا. J Theor Biol 44: 167–190

كيلي د ، ساندرز آر (2008) تقييم جودة البرمجيات العلمية. في: وقائع ورشة العمل الدولية الأولى حول هندسة البرمجيات لعلوم وهندسة الحاسبات

Kelley BP ، Sharan R ، Karp RM ، Sittler T ، Root DE ، Stockwell BR ، Ideker T (2003) المسارات المحفوظة داخل البكتيريا والخميرة كما يتضح من محاذاة شبكة البروتين العالمية. Proc Natl Acad Sci USA 100: 11394 - 11399

Kim JR، Yoon Y، Cho KH (2008) تشكل حلقات التغذية الراجعة المقترنة أشكالًا ديناميكية للشبكات الخلوية. بيوفيس جي 94: 359–365

Kitano H (2007a) نهج قائم على المتانة لتصميم الأدوية الموجهة للأنظمة. Nat Rev Drug Design 6: 202-210

Kitano H (2007b) نحو نظرية القوة البيولوجية. مول سيست بيول 3: 137

كولر د ، فريدمان إن (2009) النماذج الرسومية الاحتمالية: المبادئ والتقنيات. مطبعة معهد ماساتشوستس للتكنولوجيا ، كامبريدج

Küffner R ، Petri T ، Windhager L ، Zimmer R (2010) Petri nets with fuzzy logic (pnfl): الهندسة العكسية وتحديد المعاملات. بلوس واحد 5: e12807

Kwon YK، Cho KH (2008) التحليل الكمي للقوة والهشاشة في الشبكات البيولوجية بناءً على ديناميكيات التغذية الراجعة. المعلوماتية الحيوية 24: 987-994

Laird PW (2010) مبادئ وتحديات تحليل مثيلة الحمض النووي على مستوى الجينوم. نات ريف جينيه 11: 191–203

Lander A (2010) حدود التفاهم. بي إم سي بيولوجي 8:40

Lee TI و Rinaldi NJ و Robert F و Odom DT و Bar-Joseph Z و Gerber GK و Hannett NM و Harbison CT و Thompson CM و Simon I و Zeitlinger J و Jennings EG و Murray HL و Gordon B و Ren B و Wyrick JJ ، Tagne JB ، Volkert TL ، Fraenkel E ، Gifford DK ، Young RA (2002) شبكات تنظيم النسخ في خميرة الخميرة. Science 298: 799-804

Liang S ، Fuhrmann S ، Somogyi R (1998) REVEAL ، خوارزمية هندسة عكسية عامة لاستدلال معماريات الشبكات الجينية.Pac Symp Biocomput 3: 18-29

Liang Z ، Xu M ، Teng M ، Niu L (2006) تكشف مقارنة شبكات تفاعل البروتين عن الحفاظ على الأنواع والتباعد. المعلوماتية الحيوية BMC 7:457

Luscombe NM و Babu MM و Yu H و Snyder M و Teichmann SA و Gerstein M (2004) يكشف التحليل الجينومي لديناميكيات الشبكة التنظيمية عن تغييرات طوبولوجية كبيرة. طبيعة 431: 308-312

Ma HW، Kumar B، Ditges U، Gunzer F، Buer J، Zeng AP (2004) شبكة تنظيمية نصية ممتدة من الإشريكية القولونية وتحليل هيكلها الهرمي وزخارف الشبكة. الأحماض النووية الدقة 32: 6643 - 6649

Martin S ، Zhang Z ، Martino A ، Faulon JL (2007) الديناميات المنطقية للشبكات التنظيمية الجينية المستخلصة من بيانات السلاسل الزمنية للمصفوفات الدقيقة. المعلوماتية الحيوية 23: 866-874

Matsuno H ، Doi A ، Nagasaki M ، Miyano S (2000) تمثيل صافي بتري الهجين لشبكة تنظيم الجينات. أعراض باك بيوكومبت 5: 338-349

Mendell JT، Sharifi NA، Meyers JL، Martinez-Murillo F، Dietz HC (2004) ينظم الترصد اللامعقول التعبير عن فئات متنوعة من نسخ الثدييات وكتم الضوضاء الجينومية. نات جينيه 36: 1073-1078

Mendes P، Sha W، Ye K (2003) شبكات الجينات الاصطناعية للمقارنة الموضوعية لخوارزميات التحليل. المعلوماتية الحيوية 19: ii122– ii129

Metzker ML (2010) تقنيات التسلسل - الجيل القادم. نات القس ، جينيه 11: 31-46

Milo R، Shen-Orr S، Itzkovitz S، Kashtan N، Chklovshii D، Alon U (2002) أشكال الشبكة: لبنات بناء بسيطة لشبكات معقدة. Science 298: 824-827

Nagasaki M ، Yamaguchi R ، Yoshida R ، Imoto S ، Doi A ، Tamada Y ، Matsuno H ، Miyano S ، Higuchi T (2006) استيعاب البيانات الجينومية لتقدير شبكة بتري الوظيفية الهجينة من بيانات التعبير الجيني للدورة الزمنية. معلومات الجينوم 17: 46-61

نيومان إم ، باراباسي أل ، واتس دي جي (2006) هيكل وديناميكيات الشبكات. مطبعة جامعة برينستون ، برينستون ، نيوجيرسي

نوبل د (2002) صعود علم الأحياء الحسابي. نات ريف مول سيل بيول 3: 459-463

نوبل د (2008) الجينات والسببية. شركة Phil Trans R Soc A 366: 3001-3015

Ogata H ، Fujibuchi W ، Goto S ، Kanehisa M (2000) خوارزمية مقارنة الرسم البياني الإرشادي وتطبيقها لاكتشاف مجموعات الإنزيمات ذات الصلة وظيفيًا. الأحماض النووية الدقة 28: 4021-4028

Park PJ (2009) ChIP-seq: مزايا وتحديات التكنولوجيا الناضجة. نات القس جينيه 10: 669-680

Pearl J (1988) التفكير الاحتمالي في الأنظمة الذكية. مورجان كوفمان ، ماساتشوستس

Pearl J (2000) السببية: النماذج والمنطق والاستدلال. مطبعة جامعة كامبريدج ، كامبريدج

Pe’er D (2005) تحليل شبكة بايزي لشبكات التشوير: كتاب تمهيدي. Sci STKE 2005: l4

Petri CA (1962) Kommunikation mit automaten. دكتوراه. أطروحة ، Institut für Instrumentelle Mathematik ، بون

Pinney J ، Westhead D ، McConkey G (2003) تمثيلات Petri الصافية في بيولوجيا الأنظمة. شركة Biochem Soc Trans 31: 1513-1515

Quackenbush J (2003) Microarrays - الذنب بالتبعية. Science 302: 240 - 241

Reisig W (1985) شبكات بيتري: مقدمة. دراسات عن علوم الحاسبات النظرية. سبرينغر ، برلين

Reisig W، Rozenberg G (eds) (1998) محاضرات حول شبكات Petri I: النماذج الأساسية. ملاحظات محاضرة في علوم الكمبيوتر. سبرينغر ، برلين

Rodriguez-Caso C، Medina MA، Solé RV (2005) طوبولوجيا ، ترقيع وتطور شبكة عامل النسخ البشري. FEBS J 272: 6423–6434

Sachs K ، Perez O ، Pe’er D ، Lauffenburger DA ، Nolan GP (2005) شبكات إشارات البروتين السببية المستمدة من بيانات خلية مفردة متعددة العوامل. Science 308: 523-529

Salgado H، Gamma-Castro S، Peralta-Gil M، Díaz-Peredo E، Sánchez-Solano F، Santo-Zavaleta A، Martínez-Flores I، Jiménez-Jacinto V، Bonavides-Martinez C، Segura-Salazar J، Martínez- Antonio A ، Collado-Vides J (2006) RegulonDB (الإصدار 5.0): الإشريكية القولونية K-12 شبكة تنظيم النسخ ، وتنظيم التشغيل ، وظروف النمو. الأحماض النووية الدقة 34: D394-D397

Sandelin A، Alkema W، Engstrom P، Wasserman WW، Lenhard B (2004) JASPAR: قاعدة بيانات مفتوحة لملفات تعريف ارتباط عامل النسخ حقيقية النواة. الأحماض النووية الدقة 32: D91-D94

Schaefer CF، Anthony K، Krupa S، Buchoff J، Day M، Hannay T، Buetow KH (2009) PID: قاعدة بيانات تفاعل المسار. الأحماض النووية الدقة 37: D674-D679

شوارتز آر (2008) النمذجة والمحاكاة البيولوجية. مطبعة معهد ماساتشوستس للتكنولوجيا ، كامبريدج

Segal E ، Wang H ، Koller D (2003) اكتشاف المسارات الجزيئية من تفاعل البروتين وبيانات التعبير الجيني. المعلوماتية الحيوية 19: i264 – i272

Sharan R، Ideker T (2006) نمذجة الآلات الخلوية من خلال مقارنة الشبكات البيولوجية. Nat Biotechnol 24: 427-433

Shen-Orr SS، Milo R، Mangan S، Alon U (2002) زخارف الشبكة في شبكة تنظيم النسخ الخاصة بـ الإشريكية القولونية. نات جينيه 31: 64-68

Smith VA و Jarvis ED و Hartemink AJ (2003) تأثير طوبولوجيا الشبكة وجمع البيانات على استدلال الشبكة. Pac Symp Biocomput 8: 164–175

Steggles LJ، Banks R، Shaw O، Wipat A (2007) النمذجة النوعية وتحليل الشبكات التنظيمية الوراثية: نهج شبكة باتري. المعلوماتية الحيوية 23: 336–343

Stolovitzky G ، Monroe D ، Califano A (2007) حوار حول تقييم الهندسة العكسية وطرقها: حلم استدلال المسار عالي الإنتاجية. Ann N Y Acad Sci 1115: 1–22

Strahl BD، Allis CD (2000) لغة تعديلات هيستون التساهمية. طبيعة 403: 41-45

Strogatz SH (2001) استكشاف الشبكات المعقدة. طبيعة 410: 268-276

Sutherland H، Bickmore WA (2009) مصانع النسخ: التعبير الجيني في النقابات؟ نات القس جينيه 10: 457-466

Suzuki MM ، Bird A (2008) المناظر الطبيعية لميثيل الحمض النووي: رؤى استفزازية من علم اللاجين. نات ريف جينيه 9: 465-476

Szallasi Z ، Stelling J ، Periwal V (محرران) (2006) نمذجة النظام في بيولوجيا الخلية: من المفهوم إلى الصواميل والمسامير. مطبعة معهد ماساتشوستس للتكنولوجيا ، كامبريدج

Tong AHY ، Lesage G ، Bader G ، Ding H ، Xu H ، Xin X ، Young J ، Berriz GF ، Brost RL ، Chang M ، Chen YQ ، Cheng X ، Chua G ، Friesen H ، Goldberg DS ، Haynes J ، Humphries C ، He G، Hussein S، Ke L، Krogan N، Li Z، Levinson JN، Lu H، Menard P، Munyana C، Parsons A، Ryan O، Tonikian R، Roberts T، Sdicu AM، Shapiro J، Sheikh B، Suter B و Wong SL و Zhang LV و Zhu H و Burd CG و Munro S و Sander C و Rine J و Greenblatt J و Roth FP و Brown GW و Andrews B و Bussey H و Boone C (2004) رسم الخرائط العالمية للتفاعل الجيني للخميرة شبكة الاتصال. Science 303: 808-813

Trusina A ، Sneppen K ، Dodd IB ، Shearwin KE ، Egan JB (2005) المحاذاة الوظيفية للشبكات التنظيمية: دراسة العاثيات المعتدلة. PLoS Comput Biol 1: e74

Vaske CJ، Benz SC، Sanborn JZ، Earl D، Szeto C، Zhu J، Haussler D، Stuart JM (2010) استنتاج أنشطة المسار الخاصة بالمريض من بيانات جينوم السرطان متعدد الأبعاد باستخدام PARADIGM. المعلوماتية الحيوية 26: i237 – i245

Wagner A (2000) المتانة ضد الطفرات في الشبكات الوراثية للخميرة. نات جينيه 24: 355–361

Wagner A (2003) كيف يتطور الهيكل العالمي لشبكات تفاعل البروتين. Proc R Soc Lond B 270: 457–466

Wang Z ، Gerstein M ، Snyder M (2009) RNA-Seq: أداة ثورية للنسخ. نات ريف جينيه 10: 57-63

Wolfe CJ، Kohane IS، Butte AJ (2005) يكشف المسح المنهجي عن قابلية التطبيق العام لـ "الذنب بالارتباط" داخل شبكات التعايش الجيني. المعلوماتية الحيوية BMC 6: 227

Xie X، Ho JWK، Murphy C، Kaiser G، Xu B، Chen TY (2009) تطبيق الاختبار المتحولة على المصنفات الخاضعة للإشراف. في: وقائع المؤتمر الدولي التاسع حول جودة البرمجيات (QSIC’09). ص 135 - 144

Zhang B ، Horvath S (2005) إطار عام لتحليل شبكة التعبير المشترك للجينات الموزونة. ستات أبل جينيت مول بيول 4:17

Zou M ، Conzen SD (2005) نهج شبكة بايز الديناميكية الجديدة (DBN) لتحديد شبكات تنظيم الجينات من بيانات مصفوفة دقيقة للدورة الزمنية. المعلوماتية الحيوية 21: 71-79


مقدمة

التواصل والتفاعل بين الأنظمة والأعضاء الفسيولوجية هو جوهر علم وظائف الأعضاء (جانونج ، 1969 باشان وآخرون ، 2012 بارتش وآخرون ، 2015 إيفانوف وآخرون ، 2016). ينتج عن هذا التكامل بين الكائنات الحية ككل تعقيد متأصل في الظواهر الفسيولوجية (Burggren et al. ، 2005) التي لها آثار على سلوك الأنظمة الفسيولوجية في الصحة والمرض. على سبيل المثال ، أصبح من الواضح أن حدوث الأمراض في نفس الفرد (الاعتلال المشترك) يحدث في كثير من الأحيان أكثر مما هو متوقع من الانتشار الفردي لكل مرض عن طريق الصدفة وحدها (Alberti et al. ، 2009). بالإضافة إلى ذلك ، عند وجود حالة مرضية مصاحبة ، عادة ما يكون التعبير السريري لكل مرض فردي أكثر صعوبة في العلاج ويرتبط بنتائج أسوأ (Wu et al. ، 2019). على الرغم من أن هذه الملاحظات شائعة في الممارسة الطبية ، إلا أنه يتم النظر إلى عدد قليل نسبيًا من الحالات الصحية من منظور واسع. بعض الأمثلة الأكثر شيوعًا هي متلازمة التمثيل الغذائي (Alberti et al. ، 2009) ، وثلاثية الربو والسمنة والسكري (Wu et al. ، 2019). تستخدم المنهجية السائدة في تشخيص الأمراض وعلاجها نهجًا اختزاليًا لعلم وظائف الأعضاء ، حيث يتم دراسة متغيرين على الأكثر في وقت واحد. يمثل هذا تحديًا فوريًا لدراسة الأمراض المصاحبة المعقدة حيث تشارك عدة أنظمة فسيولوجية. النموذج الناشئ لهذه المشكلة هو منظور بيولوجيا الأنظمة ، حيث يتم تصور الكائن الحي كنظام مفتوح يتكون من مكونات متفاعلة (Von Bertalanffy ، 1968). يولد تكامل مكونات الجسم هذه حالات فسيولوجية يمكن دراستها في الصحة والمرض من خلال مناهج التعقيد (Ivanov et al. ، 2016). طريقة تمثيل وتصور النظم من خلال الشبكات. يسهل هذا النهج تصور وتحليل عدد كبير من التفاعلات المحتملة (Pavlopoulos et al. ، 2011). تم تطبيق الشبكات في مجالات علمية متنوعة للغاية ، بما في ذلك الاقتصاد وعلم الاجتماع والبيئة ، وتم تعميمها مؤخرًا لدراسة العلوم الطبية الحيوية (Albert and Barab & # x00E1si، 2002 Boccaletti et al.، 2006). حاليًا ، تقتصر معظم مناهج تحليل الشبكة في العلوم الطبية الحيوية على مجموعات البيانات المتجانسة ، أي حيث تكون جميع المتغيرات والتفاعلات من نفس النوع ، على سبيل المثال ، شبكات التعبير الجيني التفاضلي. ومع ذلك ، لا يتم بناء علم وظائف الأعضاء من التفاعلات بين المكونات التي هي كلها من نفس النوع. تم تطوير بعض الأساليب الجديدة لمعالجة الشبكات الفسيولوجية حيث يتم إظهار التكامل الفسيولوجي للأنظمة المختلفة داخل الكائن الحي من خلال تحليل السلاسل الزمنية (Ivanov and Bartsch ، 2014). قد تشارك المقاييس الزمنية المتعددة في تفاعلات فسيولوجية مختلفة وقياساتها (Bartsch et al. ، 2014). على سبيل المثال ، تحدث بعض التفاعلات الفسيولوجية في ثوانٍ ويتم قياسها بدقة كبيرة في أجزاء من الثواني. تحدث التفاعلات الفسيولوجية الأخرى في دورات من الأيام أو الأشهر ويمكن قياسها كميا فقط كقياسات نقطة معزولة وليس بشكل مستمر كسلسلة زمنية (Barajas-Mart & # x00EDnez et al. ، 2020). علاوة على ذلك ، في حين يتم إنشاء الشبكات عادةً من خلال روابط مرتبطة بتفاعلات معروفة تم التحقق منها تجريبياً ، مثل موسوعة كيوتو للجينات والجينوم ، KEGG (Ogata et al. ، 1999) ، فمن المحتمل أن تظل بعض التفاعلات المهمة في الأنظمة البيولوجية موجودة غير معروف. تسمح منهجية شبكات الاستدلال المعقدة ببناء الشبكات حيث يتم استنتاج الروابط ، بدلاً من مراقبتها مباشرة. شبكات الارتباط هي طريقة شائعة وواسعة الانتشار لعمل مثل هذه الاستنتاجات (Batushansky et al. ، 2016) التي يمكن التحقق منها لاحقًا من خلال الدراسات الميكانيكية التقليدية. يوفر نهج الشبكة أيضًا مستوى جديدًا من الدراسة حيث تظهر الخصائص العالمية للنظام ، التي لا تظهر على المستوى المحلي ، من تفاعلات المكونات المتعددة. تم الكشف عن هذه التفاعلات من خلال التغييرات في الطوبولوجيا والاتصال (Ivanov and Bartsch ، 2014).

تعد كيفية التعامل مع مجموعات البيانات متعددة المتغيرات لتوليد نظرة ثاقبة في علم وظائف الأعضاء مجالًا قيد التطوير. تحليل المكونات الرئيسية (PCA) وتحليل الشبكة هما طريقتان حاليتان لتحليل البيانات تم نقلهما إلى علم الأحياء من مجالات علمية أخرى (Liu et al. ، 2015 Asada et al. ، 2016). يمكن استكشاف الاقتران بين المتغيرات الفسيولوجية من خلال التغيير في التغاير الملحوظ في عينات مختلفة (Hofer and Sliwinski ، 2001). بالنسبة لشبكات الارتباط ، يمكن العثور على ارتباط بين تلك المتغيرات التي تتفاعل بشكل مباشر أو غير مباشر داخل الشبكة الفسيولوجية. هنا ، تم تصميم الشبكة الفسيولوجية على أنها ارتباط مستمر لأزواج من المتغيرات. بالنسبة لنموذج الارتباط هذا ، تم إنشاء مصفوفة ارتباط للمعلمات الفسيولوجية المختارة. غالبًا ما تكون هذه المتغيرات ذات طبيعة مختلفة ، أيونات في المحلول ، قوى ميكانيكية وهرمونات. تفاعلاتهم هي أيضًا من أنواع مختلفة ، مباشرة وغير مباشرة ، من خلال آليات فسيولوجية مختلفة جدًا. باختصار ، ترتبط المتغيرات الفسيولوجية على طول كل طيفها المعقول بيولوجيًا. في هذا السيناريو ، توجد الارتباطات بين المعلمات حتى بالنسبة للقيم الصحية وتمثل سلسلة متصلة. من منظور بيولوجيا الأنظمة ، فإن بنية الشبكة هي نتيجة مباشرة للتنسيق ، أو عدم التنسيق ، للمكونات المرتبطة بالتغذية الراجعة التماثلية (Goldstein ، 2019). على سبيل المثال ، في التغذية الراجعة السلبية البسيطة ، يتم اكتشاف تغيير في متغير منظم بواسطة مقارن في الكائن الحي والذي من خلال متغيرات المستجيب يقاوم الاضطراب (Fossion et al. ، 2018). تؤدي هذه المتغيرات ، جنبًا إلى جنب مع متغيرات المخزن المؤقت ، إلى التباين المشترك لمتغيرات متعددة في النظم البيولوجية.

الهدف من هذا العمل هو إنشاء سير عمل سائد لتطوير الشبكات الفسيولوجية من مجموعات البيانات غير المتجانسة بما في ذلك الغدد الصماء والميكانيكية والكيميائية الحيوية والقياسات البشرية والعلامات الحيوية والعناصر الخلوية التي يمكن الوصول إليها بسهولة ويتم استخدامها بالفعل دون منظور شامل. في هذه المساهمة ، قمنا ببناء شبكة فسيولوجية للأشخاص الضابطين (الشباب ، بدون أعراض ، المشخصين سريريًا على أنهم يتمتعون بصحة جيدة) من البيانات الفسيولوجية والكيميائية الحيوية والقياسات البشرية.


طوبولوجيا الشبكة

غالبًا ما تكشف طوبولوجيا الشبكة عن معلومات حول أهميتها البيولوجية. غالبًا ما تتبع الشبكات الأنماط والقواعد ولديها هيكل محدد يسمح للعلماء بإجراء تحقيق أعمق نحو استخراج المعرفة.

خالٍ من المقاييس أو شبكات العالم الواقعي بخلاف ذلك تصف الشبكات الطبيعية مثل المجتمعات عبر الإنترنت (مثل Facebook) حيث تكون العقد هي الأشخاص وحدود الاتصال بينهم ، أو شبكات مثل شبكة الويب العالمية (www) حيث تكون العقد عبارة عن صفحات ويب فردية والروابط هي ارتباطات تشعبية. تمتلك العديد من الشبكات البيولوجية أيضًا خصائص خالية من المقاييس ، حيث تمثل العقد الكيانات الحيوية وتحيط التفاعلات بينها (مثل البروتينات التي تتفاعل جسديًا أو المستقلبات التي تشارك في نفس التفاعل) [73 ، 93 ، 100]. افترض أن ك هو عدد الروابط التي تنشأ من عقدة معينة و ف (ك) احتمالية تساوي درجة الرأس المختار عشوائيًا ك، شبكة خالية من المقاييس تعرض توزيع قانون السلطة ص(ك)

ك -أين γ يدل على الأس درجة. يمكن إنشاء شبكة خالية من المقاييس عن طريق إضافة العقد تدريجياً إلى شبكة موجودة وإدخال روابط إلى العقد الحالية ذات المرفقات التفضيلية بحيث يكون احتمال الارتباط بعقدة معينة أنا يتناسب مع عدد الروابط الموجودة ك أنا أن العقدة. وبالتالي اتصال عقدة واحدة أنا إلى أي عقدة أخرى ي يجب أن تتبع القاعدة تقريبًا:.

ال توزيع الدرجات P (k) أصبح أحد أبرز الخصائص في طوبولوجيا الشبكة. من حيث التقدير العددي ، فإن الخاصية الأكثر موثوقية ، والتي تشبه إلى حد كبير السابقة ، هي توزيع درجات تراكمي ص ج (ك). لتوزيع قانون السلطة ص(ك)

ك - يكون التوزيع التراكمي للدرجات بالصيغة ص(ك)

ك (-γ-1) ويصف احتمالية حصول العقدة المختارة عشوائيًا في الشبكة على درجة أكبر من ك. على الرغم من إجراء الكثير من الأبحاث حول تحليل قانون القوة في الشبكات البيولوجية ، إلا أنها لا تزال غير مقبولة على نطاق واسع من قبل المجتمع العلمي [101].

لتمثيل خصائص الشبكة بصريًا ، نقوم عادةً بترتيب الرؤوس وفقًا لدرجةها ثم نرسم الدرجة مقابل رتبة كل قمة. تمثيل آخر هو إنشاء مدرج تكراري عن طريق رسم رؤوس الرسم البياني مرتبة حسب درجتها باستخدام مقياس لوغاريتمي. التمثيل الثالث والشائع جدًا هو رسم درجات العقد المصنفة مقابل توزيع درجاتها ف (ك) أو توزيع درجاتهم التراكمي ص ج (ك). تحليل مثير للاهتمام لمعظم هذه الخصائص في مختلف شبكات PPI ، الأيضية أو النسخية للعديد من الكائنات الحية (S. cerevisiae, جرثومة المعدة, C. ايليجانس) في [100].

شبكة تسمى متنوع إذا كانت الرؤوس ذات الدرجة الأعلى تميل إلى الاتصال بالرؤوس الأخرى التي تتمتع أيضًا بدرجة عالية من الاتصال ، فإن إحدى هذه الفئات هي الشبكات الاجتماعية [102]. إذا كانت الرؤوس ذات الدرجة الأعلى تميل إلى الاتصال بالرؤوس الأخرى بدرجة منخفضة ، فسيتم استدعاء الشبكة تحريضي. هذه سمة لمعظم شبكات التفاعل الجزيئي ، حيث تميل المحاور إلى الارتباط بالعقد مع عدد أقل من شركاء التفاعل بدلاً من المحاور الأخرى [103 ، 104]. يناقش نيومان [102] هذه الخاصية لشبكات تفاعل البروتين والشبكات العصبية وشبكات الغذاء.

لربط درجات عقدتين أنا و ي نستخدم توزيع احتمالية مشترك ص (ك أنا ، ك ي ) = ف (ك أنا ) ف (ك ي ). هناك طريقة أكثر وضوحًا تتمثل في استخدام معامل ارتباط بيرسون (PCC) ، والذي يحدد الارتباط أو الاعتماد الخطي بين متغيرين (في هذه الحالة ، درجات عقدتين). بمعنى آخر ، يقيس إلى أي مدى يزيد / ينقص متغير واحد مع زيادة الآخر. PCC (قيمة ص) بين عقدتين يتم تعريفهما على أنهما التغاير بين العقدتين مقسومًا على ناتج انحرافاتهما المعيارية. بالنسبة للشبكة بأكملها ، يُعد معامل التشكيلة مقياسًا لمدى تنوع أو تشتيت الشبكة بشكل عام. لو م هو عدد الحواف و x أنا و ذ أنا درجات الرؤوس على طرفي الحافة أنا، معامل الصنف ص يحسب على النحو التالي [102]:

هذا يعادل معامل ارتباط بيرسون للدرجات عند طرفي الحافة. نطاق ص- القيم بين +1 و -1 ، ص & lt 0 المطابق لشبكة تحطيم بينما r & gt 0 لشبكة متنوعة. هناك طريقة أخرى لربط الدرجات وهي حساب متوسط ​​درجة الجار. لكل قمة أنا، يتم حساب متوسط ​​درجة جارتها على النحو التالي. ثم يتم حساب متوسط ​​القيم لجميع القمم بنفس الدرجة ك، تظهر متوسط ​​درجة الجار ك nn (ك).


نتائج

نمذجة أنماط التأثير في الشبكات البيولوجية.

عندما يكون تركيز أحد الأنواع البيولوجية مضطربًا ، يمكن أن ينتشر الاضطراب على طول التفاعلات والتفاعلات الفيزيائية ، ويصل إلى أجزاء أخرى من التفاعل (الشكل 1).أ). يتنبأ النهج الطوبولوجي البحت بانتشار موحد عبر الشبكة: الجيران الأوائل هم الأكثر تضررًا ، يليهم الجيران الثانيون ، وهكذا. في الواقع ، يخضع كل تفاعل لمعادلة ديناميكية محددة مع مجموعة مرتبطة من المعلمات ، مما يسمح بحساب دقيق لانتشار التأثير. يجب أن نأخذ في الاعتبار الديناميكيات الكاملة لتحديد الاتجاه الدقيق والمعدل الذي ينتشر به الاضطراب داخل الشبكة.

أنماط التأثير في الشبكات البيولوجية. (أ) تشكل التفاعلات المتعددة بين المكونات الخلوية الشبكة الفرعية أو التفاعلية. يعد تخطيط الروابط بين هذه الكيانات الخطوة الأولى الضرورية لفهم كيفية انتشار الاضطرابات في الشبكة. في الجزء العلوي من بنية الشبكة ، يتم الحصول على الديناميكيات عند إضافة معرفة اتجاه الارتباط والعلامة والمعلمات الحركية. يقدم النموذج البيوكيميائي الكامل الناتج أفضل نموذج تنبؤي لانتشار التأثير. (به) تمثيلات تخطيطية تصور انتشار اضطراب في شبكة بيولوجية وفقًا لنماذج DYNAMO المختلفة لتقليل التعقيد. يمكن العثور على وصف مفصل للنماذج في أساليب.

نحن هنا نتحرى عن الدرجة التي يمكن بها استرداد هذه الأنماط الديناميكية من النماذج الطوبولوجية البسيطة. لتحقيق هذا الهدف ، نستكشف العديد من نماذج انتشار التأثير مع زيادة التعقيد ، سواء من حيث دقة تمثيل طوبولوجيا الشبكة الأساسية ومن حيث النموذج الديناميكي المستخدم (الشكل 1). به و أساليب). نصف طوبولوجيا الشبكة من حيث أربع طبقات من التعقيد المتزايد: (أنا) شبكة غير موجهة ، (ثانيا) شبكة موجهة ، (ثالثا) شبكة موجّهة وموقّعة (تفعيل / منع) ، و (رابعا) شبكة موجهة وموقعة ومرجحة. لتوضيح هذه الطبقات ، ضع في اعتبارك نوعين متفاعلين A و B ، حيث تؤدي الزيادة في A إلى زيادة B بينما لا يؤثر التغيير في B على A.أنا) يتفاعل A و B (وجود ارتباط) ، (ثانيا) يتسبب أ في تغيير تركيز ب (اتجاه التأثير) ، (ثالثا) يتسبب أ في تغيير إيجابي في تركيز (علامة) ب ، و (رابعا) يتسبب A في حدوث تغيير إيجابي في تركيز B لقوة معينة (يتم تحديد الحجم بواسطة معلمات وزن الرابط ، مثل الثابت الحركي). يمكن استخراج كل هذه المعلومات من المصفوفة اليعقوبية للنظام (أساليب) ، والذي يحدد الدرجة التي يؤدي عندها التغيير في تركيز A إلى حدوث تغيير في تركيز B ، واتجاه التغيير (موجب للزيادة أو سلبي للنقص). في هذا العمل ، تم إنشاء المصفوفة اليعقوبية من الأنظمة الأساسية للمعادلات الديناميكية التي تميز النموذج البيولوجي. ثم يتم استخدام المصفوفة اليعقوبية الموقعة لإعادة بناء الهيكل الأساسي الموزون للنماذج البيولوجية ، مما يسمح لنا بالتقاط طوبولوجيا النوع أنا إلى ثالثا. طوبولوجيا النوع رابعا، المبني من مصفوفة يعقوبي الكاملة ، يحتوي على معلومات المعلمات الحركية وبالتالي يتوافق مع النموذج البيوكيميائي الكامل. لذلك ، من المصفوفة اليعقوبية نستخرج كلا من الهيكلية وديناميكيات الاضطراب للنماذج المدروسة.

بالنظر إلى طوبولوجيا الشبكة (مخطط الأسلاك) ، نود أن نتنبأ بكيفية انتشار اضطراب نوع معين عبر الشبكة ودرجة تأثيره على جميع الأنواع الأخرى. عادة ما يتم تمثيل أنماط الاضطراب هذه - التي نسميها أنماط التأثير - بمصفوفة الحساسية - وتسمى أيضًا مصفوفة الاستجابة الخطية أو مصفوفة الارتباط في الأدبيات (27) - تصف التغيير في قيمة الحالة المستقرة xi للعقدة i عندما تتنوع قيمة الحالة المستقرة xj لعقدة أخرى j (27 ، 28): S ij = dxidxj. [1] إذا كانت المعادلات الديناميكية معروفة ، يمكن اشتقاق مصفوفة الحساسية بشكل تحليلي باستخدام إطار مضطرب (17 ، 27) (أساليب). فيما يلي نشير إلى مصفوفة الحساسية الدقيقة هذه باسم "النموذج البيوكيميائي (الكامل)" ، وهو النموذج الأساسي الذي يتم حسابه من خلاله (الشكل 1).ب).

نستكشف ثلاثة نماذج لتقليل التعقيد لحساب مصفوفة الحساسية باستخدام المعلومات الطوبولوجية فقط (الشكل 1 جه). نشير إليهم باسم DYNAMO:

أنا) نبدأ بـ "نموذج الانتشار" (الشكل 1ج) المقترحة في سياق تحديد أولويات الجينات المرضية ، حيث ينتشر "التأثير" من مجموعة جينات البذور المعروفة لتسليط الضوء على جينات الأمراض المفترضة (29). في حالتنا ، الأنواع المضطربة هي جينات بذرية ونريد إعطاء الأولوية لمستوى الاضطراب للأنواع الأخرى. في هذا النموذج ، يكون الاضطراب المتوقع للعقدة متناسبًا مع مجموع الدرجات المرجحة لاضطرابات جيرانها ، مع إضافة مصطلح إدخال ثابت للعقدة "المصدر" التي تتعرض للاضطراب. لقد ثبت أن نموذج الانتشار هذا يتفوق على خوارزمية المشي العشوائي في إعطاء الأولوية لجينات المرض عبر 1369 مرضًا (29).

ثانيا) "نموذج المسافة" (الشكل 1د) يفترض أن قوة الاضطراب تتناسب عكسًا مع مسافة الشبكة بين الأنواع ومصدر الاضطراب ، أي مع عدد التفاعلات التي يحتاجها أحد الأنواع للتأثير على التعبير عن نوع آخر. مثل هذا النموذج له أهمية كبيرة لأن مسافة الشبكة في التفاعل هو مؤشر رائع للتشابه بين الأمراض (7) والارتباط بين الأدوية والأمراض (30).

ثالثا) نموذج "الجار الأول" الأدنى (الشكل 1ه) يفترض أن الاضطراب يصل فقط إلى الجيران المباشرين للعقدة المضطربة. وقد أثبت تأثير الجار المباشر هذا ، والذي يُطلق عليه أيضًا "فرضية التأثير المحلي" (31) ، أنه مفيد للتنبؤ بجينات المرض (32) ويقع في صميم نهج التحكم في المجموعة الدنيا المسيطرة (MDS) ، حيث تكون مجموعة الحد الأدنى من العقد تم تحديده بحيث يكون لجميع العقد الأخرى في الشبكة تفاعل مباشر مع عقدة MDS وبالتالي يمكن "التحكم فيها" أو التأثير عليها بشكل مناسب. تم تطبيق بروتينات MDS الناتجة على تفاعل البروتين والبروتين ، وأظهرت أنها أكثر أهمية ومرتبطة بالمرض من البروتينات غير MDS (33). نظرًا لأن الاضطرابات تؤثر أولاً على الجيران الأوائل للعقد المضطربة ، فإن نموذج الجار الأول هو أقل تقدير تقريبي نستكشفه.

في ما يلي نطبق هذه النماذج على مجموعة متنوعة من النماذج البيوكيميائية جيدة المواصفات.

النماذج الطوبولوجية تتنبأ بدقة بأنماط التأثير في النماذج البيولوجية.

لاختبار صحة النتائج التي توصلنا إليها على مجموعة كبيرة ومتنوعة من الشبكات البيولوجية ، نبدأ من قاعدة بيانات BioModels ، وهي مستودع للنماذج الحيوية والديناميكية المنسقة (أساليب). يتم إيداع النماذج البيولوجية من قاعدة البيانات هذه بتنسيق قياسي يسمح لنا باستخراج المجموعة الأساسية من المعادلات التفاضلية التي تصف ديناميكياتها باستخدام libSBML (34) (الشكل 2).أ). من المعادلات الديناميكية ، نشتق شبكات التأثير من خلال ربط الأنواع i بالنوع j إذا كان التغيير الدائم في تركيز i يؤثر بشكل مباشر على تركيز الحالة المستقرة للأنواع j. للقيام بذلك ، نحسب أولاً المصفوفة اليعقوبية للنظام. كتابة المعادلات الديناميكية كـ x ˙ j = fj (x 1، ...، x N) ، حيث يصف N عدد الأنواع في النموذج و xi هو تركيز الأنواع i ، و Jacobian هو J i ، j = ∂ fj / ∂ xi (x ∗) ، حيث x ∗ هي الحالة المستقرة للنظام (الشكل 2ب). المصفوفة المجاورة A للشبكة تُحسب على شكل A = علامة (J T (x ∗)) ، حيث J T تشير إلى تبديل اليعقوبي للنظام وتطبق وظيفة الإشارة عنصرًا حكيمًا (أساليب والشكل 2ج). في هذا الإطار ، تتوافق الروابط ذات الأوزان السلبية مع التفاعلات المثبطة بينما تشير الأوزان الإيجابية إلى تنشيط التفاعلات. هذا النهج يذكرنا بشبكات الاستدلال (35) ، مع عكس اتجاهات الارتباط بشكل منهجي.

تتنبأ الطوبولوجيا بأنماط التأثير في الشبكات البيولوجية المختلفة. (أنعرض مجموعة من أمثلة المعادلات التفاضلية التي تصف الديناميكيات البيوكيميائية. تتضمن هذه المعادلات المتغيرات المختلفة من النموذج الذي يلتقط البيولوجيا الأساسية للمشكلة. (ب) نشتق مصفوفة يعقوبية J عن طريق تشويش المعادلات التفاضلية حول حالتها المستقرة x *. (ج) نقوم بتحويل المعادلات إلى "شبكة تأثير" حيث يتم إنشاء رابط من الأنواع i إلى j إذا قمت بتغيير تركيز j. هذا يتوافق مع علامة المصفوفة اليعقوبية (أساليب). (د) التمثيل التخطيطي لسير العمل الذي استخدمناه لتقييم قدرة النماذج المختلفة على التنبؤ بأنماط التأثير. تم شرح حساب مصفوفات الحساسية في أساليب. نستخدم معامل ارتباط سبيرمان لمقارنتها مع مصفوفة حساسية "الحقيقة الأساسية" البيوكيميائية. (ه) مخطط شريطي يوضح دقة نماذج الشبكة المختلفة في التنبؤ بأنماط التأثير عبر 87 نموذجًا من BioModels (22). قارنا مصفوفات الحساسية لنماذج مختلفة بمصفوفة الحساسية الكيميائية الحيوية باستخدام ارتباط سبيرمان ، وقمنا بتوسيط الارتباطات الناتجة على جميع النماذج. أشرطة الأخطاء تتوافق مع SE. يُظهر الخط الأحمر المتقطع اثنين من SDs للتوقع العشوائي في المتوسط ​​على جميع النماذج. (F) مخطط شريطي يوضح دقة نماذج الشبكة الموقعة في توقع علامة التأثير عبر 87 نموذجًا من BioModels (22). أشرطة الأخطاء تتوافق مع SE. تظهر الأشرطة الرمادية توقعات عشوائية. (جي) دقة نماذج الشبكة كدالة لنسبة الروابط التي تمت إزالتها ، بمتوسط ​​87 نموذجًا. يتم اختصار أسماء النماذج على النحو التالي: التوزيع ، المسافة F.N. ، الدعامة الأولى للجيران ، الانتشار. تظهر أشرطة الأخطاء SE. (ح) الارتباط بين الخصائص (الأسماء على اليسار) ودقة نموذج الانتشار (d + s) عبر 87 BioModels. تظهر المنطقة الرمادية التوقع العشوائي.

قمنا بتنفيذ 87 نموذجًا من BioModels (Dataset S1 والمرجع 22) ، تم اختيارها بمعيار أن أكبر مكون متصل يحتوي على 10 أنواع على الأقل. لكل نموذج ، يتم حساب حساسيات الكيمياء الحيوية و DYNAMO على النحو التالي (انظر أساليب للحصول على تفاصيل إضافية). بالنسبة للنماذج البيوكيميائية ، يتم الحصول على مصفوفة الحساسية عبر (17 ، 27) S = (I - J) - 1 D (1 (I - J) - 1) ، [2] حيث أنا مصفوفة الهوية و J تشير إلى اليعقوبي مصفوفة النظام حول الحالة المستقرة (أساليب). بالنسبة لنماذج الشبكة ، نبدأ من نشر النماذج أناثالثا من عائلة طراز DYNAMO (الشكل 1 جه). لحساب تأثير العقدة على العقد الأخرى في الشبكة ، نبدأ بتعيين وزن صفر لجميع العقد. نظرًا لاضطراب في العقدة i (الوزن 1) ، ينتشر التأثير إلى العقد الأخرى j في الشبكة ، ويغير أوزانها وفقًا للنماذج المقترحة المختلفة. تشكل مصفوفة التأثير لأي زوج (i ، j) مصفوفة الحساسية. النماذج كالتالي:

أنا) النشر: نوسع منهجية PRINCE لتشمل حالة الشبكات الموجهة والموقعة (29) (أساليب). بالإشارة إلى W المصفوفة المجاورة ، نحدد المصفوفة القطرية D 1 بحيث تكون D 1 (i ، i) هي مجموع القيم المطلقة للصف i من W والمصفوفة D 2 بحيث تكون D 2 (i ، i) مجموع القيم المطلقة للعمود i من W. ثم نحسب أوزان الانتشار المقيسة W ′ = D 1 - 1/2 WD 2-1 / 2 ومصفوفة الحساسية

S = (1 - α) (I - α W ′) - 1 ، [3]

حيث α = 0.9 هي معلمة تميز قوة الانتشار. تتوافق مصفوفة الحساسية هذه مع انتشار اضطراب الوزن 1 لبقية الشبكة.

ثانيا) المسافة: نفترض أن التأثير ينتشر إلى جميع العقد في نفس المكون المتصل مثل العقدة i. في الحالة الموجهة ، يقتصر الانتشار على الروابط الصادرة. تتناقص الأوزان مع المسافة d كـ 1 / (1 + d). نلاحظ أنه لا توجد حالة "موقعة" لنموذج المسافة. في الواقع ، توجد نظريًا عدة مسارات أقصر بنفس الطول تربط أي عقدتين ، وليس من الواضح أيهما يجب اختياره وكيفية نقل إشارات الحافة من المصدر إلى الهدف.

ثالثا) الجيران الأوائل: نفترض أن التأثير ينتشر فقط للجيران المباشرين لـ i ، مع تحديد أوزانهم على 1 (أو 1 للتفاعل السلبي). بالنسبة للشبكات الموجهة ، يتم اعتبار الروابط الصادرة فقط.

تتم مقارنة مصفوفات الحساسية مع تلك المتوقعة من النموذج الكيميائي الحيوي الكامل باستخدام ارتباط سبيرمان (الشكل 2).د و أساليب). يقارن هذا المقياس اللامعلمي رتبة الحساسيات ، وليس قيمها الأولية ، وبالتالي تقييم ما إذا كانت القوة النسبية للاضطرابات محفوظة عبر النماذج. نستخدم القيمة المطلقة للحساسيات بينما نركز على استعادة قوة الاضطرابات ، وليس علاماتها. الصورة 2ه يلخص الارتباطات التي تم الحصول عليها في المتوسط ​​عبر جميع النماذج البيوكيميائية البالغ عددها 87 نموذجًا (انظر الملحق SI، الشكل S1 للتوزيعات الكاملة) ، توثيق تناقص تدريجي للدقة مع تناقص تعقيد نماذج الشبكة. نجد أن نموذج الانتشار ، الذي يعتمد على المعلومات الطوبولوجية فقط ، يحقق 66٪ من الدقة (أي ارتباط سبيرمان ρ = 0.66) في التنبؤ بأنماط التأثير عندما تتضمن الشبكة اتجاه وعلامة الروابط. هذا أفضل قليلاً فقط من الحالة غير الموقعة ، ولكن ليس بشكل ملحوظ (65٪ ، ص = 0.4 تحت الطالب ر اختبار) ، ولكن تحسنًا كبيرًا عن الحالة غير الموجهة (40٪ ، ص = 5.1e-13) ، مما يشير إلى أن التقاط اتجاه التدفق ضروري للدقة التنبؤية. ومن المثير للاهتمام ، أن نموذج المسافة الأبسط على شبكة موجهة يُظهر دقة مماثلة لتلك الخاصة بأفضل نموذج انتشار على شبكة موقعة موجهة (63٪). مرة أخرى ، تنخفض الدقة بشكل كبير في الحالة غير الموجهة إلى مستوى مشابه لنموذج الانتشار غير المباشر (36٪). أخيرًا ، تحقق نماذج الجيران الأولى البسيطة دقة تصل إلى -27٪ ، وهي قيمة قريبة من التوقعات العشوائية ولكنها أعلى منها (الشكل 2).ه، خط أحمر متقطع).

بعد ذلك نستكشف ما إذا كانت نماذج DYNAMO الموقعة يمكنها التنبؤ بشكل صحيح بعلامات الاضطرابات. تشير هذه العلامات إلى ما إذا كانت الزيادة في تركيز الأنواع تتسبب في زيادة أو انخفاض تنظيم الأنواع الأخرى. هذا مهم لأن العديد من القياسات تشير إلى مجموعات من الجينات الخاضعة للتنظيم أو الأعلى. لذلك نقوم بحساب نسبة تنبؤات الإشارات الدقيقة باستخدام الانتشار الموقع ونماذج الجار الأول (الشكل 2F). أظهرت النتائج اتجاهًا مشابهًا مع تحسن في حالة قوة التأثير ، بدقة 78٪ (ص & lt 1e-16) لنموذج الانتشار و 33٪ (ص = 1.7e-5) لطراز الجيران الأوائل.

بشكل عام ، نظهر أن الهيكل يمثل ثلثي ميزانية الدقة للنماذج الديناميكية عند التنبؤ بأنماط الاضطراب. على وجه الخصوص ، نجد أن النموذج البسيط القائم على المسافة له أداء مشابه لأداء نموذج الانتشار الأفضل أداءً.

المتانة في مواجهة عدم اكتمال الشبكة.

بينما الشكل 2F يؤكد أهمية الطوبولوجيا في استرداد أنماط التأثير الكيميائي الحيوي ، ومن غير الواضح إلى أي مدى ستثبت النتائج إذا كان التفاعل الأساسي غير مكتمل. في الواقع ، تغطي طرق الإنتاجية العالية أقل من 20٪ من جميع تفاعلات البروتين الزوجية المحتملة في الخلية البشرية (7). على الرغم من التغطية المتزايدة تدريجياً (1 ، 36) ، يمكننا أن نتوقع التعامل مع نماذج غير مكتملة لسنوات عديدة قادمة. هذا يدفعنا إلى معالجة متانة نهجنا لإزالة الارتباط. نظرًا لأن جميع الأساليب تعتمد بطبيعتها على مصفوفة Jacobian للنظام ، فإن إزالة إدخال غير صفري يعادل إزالة ارتباط. نظهر في الشكل 2جي متوسط ​​دقة نماذج DYNAMO في استرداد حساسيات النموذج الكيميائي الحيوي الأصلي عند إزالة نسبة متزايدة من الروابط (أي نسبة متزايدة من الإدخالات من مصفوفة جاكوبي الأصلية). نلاحظ اثنين من السلوكيات المختلفة. بالنسبة للنماذج الموجهة ، تنخفض الدقة خطيًا ، بينما بالنسبة للنماذج غير الموجهة لها شكل مقعر ، وتتناقص ببطء في البداية ثم بسرعة أكبر مع إزالة الارتباط الإضافية. يمكن فهم ذلك من خلال إدراك أن العديد من النماذج تحتوي على جزء كبير من المعادلات القابلة للعكس ، على غرار رابطين من الاتجاه المعاكس بين عقدتين. في الحالة غير الموجهة ، لا تؤدي إزالة أحد هذين الرابطين إلى تغيير الشبكة ، مما يجعل هذه النماذج أكثر قوة في إزالة الارتباط. علاوة على ذلك ، وجدنا أنه عند عدم اكتمال 50٪ فإن نماذج الانتشار والكيمياء الحيوية لها نفس الدقة ، مع بقاء النموذج البيوكيميائي أفضل قليلاً من نموذج التكاثر (45٪ مقابل 39٪). يوضح هذا أنه مع المستوى الحالي من عدم اكتمال الشبكات البيوكيميائية ، فإن النماذج الطوبولوجية قادرة على المنافسة مع النماذج الأكثر تعقيدًا "الحركية الواعية".

ميزات الشبكة الكامنة وراء التنبؤ الدقيق بالتأثير.

نظرًا للاختلافات في الحجم والنطاق عبر 87 نموذجًا بيولوجيًا (Dataset S1) ، نقوم بعد ذلك بالتحقيق في خصائص الشبكة التي تساهم في زيادة دقة التنبؤ. لهذا قمنا بقياس الارتباط بين الكميات المختلفة ودقة نموذج الانتشار الموقع الموجه عبر 87 نموذجًا بيولوجيًا (الشكل 2).ح). تحدد المنطقة الرمادية فاصل الثقة 95٪. نجد أن حجم النموذج ليس له أي تأثير على الدقة ، بينما الديناميكيات لها تأثير: إن وجود قيم جاكوبية عالية جدًا ، تقابل ردود الفعل السريعة ، يؤدي إلى دقة أقل. ينبع هذا من حقيقة أن مثل هذه القيم المتطرفة في المصفوفة اليعقوبية يمكن أن تفوق الروابط الأخرى وتؤدي إلى انتشار أسرع عبر الروابط المحددة في النموذج الكيميائي الحيوي ، وهي ميزة لا يمكن التقاطها بواسطة طوبولوجيا الشبكة وحدها. نجد أيضًا أن نسبة المعادلات القابلة للعكس تؤثر سلبًا على الدقة. في الواقع ، لا يقدم التوجيه ميزة لنماذج الشبكة للنماذج الحيوية التي تهيمن عليها المعادلات القابلة للعكس ، كما أن نموذج الانتشار الموجه يغلق الفجوة مع النموذج غير الموجه الأقل دقة.يتم دعم هذه النتيجة من خلال اكتشاف أنه يمكن الوصول إلى درجات دقة أعلى للشبكات التي يمكن أن تتحلل إلى عدد كبير من المكونات المتصلة بقوة (SCCs) ، أي الرسوم البيانية الفرعية التي يمكن الوصول إلى كل عقدة من كل عقدة أخرى. عند تصفية BioModels باستخدام SCC واحد فقط ، نلاحظ تحسنًا كبيرًا في دقة DYNAMO ، حيث تصل إلى دقة ∼80٪ (الملحق SI، الشكل S3). نظهر في الملحق SIS4 مثالين على BioModels على التوالي ن = 1 و ن = 5 SCCs. الشبكة التي تحتوي على SCC واحد كثيفة وضعيفة الوحدات ، في حين أن الشبكة التي تحتوي على خمسة SCCs متناثرة وتعرض هياكل تشبه السلسلة. لدعم مثل هذه الهياكل ، نجد دقة أعلى للشبكات التي لا تعرض محاور واضحة (درجة متوسطة منخفضة ، مركزية المتجهات الذاتية ، ونسبة الثقوب الهيكلية) وتكون متفرقة (كثافة ارتباط منخفضة). أخيرًا ، نظرًا لأن وزن الارتباط يلعب دورًا من خلال Jacobian ، فإننا نتوقع أن الارتباط بين المركزية يجب أن يكون مهمًا بالمثل ، لكننا لم نجد ارتباطًا مهمًا. بشكل عام ، وجدنا أن النماذج الطوبولوجية تصل إلى دقة تصل إلى 80 ٪ للنماذج البيولوجية مع خصائص شبكة معينة تتعلق بالتناثر والنمطية.

مقارنة مع NHM.

بينما يشتمل إطار عمل DYNAMO الخاص بنا على نطاق واسع من النماذج الطوبولوجية ، فإنه لا يتضمن أي معلومات تجميعية ولا نقوم بنمذجة كيفية دمج الكيانات عند التأثير على عقدة - فنحن نعتبر هذه المجموعات "بوابات أو" (أي وظائف مضافة). نقارن هنا نماذج DYNAMO المبسطة الخاصة بنا بنماذج NHM المنطقية الحركية غير الحركية (NHM) (أساليب) اقترحه المرجع. 20 التي تلخص هذه الميزات الاندماجية من النموذج الكيميائي الحيوي الأصلي (الشكل 3أ). يمثل NHM الديناميكيات عن طريق التنشيط السيني أو وظائف التثبيط المحددة من خلال ثلاث معلمات للشكل ويسمح بمدخلات مضاعفة ("بوابات AND"). تم تصميم هذه الميزات ، غير الموجودة في إطار عمل DYNAMO الخاص بنا ، لتقديم رؤى أكثر واقعية حول النموذج البيوكيميائي الكامل. هدفنا هو تحديد الدقة المتبقية في إطار عمل DYNAMO الناتج عن تجاهل المدخلات التوافقية. تم تطبيق NHM سابقًا على مسار إشارات بيتا الأدرينالية ، وهي شبكة إشارات مدروسة جيدًا تنظم انقباض الخلايا العضلية القلبية وتشارك في تضخم القلب وفشل القلب (الشكل 3).ب). يحتوي النموذج الكيميائي الحيوي الكامل (37) على 87 معلمة نموذجية ، تميز التفاعلات بين 25 نوعًا عبر 33 رابطًا (37). تم تقريب النموذج الكيميائي الحيوي بواسطة NHM ، ووجد أن مصفوفة الحساسية الناتجة تظهر تطابقًا جيدًا مع النموذج الكيميائي الحيوي الكامل (20). علاوة على ذلك ، تم تنقيح NHM لإعادة إنتاج ديناميكيات زمنية دقيقة للعديد من البروتينات الرئيسية من خلال ملاءمة 11 معلمة لبيانات الدورة الكاملة التي تم الحصول عليها باستخدام النموذج الكيميائي الحيوي الكامل (المشار إليه فيما بعد بنموذج "NHM fit").

تتنبأ الطوبولوجيا بالتأثير في شبكة الإشارات. (أ) تمثيلات تخطيطية تصور انتشار اضطراب في شبكة بيولوجية وفقًا للكيمياء الحيوية و NHM. يتوافق "التوافق مع التوقيع" مع ملاءمة 11 معلمة من هذا النموذج لإعادة إنتاج سلوكيات الدورة الزمنية الكمية الرئيسية ، كما هو موضح في المرجع. 20. (ب) شبكة إشارات بيتا الأدرينالية (37). يحتوي النموذج البيوكيميائي الكامل على 87 معلمة. مستنسخة من المرجع. 37. (ج) نفس الشكل 2ه. (د) متانة مقياس ارتباط سبيرمان لمسار بيتا الأدرينالي تحت اضطراب المعلمة (أساليب). نعرض متوسط ​​الارتباط بين أي مصفوفتين من مصفوفات الحساسية البيوكيميائية المضطربة التي تم إنشاؤها (أشرطة سوداء) ، أو متوسط ​​الارتباط بين كل نموذج شبكة ومصفوفات الحساسية الكيميائية الحيوية المضطربة (أشرطة أخرى). تظهر أشرطة الخطأ SE. ومن المثير للاهتمام ، أننا لا نرى أي فرق بين نموذج كيميائي حيوي مضطرب نموذجي ونموذج الشبكة.

نحن هنا نطبق إطار عمل DYNAMO الخاص بنا على شبكة بيتا الأدرينالية ونقارن مصفوفات الحساسية الناتجة بالشبكة الكيميائية الحيوية الأصلية (الشكل 3).ج ومصفوفات الحساسية الموضحة في الملحق SI، الشكل S5). كما في السابق ، نلاحظ انخفاضًا تدريجيًا في دقة أنماط التأثير مع تناقص تعقيد نماذج الشبكة. ومن المثير للاهتمام ، أن نماذج الانتشار الموجه والمسافة تُظهر دقة تبلغ 80٪ ، على غرار الدقة لكل من نماذج NHM و NHM الملائمة.

ثم نستكشف متانة هذه النتائج للتغيرات العشوائية في المعلمات البيوكيميائية (أساليب والشكل 3د). لهذا قمنا بإنشاء نماذج كيميائية حيوية مضطربة بضرب جميع المعلمات بعامل تم اختياره عشوائيًا بين و 2. ثم يتم استخدام مصفوفات الحساسية الناتجة كنموذج كيميائي حيوي حقيقي حقيقي للمقارنة مع نماذج DYNAMO. نلاحظ أن دقة نماذج الشبكة لم تتغير في الغالب عند مقارنتها بالنماذج البيوكيميائية المضطربة (الشكل 3).د). ومع ذلك ، عند مقارنة حساسيات النموذج البيوكيميائي المضطرب مع بعضها البعض ، نلاحظ متوسط ​​دقة 80 ٪ ، على غرار تلك الخاصة بأفضل نماذج الشبكة (NHM ، ونماذج الانتشار والمسافة). يشير هذا إلى أن النماذج البيوكيميائية ذات المعلمات الحركية التي تم قياسها بشكل سيئ (حتى الاختلاف المزدوج) دقيقة مثل النماذج الطوبولوجية. يعرض هذا فائدة مثل هذه النماذج الطوبولوجية البسيطة في السياق حيث يتطلب الحصول على معلومات حركية دقيقة استثمارًا تجريبيًا مهمًا.

تتنبأ الطوبولوجيا بالاضطرابات الفسيولوجية والمظاهرية.

في حين أن أنماط الاضطراب ذات أهمية عامة لتقييم جودة نماذجنا ، فإن اختبار القيمة الحقيقية لإطار عمل النمذجة القائمة على طوبولوجيا الشبكة يحتاج إلى التحقق التجريبي. لاختبار دقة نماذج DYNAMO مقابل الملاحظات التجريبية ، ركزنا على شبكة الانجذاب الكيميائي في البكتيريا (الشكل 4).أ) التي تتوفر لها بيانات تجريبية (38) (أساليب). هذا النموذج جزء من قاعدة بيانات BioModels (22) ، وتلتقط نماذج DYNAMO ديناميكياتها بدقة 90٪ (الشكل 4).ب). تتكون مجموعة البيانات التجريبية من عمليات الضربة القاضية ومقايسات الإفراط في التعبير لستة جينات من شبكة الانجذاب الكيميائي ومجموعاتها ، تليها ملاحظة التغيير في التعبير عن الجينات الأخرى من الشبكة. بالإضافة إلى ذلك ، أبلغت التجارب أيضًا عن تغييرات في التحيز ، وهي كمية نمطية تحددها نسبة تراكيز الأنواع الكيميائية الحيوية المتعددة وتلتقط السلوك الاستكشافي أثناء الانجذاب الكيميائي (أساليب والشكل 4ج). في الشكل 4 د و ه قارنا الملاحظات التجريبية (الأعمدة اليسرى) بالتنبؤات من نموذج الانتشار على الشبكة الموجهة الموقعة (الأعمدة اليمنى) تحت عدة فحوصات. نحن نركز على الدقة في استرجاع العلامة الصحيحة للاضطرابات المرصودة. نلاحظ أن نموذج الشبكة يتنبأ بالعلامة الملحوظة للاضطرابات في 86 ٪ من حالات تغيرات التعبير الجيني (13 من 15 حالة ، ص = 4.9e-4 تحت الاختبار ذي الحدين ، الشكل 4د). علاوة على ذلك ، فإنه يتوقع تغيرات النمط الظاهري بدقة 75٪ (9 من أصل 12 حالة ، ص = 0.019 ، الشكل 4ه) ، مما يدل على قيمة النماذج الطوبولوجية في التنبؤ بالنتائج البيولوجية ذات الصلة من الناحية الفسيولوجية. مجتمعة ، توضح هذه النتائج أن الدقة تثبت عند استخدام البيانات من الاضطرابات التجريبية.

التحقق التجريبي. نقارن نتائج تنبؤات تأثيرنا بالاضطرابات التي تم التحقق من صحتها تجريبياً في المسار الكيميائي في البكتيريا (38). (أ) تم الحصول على شبكة Chemotaxis باستخدام بيانات من BioModel BIOMD0000000404 (22). تشير الأسهم إلى وزن ارتباط موجب وتحيط بوزن سلبي. لكل عقدة نشير إلى الأنواع البيوكيميائية المقابلة. يمكن العثور على وصف تفصيلي للنموذج في المرجع. 38. (ب) نفس الشكل 2ه لنموذج الانجذاب الكيميائي. (ج) تمثيل تخطيطي للتجارب ، مقارنة بكتيريا من النوع البري (اليسار، أسود) مع البكتيريا المضطربة بالضربة القاضية للجين X أو التمثيل الزائد (حق، أحمر). تتكون المتغيرات ذات الأهمية من تغيير التعبير الجيني Y (التعبير المتزايد المقابل لمزيد من mRNA المنتج ، باللون الأحمر) ، والتغير في تحيز المشي مقارنة بالمشي العشوائي ، في هذه الحالة زيادة (حمراء) ، تقابل سلوك استكشاف أكثر توجيهًا. (د) نقارن التعبير التفاضلي من تجارب الاضطراب بالتنبؤات من نموذج الانتشار (أساليب). يشير رمز اللون إلى علامة تغيير التعبير الملحوظ: أخضر ، أسود سلبي ، بدون تغيير أحمر ، إيجابي. تُظهر أسماء الصفوف الأنواع المضطربة (على اليسار) والأنواع المقاسة (على اليمين) مفصولة بفاصلة. تتكون الأنواع المضطربة من طفرات فارغة واحدة (A - ، Y - ، Z -) ، طفرات فارغة متعددة (A - Z - ، Y - Z -) ، وطفرات الإنتاج الزائد (A 2 + ، T 2 + ، B 2 + ، W 2 + ، ص 2 + ، ز 2 +). تتكون الأنواع المقاسة من Y p و A و T A و A p و W A. تتفق النتائج في 86٪ من الحالات. (ه) نقوم بتقييم تأثير النمط الظاهري من خلال النظر إلى علامة التغيير في التحيز (أساليب). تظهر أسماء الصفوف الأنواع المضطربة. توافق النتائج في 75٪ من الحالات.


تم دعم هذا العمل من خلال جائزة تحضير مضخة نوفو نورديسك - جامعة أكسفورد في إطار التحالف الاستراتيجي بين الشريكين. ك. من خلال هذه الجائزة ويتم تمويلها الآن من قبل EPSRC (مراجع التمويل EP / R513295 / 1 و EP / N014529 / 1). ج. كان مدعومًا جزئيًا بمنحة EPSRC مناهج جديدة لعلم البيانات: تحليل البيانات الطوبولوجية المستند إلى التطبيق EP / R018472 / 1.

الانتماءات

قسم الرياضيات ، إمبريال كوليدج لندن ، SW7 2AZ ، المملكة المتحدة

وحدة بيولوجيا الميتوكوندريا ، جامعة كامبريدج ، كامبريدج ، CB2 0XY ، المملكة المتحدة

تكنولوجيا الاكتشاف والجينوميات ، مركز أبحاث نوفو نورديسك ، أكسفورد ، أوكسفورد ، OX3 7FZ ، المملكة المتحدة

إنريكي إم توليدو ، توماس مونفيوجا وأمبير فانج زانج

قسم الإحصاء ، جامعة أكسفورد ، أكسفورد ، OX1 3LB ، المملكة المتحدة

شارلوت م. دين وأمبير جيسين رينرت

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

مساهمات

قام E.M.T بإجراء التجارب. E.M.T ، T.M. ، F.K. إجراء حسابات عددية. F.K. ، و C.M.D ، و G.R. تطوير الأساليب الإحصائية. صمم جميع المؤلفين الدراسة وكتبوا المخطوطة. قرأ المؤلفون المخطوطة النهائية ووافقوا عليها.

المؤلف المراسل


شاهد الفيديو: تداخل الفعل الجيني 1. التفوق (شهر اكتوبر 2022).