معلومة

كيفية ضبط النمط الظاهري في تحليل GWAS؟

كيفية ضبط النمط الظاهري في تحليل GWAS؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

في تحليل GWAS ، النمط الظاهري لعينة حيواني هو ما إذا كان الفرد يموت أو يعيش. ولدي وقت موت كل عينة. كيف يمكنني تحديد النمط الظاهري في تحليل GWAS؟


ببساطة ، أولاً وقبل كل شيء ، يمكنك تجميع العينات كحيوانات نجت وعينات ميتة ولديك نمط ظاهري ثنائي.

في نهج مختلف ، يمكنك استخدام وقت البقاء (الوقت حتى الموت) كنمط ظاهري متغير ترتيبي. إذا كنت ترغب في ذلك ، يمكنك استخدام العينة الباقية من خلال تعيين قيمة وقت وفاة كبيرة لهم.

في الطريقة الثالثة ، يمكنك تجميع وقت البقاء (الوقت حتى الموت) في الوقت المطلوب $ n $ مجموعات من خلال إجراء بسيط مثل $ ك $-يعني. ولديك متغير ترتيبي للحبوب الخشنة ، يمكنك إضافة مجموعة العينة الباقية في نهاية The Spectrum.


12.9 - الاختبار الإحصائي في GWAS

في دراسات GWAS ، عادة ما يتم إجراء اختبار لكل جين. تتوفر العديد من الاختبارات.

في أبسط الحالات ، لدينا نمط ظاهري فئوي بفئتين. إلى جانب الأنماط الجينية الثلاثة ، يؤدي ذلك إلى إنشاء جدول 2x3. الأعداد الواردة في الجدول هي عدد العينات في الدراسة مع تركيبة معينة من النمط الجيني والنمط الظاهري.


AA = 0
أأ = 1
أأ = 2
المجموع
صحي
(N_ <11> )
(N_ <12> ) (N_ <13> ) (R_ <1> )
مرض
(N_ <21> ) (N_ <22> ) (N_ <23> ) (R_ <2> )
المجموع

بافتراض أن العينات مستقلة (على سبيل المثال غير مرتبطة) ، لا توجد بنية سكانية ولا متغيرات مشتركة ، يمكن إجراء اختبار فيشر الدقيق أو اختبار مربع كاي لتحديد ما إذا كان النمط الظاهري مرتبطًا بالنمط الجيني.

اختبار آخر شائع الاستخدام (مرة أخرى للعينات المستقلة ولا توجد بنية سكانية) هو اختبار Cochran-Armitage:

يأخذ المصطلح (N_ <1i> R_ <2> -N_ <2i> R_ <1> ) بشكل أساسي الفرق في الأعداد بين الصفوف ، بعد إعادة الوزن لمعادلة إجمالي الصفوف. (لرؤية هذا ، لاحظ أن ( sum_^ <3> N_ <1i> R_ <2> = sum_^ 3 N_ <2i> R_ <1>) ). يتم تحديد الأوزان (t_i ) اعتمادًا على النمط الذي تريد اختباره. على سبيل المثال إذا افترضت أن الأليل A هو المسيطر فإن الأوزان هي (t_1 = t_2 = 1، t_3 = 0 ). إذا افترضت أن تأثيرات A و a مضافة ، فإن الأوزان هي (t_1 = 1، t_2 = 2، t_3 = 3 ). أنماط أخرى ممكنة أيضًا ويمكن اختبارها باستخدام أوزان مختلفة.

عندما تكون العينات مرتبطة ، هناك بنية سكانية أو متغيرات بيئية ، تكون نماذج الانحدار أكثر مرونة من نماذج الجداول. بالنسبة للسمات الثنائية كما في الجدول أعلاه ، يمكننا استخدام الانحدار اللوجستي لصياغة احتمالية أحد الأنماط الظاهرية (مقارنة بالآخر) والتي توفر إطارًا مرنًا للغاية مشابه للنموذج الخطي. عندما تكون السمة كمية ، يمكن استخدام النماذج الخطية العادية. يمكن اعتبار النمط الظاهري فئويًا (باستخدام متغيرات المؤشر كمتنبئات) أو ترتيبي (باستخدام 0،1،2 كقيم عددية.)

أفضل برنامج أعرفه لدراسات GWAS هو PLINK. على الرغم من أن PLINK هو برنامج مستقل ، إلا أن المؤلفين يوفرون أيضًا رابطًا لـ R يسمى Rplinkseq. يذكر المؤلفون: "Rplinkseq عبارة عن حزمة R تسمح بالوصول إلى مشاريع PLINK / Seq مباشرةً من R ، بحيث تكون مجموعة R الغنية من الأدوات الإحصائية والتصور يمكن الاستفادة منها. "يمكن لـ PLINK التعامل مع التنميط الفرداني والتصفية وجميع النماذج الشائعة حاليًا لتحليل GWAS. ومع ذلك ، فإن إدارة البيانات مثل التصفية واختيار العينات أو الميزات وما إلى ذلك ربما يكون من الأفضل القيام بها في R.

إحدى المشكلات في دراسات GWAS هي أن الاختبارات المتعددة لم يتم إجراؤها بالكامل. هذا لأن طرق الاختبار المتعددة التي نعرف أنها تعمل تتطلب الاستقلالية بين الاختبارات. ومع ذلك ، بسبب LD ، إذا كنت تستخدم مجموعة كثيفة من SNPs ، يمكن أن تكون الارتباطات بين الاختبارات عالية. يمكن أن يجمع التنميط الفردي تعدد أشكال تعدد الأشكال في عدد أقل من الأنماط الجينية الأكثر تعقيدًا (مع احتمال أكثر من أليلين) مما يحسن التحليل عادةً من خلال وجود ارتباط أعلى مع النمط الظاهري ، مع وجود عدد أقل من الميزات لمقارنة وتقليل صعوبة التعلم بين السمات. في دراسات QTL ، يُفترض أن تكون الأنماط الجينية علامات للموقع السببي ، بدلاً من أن تكون سببية بحد ذاتها. هذا يستفيد من LD ، حيث يجب أن يكون للواسمات الأكثر ارتباطًا بالمناطق السببية ارتباط أقوى مع النمط الظاهري. يستفيد الباحثون من الارتباط بين القيم p ويرسمون -log10 (قيم p) مقابل المسافة المادية على الكروموسوم في "مخطط مانهاتن". المحور السيني لهذه المؤامرة هو المواضع الكروموسومية لكل ميزة داخل كل كروموسوم ، مرتبة حسب عدد الكروموسوم (وعادة ما تكون مشفرة بالألوان بحيث يسهل معرفة الميزات الموجودة في أي كروموسوم). يتم تحويل المحور ص إلى قيم ف. نظرًا لأن أصغر قيم p مهمة ، يكون المحور y عادةً هو -log10 (قيمة p) ، مما يؤكد على القيم الصغيرة. يُفترض أن يشار إلى QTLs "الحقيقية" بواسطة ذروة محلية لقيم p صغيرة.


الملخص

تحدد دراسات الارتباط على مستوى الجينوم (GWAS) المتغيرات الجينية المرتبطة بالسمات أو الأمراض. لا تربط GWAS أبدًا المتغيرات مباشرة بالآليات التنظيمية. بدلاً من ذلك ، عادةً ما يتم الاستدلال على التعليقات التوضيحية الوظيفية للمتغيرات آخر مخصص التحليلات. تسمح فئة معينة من الأساليب القائمة على التعلم العميق بالتنبؤ بالتأثيرات التنظيمية لكل متغير على العديد من ميزات الكروماتين الخاصة بنوع الخلية. نحن هنا نصف "DeepWAS" ، وهو نهج جديد يدمج تنبؤات التأثير التنظيمي للمتغيرات الفردية في إعداد GWAS متعدد المتغيرات. وبالتالي ، ترتبط المتغيرات الفردية المرتبطة بسمة أو مرض بشكل مباشر بتأثيرها على ميزة الكروماتين في نوع الخلية. ارتبط ما يصل إلى 61 من SNPs التنظيمية ، التي تسمى dSNPs ، بالتصلب المتعدد (MS ، 4888 حالة و 10395 عنصر تحكم) ، اضطراب اكتئابي كبير (MDD ، 1،475 حالة و 2،144 عنصر تحكم) ، وارتفاع (5974 فردًا). كانت هذه المتغيرات غير مشفرة بشكل أساسي ووصلت إلى أهمية اسمية على الأقل في GWAS الكلاسيكية. كانت دقة التنبؤ أعلى بالنسبة لـ DeepWAS مقارنة بنماذج GWAS الكلاسيكية لـ 91 ٪ من dSNPs الخاصة على مستوى الجينوم والخاصة بـ MS. تم إثراء DSNPs في التعبير العام أو المطابق للفوج ومواقع السمات الكمية المثيلة وأظهرنا إمكانات DeepWAS لتوليد فرضيات وظيفية قابلة للاختبار استنادًا إلى بيانات النمط الجيني وحدها. DeepWAS متاح على https://github.com/cellmapslab/DeepWAS.


1 المقدمة

كان كشف الأنماط الجينية المعقدة الكامنة وراء الأنماط الظاهرية المعقدة أمرًا صعبًا في السابق. في حين أن دراسات الارتباط على نطاق الجينوم الفردي (GWAS) يمكن أن توفر نظرة ثاقبة حول الأسس الجينية للأنماط الظاهرية المقاسة ، إلا أنها تشتمل عادةً على روابط للمتغيرات الجينية مع نمط ظاهري واحد فقط أو عدد قليل. يتضمن مجال علم الظواهر جمع بيانات النمط الظاهري عالية الأبعاد لكائن حي ، بهدف التقاط النمط الظاهري الشامل والشامل (& # x0201CPhenome & # x0201D) للكائن الحي (Houle et al. ، 2010). تقدم دراسات الارتباط التي تتضمن العديد من الأنماط الظاهرية المقاسة ، على سبيل المثال ، دراسات الارتباط على نطاق واسع (PheWAS) العديد من المزايا ، من حيث أنها تسمح بتوضيح الشبكات المترابطة المعقدة بين الأنماط الظاهرية وأسسها الجينية ، وتسمح أيضًا باكتشاف تعدد الأشكال ( Pendergrass et al.، 2011، 2013، 2015 Hall et al.، 2014).

تعدد الأشكال هي الظاهرة التي يؤثر فيها الجين على أنماط ظاهرية متعددة (تايلر وآخرون ، 2009). يمكن للمرء أيضًا أن يكون لديه وجهة نظر تتمحور حول موضع تعدد الأشكال التي تنطوي على SNP واحد يؤثر على أنماط ظاهرية متعددة (Solovieff et al. ، 2013). في حين أن تعدد الأشكال كان يعتبر استثناءً لقواعد علم الوراثة المندلية ، فقد تم اقتراحه منذ ذلك الحين على أنه خاصية مركزية مشتركة متأصلة في الأنظمة البيولوجية (Tyler et al. ، 2009). يمكن الكشف عن الجمعيات متعددة الأنماط الظاهرية (MPAs) في نتائج دراسات الارتباط الجينومي الواسع (GWASs) باعتبارها تعدد أشكال النوكليوتيدات المفردة (SNPs) داخل الجينات / المناطق الوظيفية التي لها ارتباطات نمط ظاهري متعددة مهمة. يمكن اعتبار هذا نمطًا متعدد الاتجاهات عندما يبدو أن الطرز الظاهرية لا علاقة لهما. يوجد نمطان رئيسيان من MPA ضمن نتائج GWAS. يحدث النوع الأول من المحميات البحرية عندما يرتبط SNP واحد داخل منطقة وظيفية (مثل الجين) بأكثر من نمط ظاهري واحد ، بينما يحدث النوع 2 MPAs عندما يكون هناك نوعان مختلفان من SNPs داخل منطقة وظيفية واحدة لهما ارتباطات مختلفة في النمط الظاهري (Solovieff et al. ، 2013 Hackinger and Zeggini، 2017) (الأشكال 1 أ ، ب).

شكل 1. توقيعات MPA. (أ) النوع 1 MPA: يرتبط الجين بأكثر من نمط ظاهري واحد بسبب متغير واحد داخل الجين مرتبط بأنماط ظاهرية متعددة. (ب) النوع 2 MPA: يرتبط الجين بأكثر من نمط ظاهري واحد بسبب تعدد الأشكال البديل داخل الجين الذي له ارتباطات نمطية مختلفة (الشكل الذي تم إنشاؤه من المعلومات المقدمة في Solovieff et al. ، 2013). (ج) مجموعات معقدة من توقيعات النوع 1 والنوع 2.

سمح التحليل متعدد المتغيرات لنتائج دراسات GWAS عبر العديد من الأنماط الظاهرية بالتحقيق في العلاقات المعقدة بين الجينات والأنماط الظاهرية ، بما في ذلك العلاقات متعددة الاتجاهات وتجميع المتغيرات بناءً على ارتباطات النمط الظاهري الخاصة بهم. تضمنت العديد من هذه الدراسات تحليل ارتباطات النيوكلوتايد مع سمات الأمراض البشرية المعقدة. اعتبرت بعض الدراسات تعدد الأشكال كجينات و SNPs مرتبطة بأكثر من نمط ظاهري واحد ، ووجدت أن الجينات متعددة التوجهات تميل إلى أن تكون أطول ، وأن تعدد الأشكال داخل الجينات متعددة الاتجاهات كان أكثر احتمالًا أن تكون خارجية (Sivakumaran et al. ، 2011). تم توسيع تحليل شبكة التعبير المشترك للجينات الموزونة (WGCNA) ليشمل مجموعة SNPs بناءً على ارتباطات النمط الظاهري الخاصة بها باستخدام مصفوفة من معاملات بيتا ، متبوعة بالتجميع الهرمي لمصفوفة التداخل الطوبولوجي (Levine et al. ، 2017) ، وإظهار كيف يمكن استخدام المجموعات الناتجة لإنتاج درجات متعددة الجينات. جوبتا وآخرون. (2011) قدم خوارزمية ثنائية ، تجمع في نفس الوقت تعدد الأشكال والأنماط الظاهرية في مصفوفة من معاملات الانحدار. تم تطوير مناهج قائمة على الشبكة والتي تنشئ شبكات ثنائية من جمعيات النمط الظاهري للأمراض الجينية من GWAS ، وإسقاطات شبكة مبنية لهذه الشبكة ثنائية الحزب مما أدى إلى تشابه المرض وشبكات التشابه الجيني (Goh and Choi ، 2012). على الرغم من أن هذه الدراسات توفر خطًا أساسيًا لاستخدام الأساليب متعددة المتغيرات والشبكات لتحليل نتائج GWAS ، إلا أنه لا توجد ، على حد علمنا ، طريقة تميز التوقيعات التفصيلية لـ MPA للجينات ولا توجد طريقة تجمع الجينات بناءً على هذه التوقيعات التفصيلية. ببساطة ، فإن تجميع الجينات بناءً على ارتباطات النمط الظاهري بها لن يلتقط المقدار الهائل من الاحتمالات التجميعية من النوع 1 والتوقيعات من النوع 2 التي يمكن أن يأويها أي جين معين (الشكل 1C) ، خاصةً عندما تتضمن دراسة GWAS متعددة الأنماط الظاهرية ملايين المتغيرات ومئات الأنماط الظاهرية .

تم أيضًا تطوير طرق GWAS متعددة السمات ، وربط المتغيرات بمجموعات من الأنماط الظاهرية (انظر على سبيل المثال Stephens، 2013 Furlotte and Eskin، 2015 Cichonska et al.، 2016 Kaakinen et al.، 2017a، b M & # x000E4gi et al.، 2017 بورتر وأوريلي ، 2017 Thoen et al. ، 2017). M & # x000E4gi et al. (2017) و Kaakinen et al. (2017 أ) تقدم طرقًا مثيرة للاهتمام لتحديد الارتباط بين تعدد الأشكال / الجينات والأنماط الظاهرية المتعددة باستخدام الأنماط الظاهرية كمتنبئات في نمذجة النمط الجيني. هذه طرق قيمة لتحديد الطرز الظاهرية / مجموعات الأنماط الظاهرية المرتبطة بجين معين أو SNP والتي تكون أكثر تعقيدًا من مناهج GWAS القياسية أحادية المتغير. ومع ذلك ، لا تركز هذه الأساليب على القدرة على توصيف الجينات وتجميعها بناءً على مجموعة طوبولوجيا ارتباطات النمط الظاهري لـ SNP داخل الجين.

نقدم تحلل MPA وتجمع التوقيع ، وهو نهج قائم على الشبكة يتضمن مساحة مجموعة قوى مبنية ، حيث يميز التجميع بين الجينات بناءً على الهيكل التفصيلي لتوقيع MPA الفريد. تحلل MPA هو نهج ما بعد GWAS / post-PheWAS مصمم لأخذ نتائج تحليل نوع الارتباط على نطاق الجينوم متعدد الأنماط (مثل معيار GWAS أحادي المتغير يعمل على عدة أنماط ظاهرية أو نهج متعدد الأنماط الظاهرية مثل مثل SCOPA (M & # x000E4gi et al. ، 2017) ويوفر إطارًا يسمح بالتمثيل الرياضي الدقيق لبنية ارتباطات النمط الظاهري المتغير داخل المناطق (توقيعات MPA / متعددة الاتجاهات) ، وبالتالي يسمح لهذه المناطق (مثل الجينات) بأن تكون مجمعة بناءً على هذه التواقيع المعقدة.


نتائج ومناقشة

جمعيات نمطية متعددة

من إجمالي 3،792،566 قاعدة ملغومة ، تم الاحتفاظ بـ 765،318 من القواعد التي رفع & # x02265 1 والثقة & # x02265 0.5. 136551 قواعد مشفرة لمستويات TG و LDL. من 19،837 قاعدة تتعلق بمستويات TG المرتفعة ، تمثل 191 قاعدة مثيرة للاهتمام LDL-C منخفضًا و TG مرتفعًا على عكس 509 قواعد التي أظهرت مستويات مرتفعة من TG و LDL-C عالية. يشير الجدول & # x200B الجدول 2 2 إلى قواعد الارتباط التمثيلية (انظر الملف الإضافي 3) ويشير تفسير القواعد إلى العمل السابق [14].

الجدول 2

قواعد الجمعية التمثيلية

القاعدة #هيئة الحكم حكم رئيسملحقأسيوطمصعد
قواعد ترميز مستويات عالية من TG
1LDL5 ، BMI5 ، TG5 ، TCHL5& # x02192NONHDL50.01571.00005.1732
2GLU1205 ، TCHL5 ، LDL5 ، TG5& # x02192NONHDL50.01361.00005.1732
3LDL5 ، TG5 ، TCHL5 ، GLU05& # x02192NONHDL50.01321.00005.1732
4TG5 ، PLAT5 ، LDL5 ، NONHDL5& # x02192TCHL50.01271.00005.1465
5GLU605 ، TG5 ، TCHL5 ، LDL5& # x02192NONHDL50.01261.00005.1732
6TG5 ، LDL5 ، TCHL5 ، DS1& # x02192NONHDL50.01221.00005.1732
7LDL5 ، INS1205 ، TCHL5 ، TG5& # x02192NONHDL50.01191.00005.1732
8DBP5 ، TG5 ، LDL5 ، TCHL5& # x02192NONHDL50.01191.00005.1732
9INS605 ، TCHL5 ، TG5 ، LDL5& # x02192NONHDL50.01161.00005.1732
10TG5 ، TCHL5 ، INS05 ، LDL5& # x02192NONHDL50.01071.00005.1732
11TG5 ، LDL5 ، SBP4 ، TCHL5& # x02192NONHDL50.01071.00005.1732
12TG5 ، TCHL5 ، WHR5 ، LDL5& # x02192NONHDL50.01071.00005.1732
13T_HDL5 ، NONHDL5 ، LDL4 ، HDL2& # x02192TG50.01020.88754.1105
14TCHL2 ، LDL1 ، NONHDL2 ، PH1& # x02192TG50.01000.83333.8595
قواعد ترميز مستويات عالية من LDL
15TCHL5 ، NONHDL5 ، GLU605& # x02192LDL50.04050.83244.2651
16DS1 ، NONHDL5 ، GLU605& # x02192LDL50.01550.81824.1924
17NONHDL5 ، SONA4 ، TCHL5& # x02192LDL50.02420.84504.3297
18TG3 ، BUN5 ، NONHDL5& # x02192LDL50.01141.00005.1239

يشير تعريف أسماء السمات إلى الشكل & # x200B الشكل 1 1.

الارتباط بين مستويات TG العالية والسمات ذات الصلة بـ MS

تم تصور أنماط الارتباط للسمات المفردة المستخرجة من 359 قاعدة تحتوي على مستويات عالية من TG بواسطة رسم بياني متصل (الشكل & # x200B (الشكل 1). 1). سمة TG عالية (TG5 في الشكل & # x200B الشكل 1) 1) متصلة بعقد غريبة تمثل 17 سمة مميزة: قياس كثافة المعادن العظمية (BMD) ، ونصف القطر البعيد SOS (DS) مكونات الدم ، HB ، WBC_B ، PLAT ، و HBA1C و متلازمة التمثيل الغذائي (MS) (داسكالوبولو ، وآخرون ، 2006) مقاييس ، السمنة (مؤشر كتلة الجسم ، WHR و SUP) ، الدهون (LDL ، HDL ، TCHL ، T_HDL ، TG و NONHDL) ، ارتفاع ضغط الدم (SBP و DBP) ومقاومة الأنسولين ( GLU0 و INS0 و GLU60 و GLU120) وأنسولين ما بعد التحدي (INS60 و INS120). يشير اختصار السمات المفردة إلى الشكل & # x200B الشكل 1 1.

تصور ارتباطات النمط الظاهري مع الرسوم البيانية المتصلة.

كانت الارتباطات بين مستويات TG العالية ومجموعة من 4 سمات مشتركة (السمنة ، ومقاومة الأنسولين ، وارتفاع ضغط الدم ، وفرط شحميات الدم) المرتبطة بمرض التصلب العصبي المتعدد ، متوافقة مع حقيقة أن مرض التصلب العصبي المتعدد يزيد من T2D وأمراض القلب والأوعية الدموية (CVD) [20].

الارتباط بين مستويات TG العالية و BMD

إحدى النتائج الجديرة بالملاحظة هي الارتباط بين DS المنخفض لقياس كثافة المعادن بالعظام ومستويات TG العالية. كانت الارتباطات بين DS المنخفض ومجموعة من مرض التصلب العصبي المتعدد المحددة من خلال السمات الأربع المشتركة ، مثل السمنة وارتفاع ضغط الدم وفرط شحميات الدم ومقاومة الأنسولين مع ارتفاع مستويات الجلوكوز والتفكك مع مستويات الأنسولين (INS0 ، INS60 ، INS120) متوافقة مع العمل المبلغ عنه حديثًا [21 ] فحص الارتباط بين مرض التصلب العصبي المتعدد وصحة العظام. هناك علاقات سلبية بين DS المنخفضة المرتبطة بمستويات عالية من الدهون بما في ذلك TG و TCHL و LDL وعلاقات إيجابية بين DS منخفض مع مستويات منخفضة من HDL [22]. ولوحظ اكتشاف أكثر إثارة للاهتمام في أن انخفاض DS يرتبط بمستويات عالية من الجلوكوز ولكن ليس بمستويات الأنسولين على الرغم من أن الارتباط بين مستويات الجلوكوز المرتفعة أو مقاومة الأنسولين مع كثافة المعادن بالعظام لم يكن حاسماً. في المقابل ، يُعرف ارتفاع السكر في الدم بأنه مؤشر على فقدان العظام وكسور هشاشة العظام [23]. يمكن أن تكون النتائج التي توصلنا إليها دليلاً موحياً على أن السمنة وارتفاع ضغط الدم وفرط شحميات الدم بين السمات المرتبطة بمرض التصلب العصبي المتعدد قد تكون مرتبطة بهشاشة العظام.

الجمعيات مع ارتفاع LDL

أظهرت المستويات العالية من LDL علاقات إيجابية مع مؤشر كتلة الجسم ومستويات الجلوكوز ودهون البلازما بما في ذلك TCHL و TG و NONHDL بالإضافة إلى العلاقات السلبية مع DS. لم نجد ارتباطات بين مستويات LDL المرتفعة ومستويات الأنسولين. ومن المثير للاهتمام ، أن ارتفاع مستوى LDL له علاقات إيجابية مع سمات فردية تتعلق بوظيفة الكلى مثل نيتروجين اليوريا في الدم (BUN) والصوديوم في البول (SONA).

نمط النمط الظاهري متعدد المتغيرات ارتفاع LDLhighTG

من بين ارتباطات النمط الظاهري المتعددة ذات TG المرتفع ، أخذنا في الاعتبار الارتباطات المظهرية التي قسمت العينات إلى أحجام مجدية من الحالات والضوابط لـ GWAS. ركزنا على العلاقة المتناقضة بين مستويات TG العالية (TG5 في الشكل 1 (أ)) مع مستويات منخفضة أو عالية من LDL (LDL1 في الشكل 1 (أ) و LDL5 في الشكل 1 (ب)). أي أن هناك ارتباطات إيجابية: بين TG و LDL-C و TCHL بين LDL-C و HDL وكذلك الارتباطات السلبية: بين TG و LDL-C بين HDL و TG و LDL-C و TCHL. كل من الصفات الفردية ومستويات TG العالية ومستويات LDL العالية ، تشترك في السمات المشتركة (مؤشر كتلة الجسم ، PLAT ، TCHL ، و GLU0) المرتبطة بأنفسهم.

مزيج من صفتين فرديتين ، LDL عالي و TG المرتفع ، يقدم النمط الظاهري متعدد المتغيرات ارتفاع LDLhighTG والتي يمكن أن تضخم قوة الارتباط مع السمات الفردية المرتبطة من خلال التأثيرات الإضافية للسمات المفردة. من بين 17 سمة مرتبطة ، تتمتع أربع سمات (DS ، و GLU0 ، و INS0 ، و SONA) بقوة أكبر في التصنيف المميز لعينات ارتفاع LDLhighTG في الحالات والضوابط (الشكل & # x200B (الشكل 2 2).

توزيع السمات المرتبطة ذات المتغيرات المتعددة والسمات الفردية. يمثل 1 و 2 مجموعات من الضوابط والحالات في عينات من السمات على التوالي. (أ) و (ب) و (ج) ترمز إلى ارتفاع LDLhighTG، ارتفاع LDL و TG عالية على التوالي. من بين 17 سمة فردية مرتبطة مع LDL عالي و TG عالي ، تم اختيار 9 سمات فردية للعرض بسبب الحفاظ على دقة الصورة.

يمكن إثبات الارتباطات بين السمات في قواعد الارتباط التي تشفر مستويات عالية من TG (القواعد 1

14) ومستويات عالية من LDL-C (القواعد 15-18). تم فرز القواعد واختيارها حسب أسرارهم.

كما رأينا أعلاه ، توجد ارتباطات معقدة بين السمات الفردية. قد يؤدي اختيار الحالات والضوابط بناءً على سمات فردية دون النظر إلى تلك الارتباطات إلى زيادة التأثيرات المربكة في العينات. مقارنةً بالاختيار القائم على السمات الفردية للحالات وعناصر التحكم ، يمكن أن يتمتع النهج القائم على المتغيرات المتعددة بمزيد من القوة لتمييز الحالات عن عناصر التحكم.

نتائج GWAS لمستويات الدهون في البلازما

حددنا إجمالي 50 متغيرًا مرتبطًا بـ ارتفاع LDLhighTG و 15 موجودة في ستة جينات (PAK7, C20orf103, NRIP1, BCL2, TRPM3، و NAV1) (الجدول & # x200B (الجدول 3 والشكل & # x200B الشكل 3). 3). من المثير للاهتمام معرفة أن rs11700112 من PAK7 في 20p12.2 في طفرة مغلوطة عن طريق استبدال الأرجينين (CGA) بالبرولين (CCA). لم يتم العثور على ارتباط سريري مع هذا البديل. وهي تقع داخل كتلة LD (530 كيلو بايت) مع أربعة أشكال SNP أخرى ، منها اثنان (rs6140956 و rs6133716) في منطقة intronic من C20orf103. من الجدير أن نلاحظ ذلك C20orf103 يحتوي على طفرة تغيير الإطارات في rs72238296 ، وهو 755 قاعدة في بداية rs6140956 في نفس الجين (الجدول. & # x200B (الجدول 3 3 والشكل 4 (أ)). تُعرف طفرة انزياح الإطارات بأنها سبب فرط كوليسترول الدم [24 ].

الجدول 3

المتغيرات الجينية المرتبطة ارتفاع LDLhighTG

SNPمركز حقوق الانسانموقف القاعدةنوع SNPالجينساحلأليل (+/-)متكرر (+)قيمة P hLDLhTGأومورص LDL مورص تيراغرام ص 2
RS11700112209495018nonsynPAK7-جيج0.316.2 & # x000d710 -5 1.443.251.581.00
رس 6140956209450080انترونيكC20orf103+جتي0.416.3 & # x000d710 -5 1.402.791.850.56
RS6133716209455931انترونيكC20orf103+أجي0.401.0 & # x000d710 -4 1.392.581.750.59
rs9967942209503781انترونيكPAK7-جأ0.349.6 & # x000d710 -5 1.413.241.760.89
rs11087847209504159انترونيكPAK7-تيجي0.318.6 & # x000d710 -5 1.433.021.590.99
rs28229942115282928انترونيكNRIP1-أجي0.418.7 & # x000d710 -5 1.402.462.591.00
rs28229982115285230انترونيكNRIP1-جأ0.414.1 & # x000d710 -4 1.352.092.120.97
RS10414042115346738انترونيكNRIP1-أجي0.431.7 & # x000d710 -4 1.372.382.330.64
rs99598741859045526انترونيكBCL2-أجي0.151.2 & # x000d710 -4 1.603.402.201.00
RS18935061859044660انترونيكBCL2-جيأ0.151.5 & # x000d710 -4 1.593.312.081.00
رس 4744611972551280انترونيكTRPM3-جيأ0.491.8 & # x000d710 -4 1.361.933.141.00
RS7039780972469777انترونيكTRPM3-جيأ0.503.7 & # x000d710 -4 1.341.572.980.90
رس 4744608972470797انترونيكTRPM3-جيج0.503.7 & # x000d710 -4 1.341.522.990.90
رس6657701200014747انترونيكNAV1+أجي0.382.0 & # x000d710 -4 1.382.651.541.00
rs5295811200016143انترونيكNAV1+ججي0.372.0 & # x000d710 -4 1.382.591.590.99
رس 693221085700الترميزAPOB-أجي0.077.3 & # x000d710 -4 1.830.042.21-

ذكرت SNP rs693 في دراسة سابقة (Kathiresan ، وآخرون ، 2008) للارتباطات بين TG المرتفع و LDL المرتفع. تم تقليم rs693 نظرًا لأن تأثيره كان أقوى في الصفات الفردية عالية LDL من متعدد المتغيرات ارتفاع LDLhighTG ذات أهمية حدية.

مؤامرة مانهاتن لاختبار ارتباط ارتفاع LDLhighTG. تمثل رموز الجينات باللون الأرجواني المواقع المحددة في GWAS السابقة للدهون (كاثريسان وآخرون ، 2008). تم تقليم SNPs باللون الأزرق.

توزيعات القيمة P لاختبارات الارتباط لـ ارتفاع LDLhighTG وسمات مفردة highTG و highLDL. يتم تحديد النقاط باللون الأحمر بشكل كبير في SNPs في اختبار الارتباط ارتفاع LDLhighTG. ارتفاع LDLhighTG مع hLDLhTG ويتم تقديم الصفات المفردة highTG و highLDL في hTG و hLDL على التوالي.

تم اكتشاف كتلة LD قوية (بطول 81 كيلو بايت) بقيم r 2 عالية (r 2 & # x02265 0.90) عبر ثلاثة SNPs (rs4744611 و rs7039780 و rs4744608) (الشكل 5 (ب)) من TRPM3 على الكروموسوم 9 (9q21.11-q21 .12) قريبة نسبيًا من المناطق المرتبطة بمرض الشريان التاجي [25]. من بين تسعة أنواع لصق TRPM3، متغيرات لصق 7 و 8 لا تشمل النيوكلوتايد الثلاثة المحددة (الشكل 5 (أ)). تشير هذه الملاحظة إلى أن SNPs يمكن أن تحدث تأثيرات وظيفية مختلفة على متغيرات لصق. على الرغم من عدم وجود ارتباط جيني راسخ بالمرض ولم يتم الإبلاغ عن الكثير عن خصائص TRPM3، يرتبط النشاط الوظيفي لـ TRPM3 بخلايا العضلات الملساء الوعائية المتقلصة والمتكاثرة. التحقيق في العمل الأخير [26] أهمية وتنظيم TRPM3 في بيولوجيا الأوعية الدموية وأظهرت أن ارتفاع الكوليسترول يمكن أن يكون بمثابة منظم سلبي لـ TRPM3.

السمات الجينومية لهياكل LD في مجموعات HapMap.

اثنين من SNPs من BCL2 تم تحديد الجين الموجود على الكروموسوم 18 (18q21.33). BCL2، التي تشارك في عدد من السرطانات بما في ذلك الورم الميلانيني وسرطان الثدي وما إلى ذلك ، تم التعرف عليها كمحولات مهمة لاستماتة الخلايا العضلية القلبية. دعم متميز لأهمية BCL2 إلى أمراض القلب والأوعية الدموية (CVD) من خلال اكتشاف حديث [27] أن PPAR & # x003b3 يحمي خلايا عضلة القلب من الإجهاد التأكسدي وموت الخلايا المبرمج من خلال تنظيم BCL2 التعبير.

NRIP1 تم الإبلاغ عن وجود ارتباط مع HDL [28]. حددت الدراسات الحديثة دورًا محددًا لخلايا الكبد NRIP1 كعامل مساعد ل LXR بطرق مختلفة ، وهي تعمل كمنشط في تكوين الدهون وككابس في تكوين السكر [29]. NAV1 على الكروموسوم 1q32.1 ، وهو متماثل بشري لـ a C. ايليجانس يتم التعبير عن الجين ، unc-53 ، في قلب البالغين والدماغ النامي. لم يتم إنشاء ارتباط سريري معها. نتائجنا تضمن أن المتغيرات المرتبطة ارتفاع LDLhighTG يجب تقييمها لمزيد من الدراسة.

من المهم التأكيد على أن هياكل LD للجينات الستة عبر ثلاثة مجموعات (YRI ، CEU ، JPT + CHB) متميزة. لوحظ نمط أقوى LD في JPT + CHB بين الثلاثة. حيث ظهر أن النمط الضعيف لـ LD كان في CEU (انظر ملف إضافي 4).

في السيليكو تكرار

في السيليكو تم إجراء تحليل النسخ المتماثل لـ 15 SNPs في مجموعتين فرعيتين إقليميتين بالإضافة إلى مجموعات الجنس (الجدول & # x200B (الجدول 4). 4). تسعة من 15 النيوكلوتايد المرتبطة ارتفاع LDLhighTG كانت قابلة للتكرار بشكل جيد في المجموعات الفرعية الإقليمية (P & # x0003c 0.05) ، بينما كانت قيم p لستة SNPs (p & # x02265 0.05) على الأهمية الإحصائية الحدودية. خمسة SNPs في NIRP1 (rs2822994 و rs2822998 و rs1041404) و نافي (rs665770 و rs529581) أكثر قابلية للتكاثر في كل من المجموعات الفرعية الإقليمية ومجموعات الجنس.

الجدول 4

تكرار GWAS من ارتفاع LDLhighTG

SNPأنسونغأنسانمجموعذكرأنثىمجموع
LDLTG ن = 205LDL-C ن = 919TG ن = 936LDLTG ن = 340LDL-C ن = 1352TG ن = 843LDLTG ن = 545LDLTG ن = 288LDL-C ن = 1044TG ن = 969LDLTG ن = 257LDL-C ن = 1227TG ن = 810LDLTG ن = 545
RS117001122.6 & # x000d710 -2 0.18180.38493.1 & # x000d710 -2 0.71720.01722.8 & # x000d710 -2 1.8 & # x000d710 -1 0.41610.63211.0 & # x000d710 -3 0.09670.00729.2 & # x000d710 -2
رس 61409568.8 & # x000d710 -4 0.17700.10177.1 & # x000d710 -2 0.77490.03323.6 & # x000d710 -2 1.1 & # x000d710 -1 0.63530.31258.4 & # x000d710 -4 0.23170.00965.6 & # x000d710 -2
RS61337161.8 & # x000d710 -3 0.26910.07489.3 & # x000d710 -2 0.76030.07014.7 & # x000d710 -2 1.1 & # x000d710 -1 0.95500.22311.9 & # x000d710 -3 0.17570.02595.8 & # x000d710 -2
rs99679422.6 & # x000d710 -2 0.34760.48164.1 & # x000d710 -2 0.67070.01983.3 & # x000d710 -2 4.1 & # x000d710 -1 0.29250.83256.9 & # x000d710 -4 0.15450.00722.0 & # x000d710 -1
rs110878471.9 & # x000d710 -2 0.15310.32003.5 & # x000d710 -2 0.72180.01512.7 & # x000d710 -2 1.5 & # x000d710 -1 0.44590.54241.1 & # x000d710 -3 0.07500.00627.4 & # x000d710 -2
rs28229941.1 & # x000d710 -1 0.15820.25362.9 & # x000d710 -5 0.01580.00195.4 & # x000d710 -2 1.5 & # x000d710 -2 0.44000.00602.4 & # x000d710 -4 0.00450.12827.9 & # x000d710 -3
rs28229981.2 & # x000d710 -1 0.19850.24567.4 & # x000d710 -5 0.01720.00435.8 & # x000d710 -2 3.2 & # x000d710 -2 0.48750.00842.9 & # x000d710 -4 0.01010.13611.6 & # x000d710 -2
RS10414041.6 & # x000d710 -3 0.06680.03573.1 & # x000d710 -3 0.02740.03382.4 & # x000d710 -3 7.8 & # x000d710 -3 0.38430.00494.4 & # x000d710 -4 0.00940.09394.1 & # x000d710 -3
rs99598741.2 & # x000d710 -1 0.49530.19421.1 & # x000d710 -3 0.05400.25365.9 & # x000d710 -2 4.3 & # x000d710 -3 0.46200.07201.8 & # x000d710 -1 0.20070.96069.3 & # x000d710 -2
RS18935061.2 & # x000d710 -1 0.49530.19421.3 & # x000d710 -3 0.05840.26165.9 & # x000d710 -2 5.3 & # x000d710 -3 0.46200.07711.8 & # x000d710 -1 0.20180.97979.4 & # x000d710 -2
رس 47446111.7 & # x000d710 -2 0.96520.00784.3 & # x000d710 -2 0.00900.89333.0 & # x000d710 -2 1.1 & # x000d710 -3 0.01130.19251.8 & # x000d710 -1 0.62210.48809.1 & # x000d710 -2
RS70397807.8 & # x000d710 -3 0.63340.01071.4 & # x000d710 -1 0.02380.73877.6 & # x000d710 -2 2.2 & # x000d710 -3 0.00800.28932.2 & # x000d710 -1 0.63170.49471.1 & # x000d710 -1
رس 47446087.8 & # x000d710 -3 0.58460.01221.6 & # x000d710 -1 0.02530.69558.2 & # x000d710 -2 1.8 & # x000d710 -3 0.00740.26502.6 & # x000d710 -1 0.63170.59361.3 & # x000d710 -1
رس6657702.3 & # x000d710 -2 0.27150.32194.7 & # x000d710 -2 0.07470.31563.5 & # x000d710 -2 1.6 & # x000d710 -2 0.55290.15298.1 & # x000d710 -2 0.03210.61824.9 & # x000d710 -2
rs5295812.2 & # x000d710 -2 0.24980.34134.5 & # x000d710 -2 0.05240.33373.4 & # x000d710 -2 2.4 & # x000d710 -2 0.50120.19326.2 & # x000d710 -2 0.02600.59764.3 & # x000d710 -2
رس 6938.0 & # x000d710 -3 0.08890.21481.1 & # x000d710 -2 0.00450.03969.6 & # x000d710 -3 2.1 & # x000d710 -3 0.03730.01472.8 & # x000d710 -2 0.00560.61461.5 & # x000d710 -2

يمثل n عدد الحالات.

كانت إمكانية استنساخ الاختلاف بين الجنسين في الـ 15 SNPs على النحو التالي: PAK7 و NRIP1 كانت أكثر فعالية عند النساء BCL2, TRPM3 و NAV1 كانت أكثر قابلية للتكاثر عند الرجال. ارتفاع LDLhighTG كان أكثر قابلية للاكتشاف في النساء من الرجال (& # x003c7 2 & # x0226544.9 ، قيمة p = 2.05 & # x000d7 10-11). PAK7 و NRIP1 قد يؤدي إلى حساسية خاصة بنوع الجنس بالتوافق مع العمل السابق [30] الإبلاغ عن تأثيرات خاصة بنوع الجنس للأمراض القلبية الوعائية لدى النساء أكثر من الرجال.

مقارنة GWAS العامة

يبدو أن التوزيع العام للقيم p لاختبار الارتباط أقل أهمية من تلك الخاصة بـ GWAS العام. من ناحية أخرى ، تم تحديد قيم p لـ SNPs الهامة للنمط الظاهري متعدد المتغيرات ارتفاع LDLhighTG كانت على ما يبدو أكثر أهمية من تلك الخاصة بالسمات الفردية عالية LDL و highTG (الشكل & # x200B (الشكل 6). 6). من الجدير بالذكر أن أحجام تأثير النيوكلوتايد الهامة والتي تراوحت بين متواضعة (نسب الأرجحية = 1.38-1.60) وأحجام التأثير المتوسط ​​كانت مماثلة لتلك الخاصة بـ GWAS العام التي تراوحت من الأحجام المنخفضة إلى المتواضعة.

المخططات المبعثرة للقيمة p لسمة متعددة المتغيرات مقابل السمات الفردية.

أنماط تعدد الاتجاهات لمواقع السمات الكمية

يمكن ملاحظة الأنماط متعددة الاتجاهات بشكل أكثر دقة في مواضع السمات الكمية (QTLs) أو كتل LD أكثر من تلك الموجودة في SNPs. قمنا بفحص QTLs والأنماط الظاهرية المرتبطة بها للجينات الستة التي تم تحديدها باستخدام مجموعة تتبع النمط الظاهري ورابطة الأمراض في متصفح الجينوم UCSC. تم استخراج QTLs والأنماط الظاهرية المرتبطة بها من QTLs للفئران والفأر من RAT DB و MGI (معلومات جينوم الماوس) (الجدول & # x200B (الجدول 5 5).

الجدول 5

تم تحديد الأنماط الظاهرية المرتبطة بـ QTLs إلى 6 جينات محددة

الجينات (نطاق الكروموسوم)النمط الظاهري OMIM (رقم OMIM)الأنماط الظاهرية للجرذان QTL من RGDالأنماط الظاهرية للماوس QTL من MGI
PAK7 ،
C20orf103 (20p12.2)
مؤشر كتلة الجسم (608559) ،
التهاب الجلد التأتبي (605804) ،
الذئبة الحمامية الجهازية (610065)
الجلوكوما (608696) ،
مرض الزهايمر (607116)
ضغط الدم ووزن الجسم
كتلة القلب ، استجابة الإجهاد ،
داء السكري غير المعتمد على الأنسولين ، قابلية الإصابة بأمراض الكلى ، قمع تضخم الغدة الصعترية
مستوى السكر في الدم ،
داء السكري من النوع 2،
كثافة المعادن في العظام ، التهاب كبيبات الكلى الهلالي ، معدل تنكس الشبكية
NRIP1 (21q11.2)متلازمة التكاثر النقوي (159595)
الخدار (609039) ، التوحد (610838)
مقاومة أورام الخصية
BCL2 (18q21.33)اضطراب ضغط الدم الانتصابي
(143850) ، داء السكري المعتمد على الأنسولين (601941) ، التصلب الجانبي الضموري (606640)
ضغط الدم ، مورفولوجيا خلايا القلب ، السكري المعتمد على الأنسولين ، وظائف الكلىكثافة المعادن في العظام
TRPM3
(9q21.11
-9 س 21.13)
سمة كمية الهيماتوكريت / الهيموغلوبين (609320) ، الساد (605749) ،
تدلي أعضاء الحوض (613088) ،
الصمم (متلازمة ازدواج الكروموسوم 9q21.11) (613558) ،
الصرع (611631) ، الشلل النصفي (607152) ، تصلب الأذن (612096) ، التشنج
التصلب الجانبي الضموري (105550)
ضغط الدم ووزن الجسم
معدل ضربات القلب ، استجابة الإجهاد ، كتلة القلب ، مستوى الجلوكوز ، مستوى الدهون ،
وظائف الكلى ، كتلة الكلى ، تركيز الرينين ،
مستوى هرمون الغدة الدرقية ،
استجابة التهابية غير طبيعية
القابلية لسرطان الكبد ،
تصلب الشرايين،
السمة الميكانيكية العظام ،
التهاب الشريان المناعي الذاتي ،
شدة الساد
NAV1
(1q32.1)
مرض التهاب الأمعاء (612381) ،
نقص الألدوستيرونية الكاذبة (145260) ،
مرض باركنسون (613164).
اعتلال كبيبات الكلى (601894)
ضغط الدم ، كتلة القلب ،
استجابة الإجهاد ، وظيفة الكلى ،
تضخم الغدة الصعترية
استجابة التهابية غير طبيعية
التهاب كبيبات الكلى الهلالي
كثافة المعادن في العظام

تم استخراج الأنماط الظاهرية المرتبطة بـ QTL من مسارات جمعية النمط الظاهري والأمراض في متصفح الجينوم UCSC. تتوافق الأنماط الظاهرية لـ OMIM و rat QTL و Mouse QTL مع مسارات النمط الظاهري OMIM و RGD RAT QTL و MGI Mouse QTL على التوالي.

الجينات الست ما عدا NRIP1 مشاركة سمات QTL المرتبطة بشكل شائع مثل كثافة المعادن بالعظام ومجموعة من السمات المشتركة التي تحدد MS. هذه الصفات المشتركة في مرض التصلب العصبي المتعدد التي تشترك فيها الجينات الستة هي ضغط الدم ، وداء السكري غير المعتمد على الأنسولين ، والوظيفة الكلوية ، والكتلة القلبية ، ووزن الجسم. تم فحص الارتباطات المظهرية لمستويات TG العالية ومستويات LDL المرتفعة مع انخفاض كثافة المعادن بالعظام من خلال روابط الفئران والفئران QTL باستثناء NRIP1 تم تعيينها في مناطق QTLs المرتبطة بـ BMD. علاوة على ذلك يمكن أن يكون أكثر دعمًا لذلك TRPM3 تم تعيينه إلى الأنماط الظاهرية لـ OMIM مثل تصلب العظام ، والصرع ، والتصلب الجانبي الضموري (ALS) ، والتي تم الإبلاغ عن ارتباطها بالأمراض القلبية الوعائية في عمل حديث [31]. تشترك الواسمات الجينية المختلفة في نفس الأنماط الظاهرية لـ OMIM أو متشابهة: BCL2 و TRPM3 تشترك في ربط ALS PAK7 و NAV1 تشترك مع الأنماط الظاهرية المماثلة مرض الزهايمر (AD) ومرض باركنسون (PD) حيث تم الإبلاغ عن الحديث المتبادل بين مرض التصلب العصبي المتعدد ومرض الزهايمر [32].

باختصار ، تشير نتائجنا إلى أن العلامات الجينية المحددة مع النمط الظاهري متعدد المتغيرات ارتفاع LDLhighTG لها ارتباطات نمطية مع سمات مشتركة في مرض التصلب العصبي المتعدد. قد ترتبط السمات الشائعة في مرض التصلب العصبي المتعدد ، وخاصة فرط شحميات الدم ، بالارتباطات المسببة للأمراض مع تصلب العظام والاضطرابات التنكسية العصبية بما في ذلك مرض الزهايمر و PD المتأثر بالعوامل الوراثية متعددة الاتجاهات. وبالتالي ، يمكن أن يكون للعلامات الجينية التي تم تحديدها في عملنا تأثير متعدد الاتجاهات على مرض التصلب العصبي المتعدد ، وعظام كثافة المعادن بالعظام واضطرابات التنكس العصبي.

تحليل شبكة الجينات باستخدام تفاعلات البروتين البروتين

استكشفنا العلاقات الوظيفية المحتملة بين خمسة من ستة جينات مرتبطة بـ ارتفاع LDLhighTG باستخدام STRING ، وهي قاعدة بيانات لتفاعلات البروتين البروتين المتوقعة (PPI). لقد حصلنا على 5 شبكات مختلفة من الجينات تتفاعل مع كل من الجينات الخمسة من خلال الثقة في دليل الارتباط (& # x02265 0.5). تم تعيين كل شبكة من شبكات الجينات (الشكل & # x200 ب (الشكل 7) 7) على مسارات KEGG وفحص المسارات المشتركة. أربعة جينات أي BCL2, NAV1, NIRP1 و TRPM3 تتفاعل مع الجينات (CASP7, BACE1, SDHB, TRPC6) في مسارات AD و PD ، بينما BCL2 و NIRP1 شارك مرض هنتنغتون و # x02019 بالإضافة إلى م. على وجه الخصوص ، ثلاثة جينات ، أي BCL2, PAK7، و NIRP1 المسارات المشتركة في السرطان والمسارات الأخرى ، مما يدعم فرضيتنا القائلة بأن الأنماط الظاهرية متعددة المتغيرات لها مسارات مسببات مشتركة عندما تتأثر بالعوامل الوراثية متعددة الاتجاهات.

شبكات الجينات التي شيدت من تفاعل البروتينات. تشير الخطوط الصلبة باللون الأحمر إلى الجينات في مسارات AD و PD و HD و ALS. تشارك الرموز الجينية باللون الأسود في مسارات إشارات chemokine و MAPK و Wnt. تمثل الخطوط المتقطعة باللون الأحمر تعيين الجينات لمسارات السرطان من KEGG DB أو مسارات محددة مرتبطة بالسرطان تم شرحها بواسطة التعليقات التوضيحية الوظيفية لـ PANTHER و DAVID.


الركيزة 3: فصل الأشكال المتعددة السببية الفردية عند الترددات المتوسطة إلى المتوسطة

أثبت الجدل حول نماذج "الطفرات الشائعة - المرض الشائع" مقابل نماذج "الطفرات النادرة - الأمراض الشائعة" أنها مصدر عدد كبير من المخطوطات ، بما في ذلك العديد من المراجعات الحديثة (على سبيل المثال ، Manolio وآخرون ، 2009). نحن نثير هذه القضية فقط من حيث صلتها بآفاق GWAS. أذكر Hill et al. (2008). إذا كانت الأشكال المتعددة السببية منخفضة التردد ، فإنها تساهم في التباين الإضافي. ومع ذلك ، فإن القدرة على اكتشاف مثل هذه الأشكال المتعددة منخفضة نوعًا ما ، مما قد يتطلب أحجام عينات باهظة (Zuk et al. ، 2012). من الغريب أنه مع انخفاض القوة مع تواتر الأليل ، يزداد التقدير المفرط المتوقع لحجم التأثير (Lynch and Walsh ، 1998). وفقًا لذلك ، يبدو أن تعدد الأشكال السببية الأقل تواترًا يكون له تأثير أقوى مما هو عليه في الواقع (Mackay et al. ، 2012) ، وربما يؤدي إلى تحيز تدفق الموارد من GWAS إلى نماذج "شاشة الطفرات" التي اكتسبت شعبية مؤخرًا ( تينسين وآخرون (2012).

ما هي نسبة تغير النمط الظاهري ، إذن ، بسبب الأليلات منخفضة التردد (مقارنة بالتردد المتوسط)؟ بالرجوع إلى Mackay et al. (2012) ، الأردن وآخرون. (2012) و Weber et al. (2012) ، الطفرات منخفضة التردد مهمة. هذا يمثل مشكلة بالنسبة لـ GWAS إذا كانت أحجام التأثير صغيرة نسبيًا. ومع ذلك ، وفقًا لتحليل Ober et al. (2012) ، أليلات التردد المتوسط ​​مهمة. قد يطرح هذا في حد ذاته مشاكل لتحليلات GWAS التي تركز على اكتشاف التأثيرات المضافة لأنه ، كما تمت مناقشته أعلاه ، على الرغم من أنه من المحتمل أن تكون الإضافية الظاهرية للمتغيرات النادرة ، إلا أنها ليست نتيجة ضرورية للأليلات ذات التردد المتوسط.

للتلخيص ، سيكون GWAS هو الأكثر نجاحًا ، إذا (1) كان التباين الوراثي الإضافي وفيرًا ، (2) كان لتعدد الأشكال السببي الفردي تأثيرات كبيرة و (3) يتم فصله عند ترددات متوسطة إلى متوسطة. إذن ، هل التباين الجيني مضاف في الغالب؟ بشكل عام ، نحن لا نعرف. هل لتعدد الأشكال السببية الفردية تأثيرات كبيرة؟ مرة أخرى ، بشكل عام لا نعرف. هل يفصلون في الترددات المتوسطة إلى المتوسطة؟ مرة أخرى ، لا نعرف حقًا. بشكل عام ، يبدو أننا لا نزال بعيدين عن اليقين في تأكيد هذه المتطلبات ، على الأقل في ذبابة الفاكهة النموذج الذي نعرضه في هذا الاستعراض المصغر.


PSEA: تحليل إثراء مجموعة النمط الظاهري - طريقة جديدة لتحليل الأنماط الظاهرية المتعددة

المعلومات الداعمة متاحة في الإصدار عبر الإنترنت على http://wileyonlinelibrary.com.

تسجيل الدخول المؤسسي
قم بتسجيل الدخول إلى مكتبة Wiley Online

إذا كنت قد حصلت مسبقًا على حق الوصول باستخدام حسابك الشخصي ، فيرجى تسجيل الدخول.

شراء الوصول الفوري
  • شاهد المقال بصيغة PDF وأي ملاحق وأرقام مرتبطة به لمدة 48 ساعة.
  • المادة يمكن ليس أن تتم طباعتها.
  • المادة يمكن ليس يمكن تنزيلها.
  • المادة يمكن ليس يتم إعادة توزيعها.
  • عرض غير محدود لمقال PDF وأي ملاحق وأرقام مرتبطة به.
  • المادة يمكن ليس أن تتم طباعتها.
  • المادة يمكن ليس يمكن تنزيلها.
  • المادة يمكن ليس يتم إعادة توزيعها.
  • عرض غير محدود للمقال / الفصل PDF وأي ملاحق وأرقام مرتبطة.
  • يمكن طباعة المقال / الفصل.
  • يمكن تحميل المادة / الفصل.
  • المادة / الفصل يمكن ليس يتم إعادة توزيعها.

الملخص

تقتصر معظم دراسات الارتباط على مستوى الجينوم (GWAS) على نمط ظاهري واحد ، حتى لو توفرت العديد من الأنماط الظاهرية ذات الصلة أو غير ذات الصلة. ومع ذلك ، يمكن أن يوفر التحليل المتكامل للأنماط الظاهرية المتعددة نظرة ثاقبة على أساسها الجيني المشترك وقد يحسن قوة دراسات الارتباط. نقدم طريقة جديدة تسمى "تحليل إثراء مجموعة النمط الظاهري" (PSEA) ، والتي تستخدم أفكار تحليل إثراء مجموعة الجينات للتحقيق في مجموعات النمط الظاهري. يجمع PSEA بين إحصائيات تحليلات النمط الظاهري وحيد المتغير واختباراته عن طريق التقليب. لا يسمح فقط بتحليل مجموعات النمط الظاهري المحددة مسبقًا ، ولكن أيضًا لتحديد مجموعات النمط الظاهري الجديدة. بصرف النظر عن التطبيق في المواقف التي تتوفر فيها الأنماط الظاهرية والأنماط الجينية لكل شخص ، تم تعديل الطريقة لتحليل إحصاءات ملخص GWAS. تم تطبيق الحماية من الاستغلال والانتهاك الجنسيين على البيانات المأخوذة من المجموعة السكانية KORA F4 (ن = 1،814) باستخدام الصفات المتعلقة بالحديد وعدد الدم. من خلال تأكيد الارتباطات التي تم العثور عليها سابقًا في التحليلات التلوية الكبيرة لهذه السمات ، تم إثبات أن PSEA أداة موثوقة. العديد من هذه الارتباطات لم يتم اكتشافها بواسطة GWAS على أنماط ظاهرية واحدة في KORA F4. لذلك ، تشير النتائج إلى أن PSEA يمكن أن تكون أقوى من النمط الظاهري الفردي GWAS لتحديد الارتباط مع الأنماط الظاهرية المتعددة. تعد PSEA طريقة قيمة لتحليل أنماط ظاهرية متعددة ، والتي يمكن أن تساعد في فهم شبكات النمط الظاهري. يمكّن تصميمه المرن من استخدام المعرفة السابقة وتوليد معرفة جديدة فيما يتعلق بالربط بين أنماط ظاهرية متعددة. يتوفر برنامج برنامج PSEA بناءً على نتائج GWAS عند الطلب.


مراجع

Cariaso M، Lennon G: SNPedia: ويكي يدعم شرح الجينوم الشخصي وتفسيره وتحليله. الدقة الأحماض النووية. 2012 ، 40: D1308-1312. 10.1093 / nar / gkr798.

Eriksson N و Macpherson JM و Tung JY و Hon LS و Naughton B و Saxonov S و Avey L و Wojcicki A و Pe'er I و Mountain J: تؤدي الدراسات المستندة إلى الويب والموجهة إلى المشاركين إلى ارتباطات جينية جديدة للسمات المشتركة. علم الوراثة PLoS. 2010 ، 6: e1000993-10.1371 / journal.pgen.1000993.

Do CB و Tung JY و Dorfman E و Kiefer AK و Drabant EM و Francke U و Mountain JL و Goldman SM و Tanner CM و Langston JW: تحدد دراسة الارتباط على نطاق الجينوم على شبكة الإنترنت موقعين جديدين ومكونًا وراثيًا أساسيًا لمرض باركنسون . علم الوراثة PLoS. 2011 ، 7: e1002141-10.1371 / journal.pgen.1002141.

Futreal PA و Liu Q و Shattuck-Eidens D و Cochran C و Harshman K و Tavtigian S و Bennett LM و Haugen-Strano A و Swensen J و Miki Y وآخرون: طفرات BRCA1 في سرطان الثدي الأولي وسرطان المبيض. علم. 1994 ، 266: 120-122. 10.1126 / العلوم 7939630.

Lancaster JM و Wooster R و Mangion J و Phelan CM و Cochran C و Gumbs C و Seal S و Barfoot R و Collins N و Bignell G: طفرات BRCA2 في سرطان الثدي والمبيض الأولي. علم الوراثة الطبيعة. 1996 ، 13: 238-240. 10.1038 / ng0696-238.

Klein TE ، Altman RB ، Eriksson N ، Gage BF ، Kimmel SE ، Lee MT ، Limdi NA ، الصفحة D ، Roden DM ، Wagner MJ: تقدير جرعة الوارفارين بالبيانات السريرية والدوائية. إن إنجل جي ميد. 2009 ، 360: 753-

Ashley EA و Butte AJ و Wheeler MT و Chen R و Klein TE و Dewey FE و Dudley JT و Ormond KE و Pavlovic A و Morgan AA: التقييم السريري الذي يتضمن الجينوم الشخصي. لانسيت. 2010 ، 375: 1525-1535. 10.1016 / S0140-6736 (10) 60452-7.

van der Net JB، Janssens AC، Sijbrands EJ، Steyerberg EW: قيمة التنميط الجيني للتنبؤ بأمراض القلب التاجية. Am Heart J. 2009 ، 158: 105-110. 10.1016 / j.ahj.2009.04.022.

Mihaescu R و Meigs J و Sijbrands E و Janssens AC: تحديد ملامح المخاطر الجينية للتنبؤ بمرض السكري من النوع 2. بلوس بالعملة. 2011 ، 3: RRN1208-

Wei Z و Wang K و Qu HQ و Zhang H و Bradfield J و Kim C و Frackleton E و Hou C و Glessner JT و Chiavacci R: من ارتباط المرض إلى تقييم المخاطر: نظرة متفائلة من دراسات الارتباط على مستوى الجينوم حول مرض السكري من النوع 1 . بلوس جينيت. 2009 ، 5: e1000678-10.1371 / journal.pgen.1000678.

Manolio TA، Collins FS، Cox NJ، Goldstein DB، Hindorff LA، Hunter DJ، McCarthy MI، Ramos EM، Cardon LR، Chakravarti A: البحث عن التوريث المفقود للأمراض المعقدة. طبيعة سجية. 2009 ، 461: 747-753. 10.1038 / الطبيعة 08494.

Janssens AC ، van Duijn CM: منظور وبائي لمستقبل اختبار الجينوم الشخصي المباشر للمستهلك. إنستيج جينيت. 2010 ، 1: 10-10.1186 / 2041-2223-1-10.

Evans DM ، Visscher PM ، Wray NR: تسخير المعلومات الواردة في دراسات الارتباط على مستوى الجينوم لتحسين التنبؤ الفردي بمخاطر الأمراض المعقدة. همهمة مول جينيه. 2009 ، 18: 3525-3531. 10.1093 / hmg / ddp295.

هي كيو ، لين دي واي: طريقة اختيار متغيرة لدراسات الارتباط على مستوى الجينوم. المعلوماتية الحيوية. 2011 ، 27: 1-8. 10.1093 / المعلوماتية الحيوية / btq600.

Kooperberg C ، LeBlanc M ، Obenchain V: التنبؤ بالمخاطر باستخدام دراسات الارتباط على مستوى الجينوم. جينيه إبيديميول. 2010 ، 34: 643-652. 10.1002 / gepi.20509.

Cho YS و Go MJ و Kim YJ و Heo JY و Oh JH و Ban HJ و Yoon D و Lee MH و Kim DJ و Park M: تكشف دراسة ارتباط الجينوم على نطاق واسع للسكان الآسيويين عن العوامل الوراثية التي تؤثر على ثماني سمات كمية. علم الوراثة الطبيعة. 2009 ، 41: 527-534. 10.1038 / نغ 357.

Li MD، Yoon D، Lee JY، Han BG، Niu T، Payne TJ، Ma JZ، Park T: جمعيات المتغيرات في مجموعة الجينات CHRNA5 / A3 / B4 مع سلوكيات التدخين في السكان الكوريين. بلوس واحد. 2010 ، 5: e12183-10.1371 / journal.pone.0012183.

Yoon D، Kim YJ، Cui WY، Van der Vaart A، Cho YS، Lee JY، Ma JZ، Payne TJ، Li MD، Park T: دراسة الارتباط واسعة النطاق للجينوم للسكان الآسيويين تكشف عن العوامل الوراثية في FRMD4A وغيرها المواقع التي تؤثر على بدء التدخين والاعتماد على النيكوتين. علم الوراثة البشرية. 2012 ، 131: 1009-1021. 10.1007 / s00439-011-1102-x.

Chen LS و Saccone NL و Culverhouse RC و Bracci PM و Chen CH و Dueker N و Han Y و Huang H و Jin G و Kohno T: التدخين واختلاف المخاطر الجينية عبر مجموعات من أصول أوروبية وآسيوية وأفريقية - أصل - تحليل الكروموسوم 15q25. جينيه إبيديميول. 2012 ، 36: 340-351. 10.1002 / جيبي .21627.

Scheet P ، Stephens M: نموذج إحصائي سريع ومرن لبيانات التركيب الجيني للسكان على نطاق واسع: تطبيقات لاستنتاج الأنماط الجينية المفقودة ومرحلة النمط الفرداني. أنا J Hum Genet. 2006 ، 78: 629-644. 10.1086 / 502802.

Jakobsdottir J ، Gorin MB ، Conley YP ، Ferrell RE ، Weeks DE: تفسير دراسات الارتباط الجيني: قد تكون العلامات ذات نسب الأرجحية الكبيرة المنسوخة من المصنفات الضعيفة. بلوس جينيت. 2009 ، 5: e1000337-10.1371 / journal.pgen.1000337.

Xu M ، Tantisira KG ، Wu A ، Litonjua AA ، Chu JH ، Himes BE ، Damask A ، Weiss ST: دراسة رابطة الجينوم الواسعة للتنبؤ بتفاقم الربو الحاد عند الأطفال باستخدام مصنفات الغابات العشوائية. BMC Med Genet. 2011 ، 12: 90-

Zou H، Hastie T: التنظيم والاختيار المتغير عبر الشبكة المرنة. الجمعية الإحصائية J Roy: السلسلة B. 2005 ، 67: 301-320. 10.1111 / j.1467-9868.2005.00503.x.

Cho S و Kim K و Kim YJ و Lee JK و Cho YS و Lee JY و Han BG و Kim H و Ott J و Park T: التحديد المشترك للمتغيرات الجينية المتعددة عبر اختيار متغير الشبكة المرنة في تحليل الارتباط على مستوى الجينوم. آن هوم جينيه. 2010 ، 74: 416-428. 10.1111 / j.1469-1809.2010.00597.x.

Fang S ، Fang X ، Xiong M: تنبؤ الصدفية من ملامح SNP على مستوى الجينوم. BMC ديرماتول. 2011 ، 11: 1-10.1186 / 1471-5945-11-1.

Ahdesmaki M ، Strimmer K: اختيار الميزة في مشاكل التنبؤ باستخدام omics باستخدام درجات القط والتحكم في معدل عدم الاكتشاف الخاطئ. حوليات الإحصاء التطبيقي. 2010 ، 4: 503-519. 10.1214 / 09-AOAS277.

Burges C: برنامج تعليمي حول آلات المتجهات الداعمة للتعرف على الأنماط. التنقيب عن البيانات واكتشاف المعرفة. 1998 ، 2: 1-47.

Hastie T ، Tibshirani R ، Friedman JH: عناصر التعلم الإحصائي: التنقيب عن البيانات والاستدلال والتنبؤ. 2009 ، نيويورك ، نيويورك: سبرينغر ، 2

Guyon I ، Weston J ، Barnhill S ، Vapnik V: اختيار الجينات لتصنيف السرطان باستخدام آلات المتجهات الداعمة. تعلم ماخ. 2002 ، 46: 389-422. 10.1023 / أ: 1012487302797.

Rakotomamonjy A: اختيار متغير باستخدام معايير قائمة على SVM. J Mach Learn Res. 2003 ، 3: 1357-1370.

بريمان إل: غابات عشوائية. تعلم ماخ. 2001 ، 45: 5-32. 10.1023 / أ: 1010933404324.

Banfield RE، Hall LO، Bowyer KW، Kegelmeyer WP: مقارنة بين تقنيات إنشاء مجموعة شجرة القرار. IEEE Trans Pattern Anal Mach Intell. 2007 ، 29: 173-180.

Jiang R ، Tang W ، Wu X ، Fu W: نهج الغابة العشوائية لاكتشاف التفاعلات المعرفية في دراسات الحالات والشواهد. المعلوماتية الحيوية BMC. 2009 ، 10 (ملحق 1): S65-10.1186 / 1471-2105-10-S1-S65.

DeLong ER ، DeLong DM ، Clarke-Pearson DL: مقارنة المناطق الواقعة تحت اثنين أو أكثر من منحنيات تشغيل المستقبل المترابطة: نهج غير معلمي. القياسات الحيوية. 1988 ، 44: 837-845. 10.2307 / 2531595.

Lasko TA ، Bhagwat JG ، Zou KH ، Ohno-Machado L: استخدام منحنيات التشغيل المميزة للمستقبل في المعلوماتية الطبية الحيوية. إعلام بيوميد ي. 2005 ، 38: 404-415. 10.1016 / j.jbi.2005.02.008.

كرافت بي ، هانتر دي جي: التنبؤ بالمخاطر الجينية - هل وصلنا إلى هناك بعد ؟. إن إنجل جي ميد. 2009 ، 360: 1701-1703. 10.1056 / NEJMp0810107.

Li MD ، Cheng R ، Ma JZ ، Swan GE: تحليل تلوي للتأثيرات الجينية والبيئية المقدرة على سلوك التدخين في التوائم البالغين من الذكور والإناث. مدمن. 2003 ، 98: 23-31. 10.1046 / j.1360-0443.2003.00295.x.


الملف الإضافي 1: وصف السمات. يوضح الجدول 52 سمة ووصفها وقياسها. (XLS 66 كيلوبايت)

12918_2011_803_MOESM2_ESM.xls

ملف إضافي 2: الخصائص الأساسية للسمات. خصائص خط الأساس حسب الوسائل والانحرافات المعيارية. (XLS 50 كيلوبايت)

12918_2011_803_MOESM3_ESM.xls

ملف إضافي 3: قواعد الارتباط ترميز مستويات عالية من TG و LDL عالية. قواعد الجمعية التمثيلية ترميز TG عالي و LDL عالي. (XLS 8 ميغا بايت)


استراتيجيات لتحليل المسار باستخدام بيانات GWAS و WGS

تُعد تصميمات دراسة الأليل الفردي ، المستخدمة بشكل شائع في دراسات الارتباط على مستوى الجينوم (GWAS) بالإضافة إلى دراسات تسلسل الجينوم الكامل (WGS) التي تم تطويرها مؤخرًا ، نهجًا قياسيًا للتحقيق في علاقة التباين المشترك داخل الجينوم البشري بمعيار معين. النمط الظاهري للفائدة. ومع ذلك ، فإن نتائج ارتباط الأليل الواحد المنشورة للعديد من دراسات GWAS تمثل فقط قمة جبل الجليد للمعلومات التي يمكن استخلاصها من مجموعات البيانات هذه. تستلزم إستراتيجية التحليل الأولية لـ GWAS تحليل الارتباط الذي يتم فيه فقط تعدد أشكال النوكليوتيدات المفردة (SNPs) مع الأقوى قيم p تعتبر ذات دلالة إحصائية بسبب المشكلات الناشئة عن الاختبارات المتعددة والأخطاء من النوع الأول. تساهم عوامل مثل عدم تجانس الموضع ، والرأس ، والجينات المتعددة التي تمنح تأثيرات صغيرة في تعقيد النماذج الجينية الكامنة وراء تعبير النمط الظاهري. وبالتالي ، يتم التغاضي عن العديد من الارتباطات ذات المعنى البيولوجي والتي لها أحجام تأثير أقل في الجينات الفردية ، مما يجعل من الصعب فصل الارتباطات الحقيقية عن بحر من الارتباطات الإيجابية الخاطئة. من المستحسن تنظيم هذه النيوكلوتايد الفردية في مجموعات ذات مغزى بيولوجيًا للنظر في التأثيرات الكلية للاضطرابات الطفيفة على الجينات والمسارات. يوفر هذا النهج القائم على المسار للباحثين نظرة ثاقبة للأسس الوظيفية للنمط الظاهري قيد الدراسة ويسمح باختبار السيناريوهات الجينية المختلفة. © 2018 بواسطة John Wiley & Sons، Inc.


شاهد الفيديو: What Are Genome-wide Association Studies? GWAS (ديسمبر 2022).