معلومة

هل ارتبطت أي طفرات أو مواقع جينية بطول العمر الاستثنائي لدى البشر؟

هل ارتبطت أي طفرات أو مواقع جينية بطول العمر الاستثنائي لدى البشر؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

يُعرف الأفراد الذين يتجنبون الأمراض المرتبطة بالعمر في وقت لاحق من حياتهم باسم "الناجين الاستثنائيين" ، وقد زاد طول عمرهم مقارنةً بـ "الضوابط" (أولئك الذين ولدوا في وقت مماثل ، لكنهم `` تقدموا في السن '' وماتوا مبكرًا). توصلت دراسة ليدن إلى أنه يوجد في هؤلاء الأفراد الذين عاشوا طويلاً مكونًا وراثيًا مهمًا يساهم في البقاء على قيد الحياة [Schoenmaker وآخرون] (على الرغم من أن هذا يمكن أن يكون بالتساوي جينيًا - أو ربما مزيجًا من الاثنين معًا).

لقد قرأت عن الدراسات التي حددت الطفرات الجينية التي تسبب أنماطًا ظاهرية للشيخوخة المبكرة (على سبيل المثال الطفرات في جين WRN تسبب متلازمة ويرنر [يو وآخرون]).

لا يزال يتعين علي اكتشاف أي دراسات تحدد أي جينات / مناطق مرتبطة بمقاومة الأمراض المرتبطة بالعمر (أي تلك التي `` تتقدم في العمر '' بشكل جيد). سؤالي هو ما إذا كان أحد يعرف أي من هذه الدراسات؟

يمكن القول إن الدراسات التي بحثت في الاستعداد للأمراض المرتبطة بالعمر لديك وجدت بعض الطفرات - على سبيل المثال الطفرات في الموقع الجيني 9p21 (أي p16INK4a / CDKN2A) ارتبطت بأمراض القلب والسكتة الدماغية بشكل مستقل (2 من الأمراض المرتبطة بالعمر) [Wahlstrand وآخرون]. لذلك يمكن اعتبار الأفراد الذين ليس لديهم أي من هذه الأليلات التي تزيد من المخاطر مهيئين للبقاء على قيد الحياة بشكل استثنائي - لكنني أرى أن هذا منفصل عن سؤالي. هل هناك أي أليلات / جينات / مواضع واقية تزيد من البقاء "العالمي"؟ هل هناك عدد قليل من الأليلات الواقية ، أم العديد منها له تأثيرات صغيرة؟ أم أن الناجين الاستثنائيين ليس لديهم أي أليلات مسببة للمرض / تزيد من مخاطرها؟

أنا مهتم بالبحوث المنشورة (بالطبع) ، ولكن أيضًا في التصورات العامة للموضوع ؛ هناك الكثير من النظريات المتعلقة بالشيخوخة وطول العمر ، ولكن القليل من الحقائق - لذا يرجى ذكر ما "تؤمن به" ، واشرح سبب ذلك.

شكرا على وقتك.

ملاحظة. أدرك أنه يمكنك تعديل النماذج المعملية وراثيًا (على سبيل المثال C. elegans أكل 2 المسوخ [لاكوسكي وآخرون]) للعيش لفترة أطول. أنا مهتم بالمتغيرات التي تحدث بشكل طبيعي ، وتحديداً في البشر (أو تلك التي تتعلق على الأقل بشيخوخة الإنسان).


تحديث (11 مايو 2012)

لقد وجدت دراسة ، نُشرت في وقت سابق من هذا العام ، وجدت أن تعدد الأشكال الجيني واحدًا مرتبطًا (بعد التصحيح للاختبار المتعدد) مع المعمرين [سيباستياني وآخرون]. يوجد SNP في TOMM40 / APOE (في LD) ، وهو أمر مثير للاهتمام بالتأكيد بالنظر إلى الروابط السابقة بين APOE ومرض الزهايمر (مرض مرتبط بالعمر).

ومع ذلك ، لست مقتنعًا بالتصميم التجريبي ؛ يستخدمون العمر عند الموت عند المعمرين كحالاتهم (بعد التنميط الجيني لهم) ، ويستخدمونها على قيد الحياة ضوابط السكان كضوابط. في حين أنه من غير المحتمل أن يصبح كل هؤلاء الأفراد طويل العمر ، فإن التصميم الأفضل (لاكتساب المزيد من القوة) كان من شأنه استخدام الأفراد الذين ماتوا بسبب مرض مرتبط بالعمر (على سبيل المثال بين 60 و 70). لذلك ما زلت أنتظر دراسة مقنعة ، لكن هذا يبدو واعدًا!


يبدو أنك اكتشفت غالبية مجموعة الجينات الجزيئية المتعلقة بالشيخوخة. هناك تحليل متابعة تم نشره هذا العام بواسطة Sebastiani et al. يحتوي Pubmed على ميزة يمكنك الاطلاع عليها في المنشورات التي تشير إلى الورقة التي تبحث عنها ، ولا يوجد سوى المراجعات. لا يبدو أن أي شخص آخر قام بعمل آخر حتى الآن.

ربما تكون محقًا في الشعور بأن قوة الدراسة ليست كبيرة. حاول الباحثون رغم ذلك. المعمرين لديهم أقارب عاشوا منذ فترة طويلة وكانت الضوابط قد ماتت كلا الوالدين قبل أن يبلغا من العمر 73. على الرغم من أن الضوابط كانت 68 سنة. وكبار السن. نعم ليس رائعا. الضوابط صعبة للغاية لأنك لا تريد أشخاصًا يموتون من النوبات القلبية وارتفاع ضغط الدم وجميع أنواع الأشياء التي من شأنها أن تلون الخلفية. انها دراسة صعبة للقيام بها.

لا يوجد جين واحد ينقل نمطًا ظاهريًا مثل طول العمر. من المستحيل أساسًا لأن المزايا ستنتشر من خلال السكان بسرعة. يمكن أن نتحدث عن كيف أن هذه السمة هي ما بعد الإنجاب وعن تأثير الجدة ، لكنني أضع ذلك جانبًا في الوقت الحالي.

كما تم إعاقة الافتقار إلى القوة الإحصائية للدراسة لأن مجرد 800 من المعمرين ربما يعكسون عشرات المجموعات المختلفة من مجموعات طول العمر. (وهذا سبب آخر لجميع هؤلاء الأشخاص من أصول أوروبية محددة - للحفاظ على عدد الاختلافات في المجموعات منخفضة). تم العثور على 281 طفرة كبيرة. APOE هو الأكثر أهمية إلى حد بعيد (الشكل 1) ولكن بالنظر إلى الموقف ، فإن مجرد التركيز على ذلك لا يكفي.

على سبيل المثال ، حتى في الذباب ، يبدو أن الجين sir2-1 ليس نمطًا ظاهريًا متحورًا واحدًا مضادًا للشيخوخة. عندما يعبرون سلالة متحولة مع النوع البري ، تعيش طفرات sir2.1 لمدة أطول بنسبة 15٪. إنها طفرة أخرى على الأقل لم يكتشفوا فيها والتي تسببت في نتوء طول العمر بنسبة 50 ٪ في المسوخ. من المحتمل أنه إذا كان هناك 5 طفرات مهمة أخرى ، فإن متوسط ​​التقاطع لديه واحد أو أكثر من هذه الطفرات معها أيضًا.

لمحاولة فهم كيفية عمل هذه المواقع معًا لتوسيع مدى الحياة ، قاموا بإنشاء مجموعات من تعدد الأشكال (من المثير للاهتمام أن نصفها موجود في الجينات وهو أمر نادر نسبيًا). تبدو مجموعات الجينات هذه وكأنها تؤثر على العمر معًا. الورقة مفتوحة وجميع الجينات الـ 281 قابلة للتنزيل ، ولكل منها خاصية بيولوجية معروفة يمكنك الاطلاع عليها. لا يزال يتعين تحديد كيفية ملاءمتها معًا ، لكن مجموعاتها قد تشير إلى الطريق في الوقت الحالي.


سأشير اليوم إلى عدد من المنشورات الحديثة حول موضوع المتغيرات الجينية المرتبطة بطول العمر لدى البشر. يكرس مجتمع البحث الكثير من الجهد لتحديد وتأكيد المتغيرات الجينية البشرية المرتبطة بطول العمر الطويل. تستمر تكلفة الحصول على البيانات الجينية في الانخفاض بسرعة ، وستصبح بضع سنوات من الآن صغيرة مقارنة بالتكاليف الأخرى لإجراء دراسة. ينضم المزيد من الباحثين في الوقت الذي تقع فيه الدراسات الجينية ضمن ميزانياتهم. في عالم المسعى العلمي البحت ، البحث عن المعرفة ، كل هذا جيد. هناك عدد قليل من العوالم كبيرة مثل مجال علم الوراثة والكيمياء الحيوية الخلوية ، كما أن بوابات البيانات تفتح أكثر من أي وقت مضى. تنتظر عقود من العمل لرسم خريطة حتى لجزء كبير من تقاطع الشيخوخة والتمثيل الغذائي الخلوي على مستوى تفصيلي للبيولوجيا الجزيئية. على المدى الطويل ، كل هذا مفيد: لا توجد بيانات تذهب سدى ، وأي نوع من التكنولوجيا النانوية الجزيئية الشاملة التي تأتي بعد الطب كما نفهمها اليوم سوف تتطلب خريطة كاملة للكيمياء الحيوية البشرية كنقطة انطلاق. هذا طريق طويل ، ومع ذلك.

من وجهة نظر عملية ، في سياق إنتاج طرق لعلاج الشيخوخة في وقت قريب بما يكفي لتكون مهمة ، فإن تحديد الأسباب التي تجعل بعض الناس يميلون إلى العيش لفترة أطول إلى حد ما من غيرهم هو عرض جانبي. إنه ليس له علاقة تذكر بإطالة عمر الإنسان الصحي للجميع بشكل هادف. أولاً ، من الواضح من العمل حتى الآن (أ) أن هناك العديد والعديد من العوامل المساهمة في العلاقة بين الجينات والشيخوخة ، (ب) أي عامل واحد له تأثير إحصائي ضئيل ، وأحيانًا لا يمكن تمييزه تقريبًا ، و (ج) ) تختلف الغالبية العظمى من هذه العوامل باختلاف مجتمع الدراسة. يمكنك ملء كتاب بالارتباطات التي تم العثور عليها حتى الآن ولم يتم تكرارها أبدًا ، بينما لا يوجد سوى عدد قليل من المتغيرات الجينية التي تصمد في دراسات متعددة ، مثل APOE. ثانيًا ، إعطاء الأدوية أو العلاجات الأخرى التي تغير بدقة الجينات ومستويات البروتين في الإنسان لتقليد تلك الخاصة بالعمر ، ما الذي يخبرك ذلك؟ دفعة صغيرة جدًا لفرصك في العيش لسنوات أكثر في حالة تقدم الشيخوخة والضعف المتزايد. الغالبية العظمى من أولئك الذين لديهم نفس المتغيرات الجينية مثل مجموعات الدراسة طويلة العمر يموتون وفقًا للجدول الزمني نفسه تمامًا مثل بقيتنا. إذا كان المجتمع البحثي سيستثمر الوقت والجهد في علاجات الشيخوخة ، فيجب أن تكون على الأقل علاجات ذات قيمة توقع كبيرة من حيث تقليل الوفيات وإطالة الحياة الصحية.

تمثل هذه الدراسات نطاق العمل الذي يتم إجراؤه حاليًا: التحديد الأولي للارتباطات المحتملة مع دراسات تأكيد طول العمر مع استبعاد غالبية الارتباطات الموجودة في أماكن أخرى والدراسات التي تحدد طرقًا لتحسين عملية تحديد الارتباطات الجينية ذات العمر الطويل.

طول العمر هو نمط ظاهري معقد ، وقد تم تحديد عدد قليل من المتغيرات الجينية التي تؤثر على العمر الافتراضي. ومع ذلك ، فإن الشيخوخة والمرض مرتبطان ارتباطًا وثيقًا ، وهناك الكثير معروف عن الأساس الجيني لخطر المرض. هنا ، نوضح باستخدام دراسات الارتباط على مستوى الجينوم (GWAS) لطول العمر والمرض أن هناك تداخلًا بين المواقع المشاركة في طول العمر والمواضع المرتبطة بالعديد من الأمراض ، مثل مرض الزهايمر ومرض الشريان التاجي. ثم نطور إطارًا إحصائيًا جديدًا للعثور على المتغيرات الجينية المرتبطة بطول العمر المفرط. تستفيد هذه الطريقة ، التي تم إعلامها بـ GWAS (iGWAS) ، من المعرفة من 14 دراسة كبيرة للأمراض والسمات المرتبطة بالأمراض من أجل تضييق البحث عن SNPs المرتبطة بطول العمر. باستخدام iGWAS ، وجدنا ثمانية أشكال SNP مهمة في مجموعات الاكتشاف لدينا ، وتمكنا من التحقق من صحة أربعة منها في دراسات النسخ المتماثل لموضوعات طويلة العمر. تشير نتائجنا إلى وجود مواضع جديدة في طول العمر وتكشف عن تداخل وراثي بين طول العمر والأمراض والسمات المرتبطة بالعمر. إلى جانب دراسة طول العمر البشري ، يمكن تطبيق iGWAS لتعزيز القدرة الإحصائية في أي GWAS من النمط الظاهري المستهدف باستخدام GWAS أكبر من الحالات المرتبطة وراثيا.

في تحليل GWAS القياسي ، يكون موضع واحد فقط في هذه الدراسات مهمًا (APOE / TOMM40). مع iGWAS ، نحدد ثمانية مواقع جينية لربطها بشكل كبير بطول العمر البشري الاستثنائي. تابعنا النيوكلوتايد الثمانية الرائدة في مجموعات مستقلة ، ووجدنا أدلة تكرار لأربعة مواقع وأدلة موحية لواحد آخر مع طول عمر استثنائي. تضمنت المواقع التي تم تكرارها APOE / TOMM40 (المرتبط بمرض الزهايمر) ، CDKN2B / ANRIL (المتورط في تنظيم الشيخوخة الخلوية) ، ABO (علامات على فصيلة الدم O) ، و SH2B3 / ATXN2 (جين إشارة يطيل عمر ذبابة الفاكهة) والجين المتورط في المرض العصبي).


العيش حتى 100: العثور على جينات جديدة لطول العمر

تم اكتشاف العديد من الجينات الجديدة المرتبطة بحياة طويلة بشكل استثنائي ، وفقًا لدراسة جديدة فحصت جينومات الأشخاص الذين يعيشون في المائة من العمر ، والمعروفين باسم المعمرين.

باستخدام طريقة جديدة ، وجد الباحثون أربعة جينات مرتبطة بعمر طويل جدًا: جين يسمى ABO ، والذي يشارك في تحديد فصيلة الدم ، وهو جين يسمى CDKN2B ، والذي ينظم انقسام الخلايا ، وهو جين يسمى APOE ، والذي يرتبط بمرض الزهايمر و جين يسمى SH2B3 ، والذي وجد سابقًا أنه يطيل الحياة في ذباب الفاكهة.

يأمل الباحثون أن تكشف الدراسات المستقبلية عن المزيد من الجينات المرتبطة بطول العمر ، ومعرفة كيف يمكن لهذه الجينات أن تؤثر على عملية الشيخوخة.

قال الباحث في الدراسة ستيوارت كيم ، الأستاذ في قسم علم الأحياء التنموي وعلم الوراثة في جامعة سانفورد: "هناك عنصر جيني قوي إلى حد معقول لكي تصبح مئويًا ، ونريد أن نعرف ما هو هذا". قال كيم: "لقد بدأنا في كشف الغموض" حول سبب نجاح بعض الناس في التقدم في السن مقارنة بالسكان العاديين. [إطالة العمر: 7 طرق للعيش في الماضي 100]

حاولت الدراسات السابقة العثور على اختلافات في الجينات أكثر شيوعًا لدى كبار السن مقارنة بالشباب ، لكن لم يحالفها الحظ كثيرًا. نظرت هذه الدراسات في ملايين الاختلافات في الجينوم البشري ، لكنها ربما فاتتها بعض الارتباطات المهمة.

هدفت الدراسة الجديدة إلى تضييق نطاق البحث عن الجينات المرتبطة بطول العمر من خلال التركيز على الجينات المعروفة بتأثيرها الشديد على خطر إصابة الشخص بأمراض مرتبطة بالعمر ، مثل أمراض القلب والزهايمر. وقال الباحثون إن التفكير هو أن هذه الأمراض تزيد من خطر وفاة الشخص مبكرًا ، وبالتالي فإن المتغيرات الجينية التي تزيد من خطر الإصابة بهذه الأمراض ستقلل أيضًا من فرص العمر الطويل.

بحث الباحثون لأول مرة عن الجينات المرتبطة بطول العمر لدى حوالي 800 شخص فوق سن 100 و 5400 شخص فوق سن 90.

وجدوا ثمانية جينات مرتبطة بعمر طويل ، وتمكنوا من تأكيد أربعة من هذه الجينات في تحليل متابعة لحوالي 1000 شخص بعمر 100 أو أكثر.

وجدت الدراسة أن بعض المتغيرات في جينات ABO و CDKN2B و APOE و SH2B3 كانت أكثر شيوعًا عند المعمرين منها في الأشخاص الذين لديهم عمر نموذجي. (يبلغ متوسط ​​العمر المتوقع للبالغين في الولايات المتحدة حوالي 79 عامًا ، وفقًا لمراكز السيطرة على الأمراض والوقاية منها).

على سبيل المثال ، وجدت الدراسة أن الاختلاف الجيني المرتبط بنوع الدم O كان أكثر شيوعًا لدى المعمرين منه في المجموعة الضابطة في الدراسة ، مما يعني أن هناك عددًا أكبر قليلاً من المعمرين مع فصيلة الدم O ، مقارنة بالأشخاص الذين لديهم عمر نموذجي. وجدت دراسات سابقة أن الأشخاص الذين لديهم فصيلة الدم O لديهم مخاطر أقل للإصابة بأمراض القلب التاجية والسرطان ، ومستويات الكوليسترول لديهم أقل من الأشخاص الذين لديهم أنواع دم أخرى.

يبدو أن متغيرًا جينيًا آخر في جين CDKN2B يلعب دورًا في ما إذا كانت الخلايا ستستمر في الانقسام أو تتوقف عن الانقسام. وقال كيم إنه بالنظر إلى أن وقف انقسام الخلايا ، الذي يسمى الشيخوخة ، يُعتقد أنه يساهم في الشيخوخة ، فإن وجود تباين جيني يقلل من شيخوخة الخلايا يمكن أن يكون عاملاً يساهم في الشيخوخة الناجحة.

يشتبه كيم في أنه لا يزال هناك المزيد من الجينات المرتبطة بعمر أطول.

قال كيم: "آمل أن تلهم ورقتنا الآخرين لمواصلة البحث عن" الجينات المرتبطة بطول العمر.

نُشرت الدراسة يوم أمس (17 ديسمبر) في مجلة PLOS Genetics.


الملخص

تظهر الدراسات التوأم أن الاختلافات الجينية تمثل حوالي ربع التباين في عمر الإنسان البالغ. تم التعرف على الأشكال المتعددة الشائعة التي لها تأثير متواضع على العمر الافتراضي في جين واحد ، APOE، مما يعطي الأمل في إمكانية الكشف عن المحددات الجينية الأخرى. ومع ذلك ، على الرغم من أنه تم اقتراح وجود متغيرات ذات تأثيرات مفيدة كبيرة وطرح العديد من المرشحين ، إلا أن آثارها لم يتم تأكيدها بعد. تواجه الدراسات البشرية حول طول العمر العديد من التحديات النظرية واللوجستية ، حيث إن محددات العمر معقدة للغاية. ومع ذلك ، فإن دراسات الارتباط واسعة النطاق للعائلات طويلة العمر ، ودراسات ارتباط الجينات المرشحة الطولية وتطوير طرق تحليلية توفر إمكانية التقدم في المستقبل.


نتائج

المجموعات الابتدائية والثانوية

تتكون مجموعتنا الأساسية (مجموعة الاكتشاف) من 801 موضوعًا غير ذي صلة مسجلين في دراسة نيو إنجلاند المئوية (NECS) و 914 عنصر تحكم مطابق وراثيًا. كانت موضوعات NECS من القوقازيين الذين ولدوا بين عامي 1890 و 1910 مع نطاق عمر من 95 إلى 119 عامًا (متوسط ​​العمر 104 عامًا). ما يقرب من ثلث عينة NECS تضمنت المعمرين مع قريب من الدرجة الأولى الذين حققوا أيضًا طول عمر استثنائي ، وبالتالي تعزيز قوة العينة [19]. اشتملت عناصر التحكم على 241 من الأشخاص المحالين من NECS المطابقين وراثيًا والذين كانوا أزواجًا من ذرية عمري أو أطفال لأبوين توفوا في عمر ≤73 عامًا ، و 673 موضوعًا متطابقًا وراثيًا تم اختيارهم من قاعدة بيانات التحكم في Illumina. من أجل المطابقة الجينية ، استخدمنا خوارزمية موصوفة سابقًا [20] تقوم بتجميع الموضوعات حسب الأعراق بناءً على التحليل العنقودي للمكونات الرئيسية الأكثر إفادة لبيانات النمط الجيني على مستوى الجينوم (الشكل S1). لاحظ أنه استنادًا إلى جدول حياة مجموعة المواليد لعام 1920 لإدارة الضمان الاجتماعي الأمريكية ، يبلغ متوسط ​​العمر المتوقع في المجموعة 82 عامًا ، مع انحراف معياري يبلغ 7.9 عامًا ، بحيث يكون متوسط ​​العمر للحالات في دراستنا ومتوسط ​​العمر المتوقع في المجموعة الفوجية بمقدار 2.69 ضعف الانحراف المعياري. علاوة على ذلك ، كان متوسط ​​عمر ضوابط NECS 75 عامًا ، مع انحراف معياري 7 سنوات. لذلك ، كان الفرق بين متوسط ​​عمر المعمرين في مجموعة الاكتشاف وعناصر تحكم NECS أكثر من 4 أضعاف الانحراف المعياري ، وبالتالي تعزيز قوة الدراسة. للتكرار استخدمنا مجموعتين إضافيتين. تتكون مجموعة النسخ 1 ("ELIX") من 253 شخصًا قوقازيًا في أمريكا الشمالية مسجلين في شركة Elixir Pharmaceuticals بين عامي 2001 و 2003. وُلد هؤلاء الأفراد بين عامي 1890 و 1910 (الفئة العمرية من 89-114 عامًا ، متوسط ​​العمر 100) وتم تجنيدهم و النمط الظاهري باستخدام بروتوكول مشابه لـ NECS. تم تحديد الموضوعات المرجعية (ن = 341) من عناصر تحكم Illumina المتبقية ومطابقتها وراثيًا مع 253 حالة باستخدام نفس خوارزمية المطابقة المستخدمة في مجموعة الاكتشاف. تتكون مجموعة النسخ 2 من 60 عامًا تضم ​​39 شخصًا من أصل أوروبي مسجلين في NECS بين يونيو 2009 وسبتمبر 2010 (النطاق العمري 100-114 ، متوسط ​​العمر 108) بالإضافة إلى 21 عامًا (الفئة العمرية 101-115 ، متوسط ​​العمر 107) ) غير مدرج في مجموعة الاكتشاف أثناء المطابقة الجينية ، وجميع عينات القوقازيين المتاحة من قاعدة بيانات التحكم في Illumina غير المستخدمة في المقارنات أعلاه. لم يتطابق جينياً مع المعمرين والضوابط في مجموعة النسخ المتماثل 2 لاختبار قابلية تعميم النتائج. الشكل 2 يعرض التوزيعات العمرية لعمر المعمرين في مجموعتي الاكتشاف والتكرار 1 و 2. كما استخدمنا مجموعة إضافية من 867 شخصًا طبيعيًا عصبيًا يستخدم كعناصر تحكم لمرض باركنسون GWAS [21] ، لاختبار قوة ارتباطات SNP الفردية. قمنا بتحليل 243980 تعدد الأشكال الذي اجتاز بروتوكول صارم لمراقبة الجودة موصوف في الأساليب.

NECS: المعمرون من مجموعة الاكتشاف ، ELIX: غير المولودون والمئويون من مجموعة النسخ المتماثل ELIX ، NECS 2: مجموعة النسخ المتماثل الإضافية لـ NECS المكونة من 60 من المعمرين. يوضح المحور الصادي الكثافة ، ويحدد المحور السيني العمر ، في مجموعة من سنتين. تردد الأشخاص الذين تتراوح أعمارهم بين x و x + 2 هو 2 * كثافة * (حجم العينة).

تحليل SNP الفردي

أولاً ، أجرينا تحليلًا تقليديًا فرديًا للـ SNP صنفنا فيه تعدد الأشكال في الاكتشاف الذي حددته قوة الارتباط. استخدمنا كلاً من التحليل البايزي والتقليدي المتكرر لأربعة نماذج وراثية مختلفة (عامة / وراثية ، أليلية / مضافة ، روابط متنحية ومهيمنة) لتعظيم القوة [22] ، [23]. من خلال تحليل Bayesian ، سجلنا كل ارتباط SNP بواسطة عامل Bayes (BF) ، وهو الاحتمالات اللاحقة للارتباط عندما يكون للفرضية الصفرية لعدم وجود ارتباط والفرضية البديلة للارتباط نفس الاحتمال السابق [24] ، و ثم استخدمنا الحد الأقصى BF (MBF) كمقياس للدلالة الإحصائية. الشكل S2 يُظهر معدل الخطأ في قواعد القرار بناءً على عدة عتبات لـ MBF. يبدو أن استراتيجية المطابقة تزيل الالتباس عن طريق التقسيم الطبقي لأننا لم نلاحظ أي تضخم في الارتباطات وكان عامل التحكم الجينومي في الارتباط الأليلي 0.99 (الشكل S3). لقد أجرينا أيضًا تحليلات إضافية موصوفة أدناه للتحقيق فيما إذا كان الخلط المتبقي من خلال التقسيم الطبقي للسكان يمكن أن يؤدي إلى تحيز النتائج ولم نعثر على أي دليل على التحيز.

مؤامرة مانهاتن (الشكل 3) يعرض log10 (MBF) لكل SNP تم اختباره. حدد هذا التحليل SNP واحد في APOE / TOMM40 باعتبارها ذات دلالة لا يمكن دحضها على مستوى الجينوم (P & lt10e-8 ، الجدول 1). تم تكرار الارتباط في مجموعة ELIX ، وتم الحفاظ عليه عندما استخدمنا 867 موضوعًا مرجعيًا مدرجًا في GWAS لمرض باركنسون كعناصر تحكم بديلة (الجدول 1).

يتم ترتيب SNPs بواسطة الكروموسوم (نطاقات ألوان بديلة) وداخل الكروموسوم حسب الوضع المادي (المحور السيني). اختبرنا ارتباط كل SNP بطول العمر الاستثنائي باستخدام النماذج العامة والأليلية والمهيمنة والمتنحية ويبلغ المحور الصادي عن الحد الأقصى للوغاريتم 10 (عامل بايز) الذي لوحظ لكل SNP. SNP rs2075650 بوصة APOE / TOMM40 وصلت إلى أهمية واسعة للجينوم لا جدال فيه (log10 (MBF) = 7.9 و p-value & lte-10). يوضح الشكل S3 مخطط مانهاتن ومخطط QQ للنموذج الإضافي باستخدام الانحدار اللوجستي.

صميم البروتين الشحمي E (APOE) يرتبط بعمر الإنسان [25] ، [26] ، [27]. يحدث SNP rs2075650 في intron من توم 40 ولكنه وكيل قوي لـ SNPs الذي يحدد APOE الأليلات [28]. ارتبط هذا SNP بمرض الزهايمر (AD) [29] ، [30] ومستويات الدهون [31] ، [32].

نمذجة المخاطر الجينية

في تحليل SNP الفردي ، لاحظنا إثراءًا كبيرًا للجمعيات المهمة التي لا تلبي العتبة الصارمة لأهمية الجينوم على نطاق واسع. على سبيل المثال ، ارتبط 112 SNPs بطول العمر الاستثنائي مع log10 (MBF) و gt2 مقابل معدل خطأ يقدر بـ 4 في 100000 اختبار مستقل ، وبالتالي 8-10 ارتباطات إيجابية كاذبة متوقعة بالصدفة في 250000 تعدد الأشكال المختبرة إذا لم تكن هناك ارتباطات مهمة و كانت جميع SNPs مستقلة (الشكل S2). مجموعات من الجمعيات في الكروموسومات 8 و 9 و 21 بوصة الشكل 3 يشير إلى مناطق مثيرة للاهتمام ، على الرغم من فشلها في الوصول إلى أهمية الجينوم على نطاق واسع. جادل العديد من المؤلفين بأن النيوكلوتايد التي لا تصل إلى أهمية كبيرة في الجينوم قد تكون مهمة من الناحية البيولوجية بحكم تأثيرها المشترك [33] ، [34] ، [35] ، [36] ، وقد نجحوا في بناء نماذج مخاطر يمكنها التنبؤ بالحساسية الجينية إلى العديد من الصفات المعقدة شديدة التوريث [37] ، [38] ، [39] ، [40] ، [41]. بالمثل ، اكتشفنا الفرضية القائلة بأن مجموعات مختلفة من تعدد الأشكال المرتبطة بطول العمر الاستثنائي ، على الرغم من التأثيرات المعتدلة ، قد تميز بشكل مشترك الاستعداد الوراثي لطول العمر الاستثنائي [42] ، [43] وبالتالي توفر نموذجًا في تحليل السيليكو الذي يمكن أن يقترح الأهداف والمسارات الجينية لطول العمر الاستثنائي.

اختيار النيوكلوتايد التنبؤية.

للمضي قدمًا في هذا التحليل ، كان علينا اتخاذ العديد من القرارات حول فئة النماذج التي يجب العمل بها ، وكيفية تحديد عدد النيوكلوتايد المراد تضمينها في النموذج ، واستراتيجية البحث الشاملة. اخترنا حساب المخاطر الجينية المرتبطة بمجموعة من تعدد الأشكال باستخدام نموذج تصنيف بايزي بسيط ولكنه فعال ، والمعروف أيضًا باسم مصنف بايز الساذج (الشكل 4 أ) [44]. هذا النهج - المستخدم أيضًا في [39] للتنبؤ بدقة بقابلية الإصابة بتصلب الشرايين السباتي - يصنف الشخص على أنه مهيأ لطول العمر بشكل استثنائي إذا كان الاحتمال اللاحق لطول العمر الاستثنائي ، بالنظر إلى الأنماط الجينية لمجموعة من SNPs ، يتجاوز الاحتمال الخلفي لمتوسط ​​طول العمر (الشكل 4 أ). تكمن ميزة هذه الطريقة في عدم وجود حد أعلى تقريبًا لعدد النيوكلوتايد التي يمكن استخدامها للتصنيف ، ويمكن استخدامها للتنبؤ بالمخاطر حتى لو كانت البيانات المستخدمة في التحليل مأخوذة من دراسة مراقبة الحالة. لقد قمنا بتصميم إجراء بحث إلى الأمام لاكتشاف عدد كافٍ من SNPs التنبؤية (الشكل 4 أ). يبني الإجراء سلسلة من نماذج المخاطر الجينية المتداخلة بدءًا من SNP الأكثر أهمية في مجموعة الاكتشاف وإضافة SNP واحدًا بشكل تدريجي في كل مرة من مجموعة مجردة من SNPs مرتبة بترتيب log10 (MBF). يتم استخدام كل نموذج للتنبؤ ، ويتم تقييم دقة كل نموذج للتنبؤ بطول العمر الاستثنائي ومتوسط ​​طول العمر من خلال الحساسية والنوعية (الشكل 4 ب). اتجاه الحساسية والخصوصية في الشكل 4 ب يوضح أن تضمين المزيد من SNPs يزيد من الحساسية والنوعية ، لكن اكتساب الدقة يصبح أقل وأقل مع إضافة SNPs ذات الأهمية الإحصائية المتناقصة (MBF أقل). على وجه الخصوص ، هضاب الحساسية بين 275-285 SNPs بحيث لا يبدو أن تضمين المزيد من SNPs يؤدي إلى تحسين الحساسية بشكل أكبر (الشكل 4 ب). نظرًا لأن النموذج الذي يحتوي على 281 يعطي أقرب حساسية وخصوصية ، فقد أوقفنا البحث عن تعدد الأشكال التنبؤية عند 281. كما استخدمنا أسلوب إعادة التشكيل (الشكل S4A) للتحقق من صحة هذا الاختيار ، وفحص تأثير تغيير ترتيب SNP في بحثنا التجريبي (الشكل S4C و D) ، والتحيز المحتمل في التنميط الجيني المعملية (الشكل S4B).

لقد طلبنا SNPs بواسطة الحد الأقصى من عامل Bayes في مجموعة الاكتشاف وقمنا ببناء مجموعات SNP المتداخلة بدءًا من SNP الأكثر أهمية ثم إضافة SNP واحدًا في كل مرة من القائمة المرتبة. الاحتمالات الشرطية للأنماط الجينية SNP في المعمرين (ع (SNPأنا| EL)) وعناصر التحكم (p (SNPأنا| AL)) لحساب الاحتمال اللاحق لطول العمر الاستثنائي (p (EL | Σك)) باستخدام نظرية بايز والاحتمال السابق p (EL) = 0.5. قاعدة التصنيف هي قاعدة تصنيف بايز القياسية التي تعتبر مثالية في ظل دالة خسارة 0-1. ب) حساسية وخصوصية 400 نموذج متداخل. يشير المحور السيني إلى عدد تعدد الأشكال في كل من النماذج المتداخلة ، ويبلغ المحور الصادي عن الحساسية (النسبة المئوية من المعمرين مع الاحتمال اللاحق لطول العمر الاستثنائي واحتمال gtpostior لمتوسط ​​طول العمر) والنوعية (٪ من عناصر التحكم ذات الاحتمال الخلفي لطول العمر الاستثنائي والجزء الخلفي احتمال متوسط ​​طول العمر).

الجدول S1 يوفر تفاصيل كاملة عن 281 SNPs ، والاحتمالات المستخدمة لحساب التنبؤ باستخدام الصيغة في الشكل 4 أ. تم التحقق من موثوقية التنميط الجيني Illumina مرتين من خلال إعادة التنميط الجيني لأعلى 28 SNPs للنموذج باستخدام التنميط الجيني TaqMan في مختبر مستقل ، ويشير التوافق بنسبة 99.7 ٪ إلى أن البيانات موثوقة (الشكل S5). تتوفر مخططات الكثافة لـ 281 SNPs من www.bumc.bu.edu/centenarian. تحدث 137 SNPs من 281 SNPs في 130 جينًا ، وقد ارتبط بعضها سابقًا بالشيخوخة مثل LMNA (rs915179) ، WRN (rs1800392) و SOD2 (rs2758331) والعديد منهم على مقربة من ترميز SNPs [45]. ال LMNA ارتبط الجين ، الذي يشفر بروتينات الغلاف النووي lamin A و lamin C ، بمتلازمة بروجيرويد (تشبه الشيخوخة المبكرة) ، متلازمة هاتشينسون جيلفورد [46]. ال WRN الجين هو هليكاز الحمض النووي والنوكلياز الخارجي الذي يلعب دورًا محددًا في إصلاح الحمض النووي ومتلازمة بروجيرويد أخرى ، متلازمة ويرنر [47]. ال WRN ارتبط الجين بطول العمر في عينة دراسة فرامنغهام للقلب (FHS) [48]. من اللافت للنظر أن الجينين المسئولين عن أشهر متلازمات البروجيريد يظهران في نموذج المخاطر الجينية ، وهذا قد يعكس قوة عينة الاكتشاف التي تتضمن مثل هذه الأعمار القديمة المتطرفة. جين آخر ، لوحظ أيضًا أنه مرتبط بطول العمر في عينة FHS وكذلك دراسة القدس ، هو SOD2، أو ديسموتاز الفائق 2 [49]. SOD2 هو عامل رئيسي في إزالة الجذور الحرة ومن المحتمل أن يؤدي تلف الجذور الحرة دورًا مهمًا في الإصابة بالشيخوخة والعديد من الأمراض المرتبطة بالعمر [50]. CDKN2A (rs1063192) يؤدي خطوة رئيسية في مسار p53 الذي تم افتراض أنه يلعب دورًا رئيسيًا في إحداث الشيخوخة الخلوية [51] وقد ارتبط بمرض السكري عند البالغين [52]. SORCS1 (rs7907713) و SORCS2 (rs6812745) تم ربطها ميلادي [53]. عديد ببتيد مثبط معدي (GIP) ، يشار إليه عادة باسم الببتيد الأنسولين المعتمد على الجلوكوز ، وهو يشفر البروتين الذي ينظم إفراز الأنسولين وينشط AKT [54]. يدعم ارتباط هذا الجين (rs9899404) الدور المحتمل لتنظيم الأنسولين في طول العمر الاستثنائي [55] ، ويقترح جينات مستهدفة جديدة لشيخوخة الإنسان بعد FOXO1, FOXO3A و IGF-IR [56] ، [57] ، [58]. هناك أيضا أدلة متزايدة على GIP يلعب دورًا وقائيًا في كل من مرض السكري ومرض الزهايمر و GIP قيد التحقيق كهدف علاجي [59].

استخدمنا Genomatix (http://www.genomatix.de) للتعليق على قائمة الـ 130 جينًا المدرجة في نموذج المخاطر الجينية وأظهر التحليل أن القائمة تم إثرائها لعدة مجموعات من الجينات المرتبطة بكل من الأمراض الشائعة والنادرة (MeSH). ). كانت الجينات المرتبطة بمرض الزهايمر والخرف واعتلال تاوباثيات هي الأكثر أهمية: تم ربط 38 جينًا من أصل 130 جينًا بمرض الزهايمر في الأدبيات (القيمة p لاختبار الفرضية الصفرية أن هذا يحدث بالصدفة كان 6.17 هـ-7) ويتم عرضها بتنسيق الشكل 5 تم ربط 42 جينًا بالخرف (الشكل S6، كانت القيمة p لاختبار الفرضية الصفرية أن هذا يحدث بالصدفة 1.07 هـ-6) و 38 إلى tauopathies (قيمة p 8.47e-7). حقيقة أن العديد من الجينات تلعب دورًا في الخرف تتوافق مع الاكتشاف الوبائي بأن الخرف غائب أو متأخر بشكل ملحوظ بين المعمرين (متوسط ​​عمر البداية ، 93 عامًا) [60]. كما تم تمثيل الجينات المتعلقة بالأمراض الأخرى المرتبطة بالعمر بشكل كبير: تم ربط 24 جينًا بمرض الشريان التاجي (الشكل 5) ، وتم ربط العديد من الجينات بالأورام.

تعرض الشبكتان 38 من أصل 130 جينًا في نموذج المخاطر الجينية المرتبطة بمرض الزهايمر (أعلى) و 24 من أصل 130 جينًا مرتبطة بمرض الشريان التاجي (أسفل) في الأدبيات ، إما عن طريق دراسات الارتباط الوظيفي أو الجيني. . تمثل العقد المرتبطة بالحافة إما الجينات "التي يتم الاستشهاد بها" (الخطوط المتقطعة) أو "المرتبطة بالتنظيم الخبير" (الخطوط المستمرة). يعني رأس السهم أن الارتباطات هي التنشيط (المثلث) ، والتثبيط (الدائرة) ، والتعديل (الماس) ، والتحويل (رأس السهم). يوضح شكل العقدة الأدوار المعروفة للجينات (انظر الشكل الداخلي). تم ربط العقد المفردة بـ AD / CAD في الأدبيات ولكن ليس مع الجينات الأخرى. تمت مقارنة عدد الجينات المرتبطة بكل مرض بما هو متوقع بالصدفة باستخدام اختبار فيشر الدقيق ، وتُظهر قيم p أن مجموعة الجينات هي نتيجة الحظ لسوء الحظ. (الشبكات التي تم إنشاؤها بواسطة Genomatix).

ملامح المخاطر الجينية ومجموعة نماذج المخاطر.

لفهم دور 281 SNPs بشكل أفضل في تشكيل القابلية الوراثية لطول العمر الاستثنائي ، أنشأنا ملف تعريف مخاطر وراثي لكل موضوع من خلال رسم الاحتمال اللاحق لطول العمر الاستثنائي (p (EL | Σ)ك) ، المحور y) مقابل عدد SNPs في كل مجموعة من 281 SNPك (المحور السيني) وفحص أنماطها. الشكل 6 يظهر ، على سبيل المثال ، ملامح من 3 المعمرين والسيطرة. في كل ملف تعريف ، يُظهر الاحتمال الخلفي المتزايد لطول العمر الاستثنائي إثراءًا قويًا للمتغيرات المرتبطة بطول العمر ، لأن الاحتمال الخلفي لطول العمر الاستثنائي يزداد عندما يتضمن ملف التعريف نمطًا وراثيًا جديدًا للـ SNP يكون أكثر شيوعًا في المعمرين منه في الضوابط (انظر الطرق).

تم استخدام 281 مجموعة متداخلة من SNP لحساب الاحتمال الخلفي لطول العمر الاستثنائي في الموضوعات الأربعة (المحور الصادي) وتم رسمها مقابل عدد تعدد الأشكال في كل مجموعة (المحور السيني). في 107 سنوات ، أول 5 مجموعات SNP Σ1 = [rs2075650] ، Σ2 = [Σ1، rs1322048]،…، Σ5 = [Σ4، rs6801173] تحديد احتمال لاحق لطول عمر استثنائي يتراوح بين 0.54 و 0.28. يحمل هذا الموضوع أنماطًا وراثية AA و AG و AG و CC و AA لـ 5 SNPs على التوالي ، وباستبعاد النمط الوراثي AA لـ rs2075650 الأكثر شيوعًا عند المعمرين ، تكون الأنماط الجينية الأخرى أكثر شيوعًا في الضوابط من المعمرين وتحدد الاحتمال الخلفي ذات طول عمر استثنائي أقل من الاحتمال اللاحق لمتوسط ​​طول العمر. مجموعة SNP السادسة ، Σ6 = [Σ5، rs337656] ، يتنبأ بفرصة 30٪ تقريبًا لطول العمر بشكل استثنائي. يحمل هذا الموضوع النمط الجيني AA لـ SNP rs337656 الأكثر شيوعًا عند المعمرين (الجدول S1) ، ويزيد حمل هذا النمط الجيني من الاحتمال الخلفي لطول العمر الاستثنائي. The probability predicted by the next SNP sets increases steadily and all models with more than 20 SNPs predict more than a 50% chance of exceptional longevity. This genetic profile shows that the subject carries some combinations of SNP alleles that are associated with exceptional longevity, while other alleles are associated with “average longevity”. However, the overall genetic risk profile determined by all 281 SNP sets makes a strong case for exceptional longevity because the majority of models predict more than an 80% chance of exceptional longevity. The genetic risk profile of the centenarian who died at age 119 years is even more convincing: with the exception of the first SNP, all subsequent SNP sets determine more than a 70% chance of exceptional longevity, and 272 of the 281 models predict more than an 80% chance for exceptional longevity. This profile shows that this subject is highly enriched for SNPs alleles that are more common in centenarians (longevity associated variants) and that probably played a determinant role in the extreme survival. The profile of the third subject, age 108 years, shows that different SNP sets determine different chances for exceptional longevity, and only the overall trend of genetic risk provides evidence for exceptional longevity. The fourth plot displays the profile of a control, and shows that this subject carries some longevity associated variants however, the overall trend of genetic risk points to average longevity rather than exceptional longevity.

These examples support the hypothesis that exceptional longevity is determined by varying combinations of longevity associated variants and some number of SNPs may be optimal for classifying some subjects but not others. Consistent with this observation, we choose an ensemble of all 281 genetic risk models to compute the posterior probability of exceptional longevity. This ensemble of 281 genetic risk models provides 89% specificity and sensitivity in the discovery set (الشكل 7 أ). We next evaluated the predictive accuracy of this ensemble of models in the two replication sets, the ELIX set and a recently enrolled sample of NECS centenarians.

Panel A: Posterior probability of exceptional longevity (EL) and average longevity (AL) (x axis) in the centenarians (red boxplots) and controls (AL1: Illumina controls, blue boxplots, AL2: NECS controls, green boxplots) of the discovery set (NECS, top left). Both sensitivity and specificity were 89%. The boxplots in blue and green show that the distributions of the posterior probability of EL in the two control groups are not statistically different (p-value from t-test comparing the posterior probability of EL = 0.21). Panel B: Posterior probability of EL and AL (x axis) in the centenarians (red boxplots) and controls of the replication set 1. Sensitivity and specificity were 60% and 58% and the distributions of the predictive score are significantly different (t-test p-value = 0.001). Panel C: Median values of the posterior probability of EL (predictive score) in subsets of centenarians of the replication set 1 with increasing ages. The barplot shows that the median score increases with older ages. Panel D: Sensitivity of the classification rule in subsets of centenarians of the replication set 1 with increasing ages. The barplot shows the increasing sensitivity in older groups that reaches 85% in 20 subjects aged 106 and older. Panel E: Distribution of the posterior probability of exceptional longevity in the 253 cases of the replication set divided into two age groups (<103 years, pale blue, mean age 99 years, and ≥103 years, red, mean age 106). The sensitivities in the two groups are 57% and 71.4%. The three distributions are significantly different (p-value = 0.04 from t-test comparing Illumina controls and centenarians aged <103 p-value = 0.004 from t-test comparing the centenarians stratified by age). Panel F: Sensitivity and specificity in an additional set of 2863 controls from the Illumina database (blue), and an additional set of 60 centenarians that include 39 centenarians enrolled since June 2009 (mean age 108) and 21 centenarians that were excluded from older analysis because of genetic matching (mean age 106). The specificity in the additional Illumina controls is 61.2%. The sensitivity in the additional centenarians was 71.5% in the set of 21, and 82% in the additional 39 for a total of 78% (p-value from t-test comparing the posterior probabilities of EL in controls and centenarians <1e-10).

Sensitivity and specificity in the replication set 1 (the ELIX sample) comprised of 253 nonagenarians and centenarians and 341 genetically matched controls were 60% and 58% (الشكل 7 ب) and AUC = 0.58 (Figure S7). Although the distributions of the predictive scores are significantly different (p-value from t-test comparing the predicted probabilities of exceptional longevity in the two groups was 0.001), the discrimination of the model is less remarkable. Since the ages of subjects in this replication set are younger compared to the centenarians in the discovery set (median age in the ELIX set was 100 years compared to 104 in centenarians of the discovery set) and because we expect that the genetic component of exceptional longevity increases with age, we next examined the distribution of the predictive score and the trend of sensitivity in subsets of subjects with older ages. The median probability of exceptional longevity in subsets of increasing age of survival increases to more than 68% in the 81 subjects with ages >101 (Figure 7C) and, consistently, the sensitivity of the model to correctly classify older subjects increases with older ages and reaches 85% in 20 subjects ages 106 and older (Figure 7D). For example, when the 253 cases of the replication set were divided into two age groups to better match the ages of the substantially older discovery set (204 subjects, age <103, median age 100 years, and 49 subjects, age ≥103, median age 105) the sensitivity of the model was 71% (Figure 7E).

To further investigate our hypothesis that the genetic contribution to exceptional longevity increases with older ages we evaluated the sensitivity of the classification rule in a second replication set of newly enrolled NECS centenarians (n = 39) plus NECS centenarians not included in the discovery set (n = 21), the sum of which had a median age of 107 years (Figure 7F). The sensitivity was 78% (71.5% in the group of 21 with median age 106 and 82% in the recently enrolled and older group of 39) confirming increasing sensitivity with increasing ages. The boxplot in Figure 7F shows that the specificity in an additional set of 2863 controls of replication set 2 was is 61.2%, and the AUC in this second replication set was 0.74 (Figure S7). Figure S8 shows that classification rules based on randomly ordering the top 281 SNPs (mid panels) or selecting 281 SNPs at random have lower sensitivity and specificity.

Our analysis used genetic matching to remove confounding by population structure. However, since we matched subjects within clusters, residual stratification might still confound the association and possibly affect the classification rule. To test the hypothesis that there is no confounding by residual stratification, we conducted two traditional analyses. In one analysis, we adjusted the associations of the 281 SNPs by the top 4 principal components, and in the second analysis we did not. We then checked whether adjusting the analysis by the principal components would change the results of the unadjusted analysis. Figure S9 shows that the distributions of p-values for the two analyses in different genetic models are essentially identical (correlation coefficient 0.98 to 0.99). This analysis would indicate that there is no confounding due to residual stratification. We repeated the analysis adjusting for the top 10 principal components. The effect of this more stringent adjustment made 3 of the 281 SNPs borderline significant. We also checked if there is any residual correlation between the top two PCs and the score predicted by our model, and there appears to be none (Figure S10).

Genetic Signatures

Some genetic risk profiles were recurrent and we speculated that groups of centenarians may have genetic risk profiles that are associated with different sub-types of exceptional longevity such as different prevalences or ages of onset of age-related diseases. To test this hypothesis, we used cluster analysis to group the genetic risk profiles into prototypical signatures. We then investigated whether groups of centenarians with particular genetic risk profiles shared specific age-related sub-phenotypes.

Cluster analysis identified 26 groups of 8 to 94 centenarians (90% of the discovery set) with similar genetic risk profiles, while 10% of the centenarians had rare profiles that occur in groups of 7 centenarians or less. الشكل 8 shows, for example, the 9 largest clusters while all clusters are shown in Figure S11. The prototypical genetic risk profiles associated with each cluster are informative displays of the longevity associated variants, and represent different genetic signatures of exceptional longevity. While the ensemble of genetic risk models provides a global estimate of the probability of exceptional longevity, the pattern itself provides information about the different sets of longevity associated variants that drive a subject toward this probability. The same cluster analysis of predicted profiles in centenarians of the merged replication sets 1 and 2 identified 15 clusters with 8 or more subjects, while approximately 35% profiles clustered in groups of 7 or less. The two most predictive and the one least predictive clusters from the replication set are also shown in الشكل 8. Figure S12 depicts all 15 clusters with 8 or more subjects in the merged replication sets.

In each plot, the x-axis reports the number of SNPs in each genetic risk model (1,…,281), and the y-axis reports the posterior probability of exceptional longevity predicted by each model. The boxplots (one for each SNP set on the x axis) display the genetic risk profiles of the centenarians grouped in the same cluster. Numbers N in parentheses are the cluster sizes, and the average posterior probability of exceptional longevity. Color coding represents the strength of the genetic risk to predict EL (Blue: P(EL|∑281)>0.95 Red: 0.5<P(EL|∑281)<0.95 Orange: 0.20<P(EL|∑281)<0.5 Green: P(EL|∑281)<0.2). The full set of 26 clusters is in Figure S11 and includes more than 90% of centenarians in the discovery set.

To examine the specificity of the profiles in characterizing exceptional longevity, we also generated genetic risk profiles of the control subjects in the discovery set and used cluster analysis to group them. Only 5 subjects had profiles that predicted exceptional longevity with more than 90% posterior probability (Figure S13). Other clusters with more than 8 subjects show that the majority of these profiles match either the lack of a predictive genetic signature as in cluster C26 or the sporadic presence of longevity associated variants of clusters C24–C25 in Figure S11. To further extend this analysis, we clustered the genetic profiles of all 4118 controls that include all controls in the discovery and replication sets 1 and 2. Cluster analysis identified several signatures, of which only 17% predict exceptional longevity with more than 70% posterior probability, and 67% predict average longevity (Figure S14). The most predictive genetic signatures that characterize exceptional longevity are rare amongst control subjects, and only 0.6% of the genetic signatures of control subjects have a posterior probability of exceptional longevity >0.95.

Interestingly, the patterns of genetic risk profiles that cluster into genetic signatures distinctly differ from clusters of genetic risk profiles generated from SNPs selected at random (Figure S15). We also investigated if some clusters were enriched for specific ethnicities, but no clusters showed enrichment for any specific European ethnicity.

We next investigated whether different genetic signatures correlate with different life spans (الشكل 9). Some genetic signatures were indeed associated with significantly different life spans. For example, the most predictive signature (C1) was comprised of centenarians with significantly longer survival compared to centenarians with signatures C2 (the second most predictive) or cluster C26 (the least predictive), and the median survival in centenarians with signature C1 was 105 years compared to 104 years in centenarians with signature C2 or 103 years in centenarians with signature C26. We observed a similar result when we compared the survival of centenarians with the most predictive signatures in the merged replication sets (R1 and R2), and when we compared the survival of centenarians with the most and the least predictive signatures (R1 and R15) (See الشكل 9). However, not all signatures correlated with different survival, for example centenarians with signatures C1 and C3 did not demonstrate different survival (See Figure S16). Preliminary analyses provided in the supplementary material (in need of replication) suggest that the different genetic signatures of exceptional longevity associate with varying prevalences and ages of onset of various age-related diseases (Figure S17, Table S2).

Panel A: Some genetic signatures are associated with significantly different life-span. For example the most predictive signature (C1) comprises centenarians with significant longer survival compared to centenarians with signatures C2 or C26. (p-value 0.01 and 0.02) More examples are in Figure S15. Panel B: The two most predictive genetic signatures and the least predictive signature in the centenarians of the merged replications sets show consistent results. The comparison between survival of centenarians with the most predictive signature R1 and the least predictive signature R15 reaches statistical significance, (p-value = 0.003) while the comparison between survival distributions of centenarians with signatures R1 and R2 does not reach statistical significance (p-value 0.10).

For 17 of the 28 centenarians in cluster C26 who lack almost all the longevity associated variants discovered in this study, we had information about familial longevity. Twenty-five percent (n = 5) had >50% of siblings who survived past the age of 90 and some had evidence for longevity as shown in some pedigrees in Figure S18. This could indicate that such families have more private or rare variants not captured by either the genotyping or the model.


معلومات تكميلية

(GWAS). A study that involves genotyping large numbers of participants to identify statistical associations between genetic variants and traits of interest.

Changes to the genetic code arising from errors during DNA damage repair, DNA replication or mitosis, occurring in somatic (non-germline) tissues.

The proportion of variance in a phenotype that can be attributed to genetic differences among individuals in a given population. Narrow-sense heritability estimates additive genetic effects. Broad-sense heritability includes both additive and dominance effects.

Individual-level scores that summarize genetic risk (or protection) for a given phenotype. For each person, a score is computed by counting the number of effect alleles (genetic variants, weighted by their effect) that the person carries. A polygenic score is computed by summing scores from a large number, potentially all, of the variants in the genome.

(LD). Non-random associations between alleles at different loci.

A method that uses single-nucleotide polymorphisms associated with an exposure as instruments to probe the causal nature of the relationship between this exposure and an outcome of interest.

Theory arguing that some mutations are selected because they are beneficial to early-life fitness but become harmful later in life, thus causing ageing.

The production of daughter cells from a single parent cell, all sharing a particular characteristic or trait.


ملاحظات ختامية

Despite the enormous progress achieved by DNA- investigating technologies, such as SNP arrays and exome capturing/re-sequencing, the current knowledge on how genetic variants influence exceptional longevity in humans is still based on the old candidate gene approaches. The adoption of innovative study designs combined with novel genetic platforms and innovative statistical methods hopefully will bring to the identification of new intervention points at which to modulate aging and the diseases of aging.


مراجع

1. Eatock D. Demographic outlook for the European Union 2019. European Union 2019. Available from: https://www.europarl.europa.eu/thinktank/en/document.html?reference=EPRS_IDA(2019)637955. [Last accessed on 27 Sep 2020].

3. Herskind AM, McGue M, Holm NV, Sørensen TI, Harvald B, et al. The heritability of human longevity: a population-based study of 2872 Danish twin pairs born 1870-1900. Hum Genet 199697:319-23.

4. Deelen J, Beekman M, Uh HW, Helmer Q, Kuningas M, et al. Genome-wide association study identifies a single major locus contributing to survival into old age the APOE locus revisited. Aging Cell 201110:686-98.

5. Sebastiani P, Solovieff N, Dewan AT, Walsh KM, Puca A, et al. Genetic signatures of exceptional longevity in humans. بلوس واحد 20127:e29848.

6. Gkikas I, Petratou D, Tavernarakis N. Longevity pathways and memory aging. Front Genet 20145:155.

7. Serbezov D, Balabanski L, Hadjidekova S, Toncheva D. Genomics of longevity: recent insights from research on centenarians. Biotechnol Biotechnol Equip 201832:1359-66.

8. Santos-Lozano A, Sanchis-Gomar F, Pareja-Galeano H, Fiuza-Luces C, Emanuele E, et al. Where are supercentenarians located? A worldwide demographic study. تجديد Res 201518:14-9.

9. Schlötterer C, Tobler R, Kofler R, Nolte V. Sequencing pools of individuals - mining genome-wide polymorphism data without big funding. نات ريف جينيت 201415:749-63.

10. Fracassetti M, Griffin PC, Willi Y. Validation of pooled whole-genome re-sequencing in arabidopsis lyrata. بلوس واحد 201510:e0140462.

11. Yang H, Wang K. Genomic variant annotation and prioritization with ANNOVAR and wANNOVAR. نات بروتوك 201510:1556-66.

12. Karczewski KJ, Francioli LC, Tiao G, Cummings BB, Alföldi J, et al. Variation across 141,456 human exomes and genomes reveals the spectrum of loss-of-function intolerance across human protein-coding genes. bioRxiv 2019:531210.

13. Benjamini Y, Hochberg Y. Controlling the false discovery rate: a practical and powerful approach to multiple testing. J R Stat Soc B 199557:289-300.

14. Team RC. R: a language and environment for statistical computing Vienna 2018 Available from: https://www.gbif.org/zh/tool/81287/r-a-language-and-environment-for-statistical-computing. [Last accessed on 27 Sep 2020].

15. NSI. European health interview. In: Institute NS, editor. 2008. Available from: https://ec.europa.eu/eurostat/web/microdata/european-health-interview-survey. [Last accessed on 27 Sep 2020].

16. Budovsky A, Craig T, Wang J, Tacutu R, Csordas A, et al. LongevityMap: a database of human genetic variants associated with longevity. اتجاهات الجينات 201329:559-60.

17. Chen J, Bardes EE, Aronow BJ, Jegga AG. ToppGene suite for gene list enrichment analysis and candidate gene prioritization. الدقة الأحماض النووية 200937:W305-11.

18. Fabregat A, Jupe S, Matthews L, Sidiropoulos K, Gillespie M, et al. قاعدة معرفة مسار رد الفعل. الدقة الأحماض النووية 201846:D649-55.

19. Chen Y, Whetstone HC, Lin AC, Nadesan P, Wei Q, et al. Beta-catenin signaling plays a disparate role in different phases of fracture repair: implications for therapy to improve bone healing. PLoS Med 20074:e249.

20. Ito M, Yang Z, Andl T, Cui C, Kim N, et al. Wnt-dependent de novo hair follicle regeneration in adult mouse skin after wounding. طبيعة سجية 2007447:316-20.

21. Reya T, Clevers H. Wnt signalling in stem cells and cancer. طبيعة سجية 2005434:843-50.

22. Giannakis M, Hodis E, Jasmine Mu X, Yamauchi M, Rosenbluh J, et al. RNF43 is frequently mutated in colorectal and endometrial cancers. نات جينيه 201446:1264-6.

23. Mandai S, Mori T, Nomura N, Furusho T, Arai Y, et al. WNK1 regulates skeletal muscle cell hypertrophy by modulating the nuclear localization and transcriptional activity of FOXO4. مندوب علوم 20188:9101.

24. Klotz LO, Sánchez-Ramos C, Prieto-Arroyo I, Urbánek P, Steinbrenner H, et al. Redox regulation of FoxO transcription factors. Redox Biol 20156:51-72.

25. Newhouse S, Farrall M, Wallace C, Hoti M, Burke B, et al. Polymorphisms in the WNK1 gene are associated with blood pressure variation and urinary potassium excretion. بلوس واحد 20094:e5003.

26. Putku M, Kepp K, Org E, Sõber S, Comas D, et al. HYPertension in ESTonia (HYPEST), BRItish Genetics of HyperTension (BRIGHT). Novel polymorphic AluYb8 insertion in the WNK1 gene is associated with blood pressure variation in Europeans. Hum Mutat 201132:806-14.

27. Schultz MB, Sinclair DA. Why NAD(+) declines during aging: It’s destroyed. ميتاب الخلية 201623:965-6.

28. Ma S, Upneja A, Galecki A, Tsai YM, Burant CF, et al. Cell culture-based profiling across mammals reveals DNA repair and metabolism as determinants of species longevity. إليفي 20165:e19130.

29. Marin TL, Gongol B, Martin M, King SJ, Smith L, et al. Identification of AMP-activated protein kinase targets by a consensus sequence search of the proteome. BMC Syst Biol 20159:13.

30. Kuan V, Martineau AR, Griffiths CJ, Hyppönen E, Walton R. DHCR7 mutations linked to higher vitamin D status allowed early human migration to northern latitudes. BMC Evol Biol 201313:144.

31. Mark KA, Dumas KJ, Bhaumik D, Schilling B, Davis S, et al. Vitamin D promotes protein homeostasis and longevity via the stress response pathway genes skn-1, ire-1, and xbp-1. مندوب الخلية 201617:1227-37.


محتويات

Any two human genomes differ in millions of different ways. There are small variations in the individual nucleotides of the genomes (SNPs) as well as many larger variations, such as deletions, insertions and copy number variations. Any of these may cause alterations in an individual's traits, or phenotype, which can be anything from disease risk to physical properties such as height. [9] Around the year 2000, prior to the introduction of GWA studies, the primary method of investigation was through inheritance studies of genetic linkage in families. This approach had proven highly useful towards single gene disorders. [10] [9] [11] However, for common and complex diseases the results of genetic linkage studies proved hard to reproduce. [9] [11] A suggested alternative to linkage studies was the genetic association study. This study type asks if the allele of a genetic variant is found more often than expected in individuals with the phenotype of interest (e.g. with the disease being studied). Early calculations on statistical power indicated that this approach could be better than linkage studies at detecting weak genetic effects. [12]

In addition to the conceptual framework several additional factors enabled the GWA studies. One was the advent of biobanks, which are repositories of human genetic material that greatly reduced the cost and difficulty of collecting sufficient numbers of biological specimens for study. [13] Another was the International HapMap Project, which, from 2003 identified a majority of the common SNPs interrogated in a GWA study. [14] The haploblock structure identified by HapMap project also allowed the focus on the subset of SNPs that would describe most of the variation. Also the development of the methods to genotype all these SNPs using genotyping arrays was an important prerequisite. [15]

The most common approach of GWA studies is the case-control setup, which compares two large groups of individuals, one healthy control group and one case group affected by a disease. All individuals in each group are genotyped for the majority of common known SNPs. The exact number of SNPs depends on the genotyping technology, but are typically one million or more. [8] For each of these SNPs it is then investigated if the allele frequency is significantly altered between the case and the control group. [17] In such setups, the fundamental unit for reporting effect sizes is the odds ratio. The odds ratio is the ratio of two odds, which in the context of GWA studies are the odds of case for individuals having a specific allele and the odds of case for individuals who do not have that same allele.

As an example, suppose that there are two alleles, T and C. The number of individuals in the case group having allele T is represented by 'A' and the number of individuals in the control group having allele T is represented by 'B'. Similarly, the number of individuals in the case group having allele C is represented by 'X' and the number of individuals in the control group having allele C is represented by 'Y'. In this case the odds ratio for allele T is A:B (meaning 'A to B', in standard odds terminology) divided by X:Y, which in mathematical notation is simply (A/B)/(X/Y).

When the allele frequency in the case group is much higher than in the control group, the odds ratio is higher than 1, and vice versa for lower allele frequency. Additionally, a P-value for the significance of the odds ratio is typically calculated using a simple chi-squared test. Finding odds ratios that are significantly different from 1 is the objective of the GWA study because this shows that a SNP is associated with disease. [17] Because so many variants are tested, it is standard practice to require the p-value to be lower than 5 × 10 −8 to consider a variant significant.

There are several variations to this case-control approach. A common alternative to case-control GWA studies is the analysis of quantitative phenotypic data, e.g. height or biomarker concentrations or even gene expression. Likewise, alternative statistics designed for dominance or recessive penetrance patterns can be used. [17] Calculations are typically done using bioinformatics software such as SNPTEST and PLINK, which also include support for many of these alternative statistics. [16] [18] GWAS focuses on the effect of individual SNPs. However, it is also possible that complex interactions among two or more SNPs, epistasis, might contribute to complex diseases. Due to the potentially exponential number of interactions, detecting statistically significant interactions in GWAS data is both computationally and statistically challenging. This task has been tackled in existing publications that use algorithms inspired from data mining. [19] Moreover, the researchers try to integrate GWA data with other biological data such as protein-protein interaction network to extract more informative results. [20] [21]

A key step in the majority of GWA studies is the imputation of genotypes at SNPs not on the genotype chip used in the study. [22] This process greatly increases the number of SNPs that can be tested for association, increases the power of the study, and facilitates meta-analysis of GWAS across distinct cohorts. Genotype imputation is carried out by statistical methods that combine the GWAS data together with a reference panel of haplotypes. These methods take advantage of sharing of haplotypes between individuals over short stretches of sequence to impute alleles. Existing software packages for genotype imputation include IMPUTE2, [23] Minimac, Beagle [24] and MaCH. [25]

In addition to the calculation of association, it is common to take into account any variables that could potentially confound the results. Sex and age are common examples of confounding variables. Moreover, it is also known that many genetic variations are associated with the geographical and historical populations in which the mutations first arose. [26] Because of this association, studies must take account of the geographic and ethnic background of participants by controlling for what is called population stratification. If they fail to do so, these studies can produce false positive results. [27]

After odds ratios and P-values have been calculated for all SNPs, a common approach is to create a Manhattan plot. In the context of GWA studies, this plot shows the negative logarithm of the P-value as a function of genomic location. Thus the SNPs with the most significant association stand out on the plot, usually as stacks of points because of haploblock structure. Importantly, the P-value threshold for significance is corrected for multiple testing issues. The exact threshold varies by study, [28] but the conventional threshold is 5 × 10 −8 to be significant in the face of hundreds of thousands to millions of tested SNPs. [8] [17] [29] GWA studies typically perform the first analysis in a discovery cohort, followed by validation of the most significant SNPs in an independent validation cohort. [30]

Attempts have been made at creating comprehensive catalogues of SNPs that have been identified from GWA studies. [32] As of 2009, SNPs associated with diseases are numbered in the thousands. [33]

The first GWA study, conducted in 2005, compared 96 patients with age-related macular degeneration (ARMD) with 50 healthy controls. [34] It identified two SNPs with significantly altered allele frequency between the two groups. These SNPs were located in the gene encoding complement factor H, which was an unexpected finding in the research of ARMD. The findings from these first GWA studies have subsequently prompted further functional research towards therapeutical manipulation of the complement system in ARMD. [35] Another landmark publication in the history of GWA studies was the Wellcome Trust Case Control Consortium (WTCCC) study, the largest GWA study ever conducted at the time of its publication in 2007. The WTCCC included 14,000 cases of seven common diseases (

2,000 individuals for each of coronary heart disease, type 1 diabetes, type 2 diabetes, rheumatoid arthritis, Crohn's disease, bipolar disorder, and hypertension) and 3,000 shared controls. [16] This study was successful in uncovering many new disease genes underlying these diseases. [16] [36]

Since these first landmark GWA studies, there have been two general trends. [37] One has been towards larger and larger sample sizes. In 2018, several genome-wide association studies are reaching a total sample size of over 1 million participants, including 1.1 million in a genome-wide study of educational attainment [38] and a study of insomnia containing 1.3 million individuals. [39] The reason is the drive towards reliably detecting risk-SNPs that have smaller odds ratios and lower allele frequency. Another trend has been towards the use of more narrowly defined phenotypes, such as blood lipids, proinsulin or similar biomarkers. [40] [41] These are called intermediate phenotypes, and their analyses may be of value to functional research into biomarkers. [42] A variation of GWAS uses participants that are first-degree الأقارب of people with a disease. This type of study has been named genome-wide association study by proxy (GWAX). [43]

A central point of debate on GWA studies has been that most of the SNP variations found by GWA studies are associated with only a small increased risk of the disease, and have only a small predictive value. The median odds ratio is 1.33 per risk-SNP, with only a few showing odds ratios above 3.0. [2] [44] These magnitudes are considered small because they do not explain much of the heritable variation. This heritable variation is estimated from heritability studies based on monozygotic twins. [45] For example, it is known that 80-90% of variance in height can be explained by hereditary differences, but GWA studies only account for a minority of this variance. [45]

A challenge for future successful GWA study is to apply the findings in a way that accelerates drug and diagnostics development, including better integration of genetic studies into the drug-development process and a focus on the role of genetic variation in maintaining health as a blueprint for designing new drugs and diagnostics. [46] Several studies have looked into the use of risk-SNP markers as a means of directly improving the accuracy of prognosis. Some have found that the accuracy of prognosis improves, [47] while others report only minor benefits from this use. [48] Generally, a problem with this direct approach is the small magnitudes of the effects observed. A small effect ultimately translates into a poor separation of cases and controls and thus only a small improvement of prognosis accuracy. An alternative application is therefore the potential for GWA studies to elucidate pathophysiology. [49]

One such success is related to identifying the genetic variant associated with response to anti-hepatitis C virus treatment. For genotype 1 hepatitis C treated with Pegylated interferon-alpha-2a or Pegylated interferon-alpha-2b combined with ribavirin, a GWA study [50] has shown that SNPs near the human IL28B gene, encoding interferon lambda 3, are associated with significant differences in response to the treatment. A later report demonstrated that the same genetic variants are also associated with the natural clearance of the genotype 1 hepatitis C virus. [51] These major findings facilitated the development of personalized medicine and allowed physicians to customize medical decisions based on the patient's genotype. [52]

The goal of elucidating pathophysiology has also led to increased interest in the association between risk-SNPs and the gene expression of nearby genes, the so-called expression quantitative trait loci (eQTL) studies. [53] The reason is that GWAS studies identify risk-SNPs, but not risk-genes, and specification of genes is one step closer towards actionable drug targets. As a result, major GWA studies by 2011 typically included extensive eQTL analysis. [54] [55] [56] One of the strongest eQTL effects observed for a GWA-identified risk SNP is the SORT1 locus. [40] Functional follow up studies of this locus using small interfering RNA and gene knock-out mice have shed light on the metabolism of low-density lipoproteins, which have important clinical implications for cardiovascular disease. [40] [57] [58]

Atrial fibrillation Edit

For example, a meta-analysis accomplished in 2018 revealed the discovery of 70 new loci associated with atrial fibrillation. It has been identified different variants associated with transcription factor coding-genes, such as TBX3 and TBX5, NKX2-5 o PITX2, which are involved in cardiac conduction regulation, in ionic channel modulation and cardiac development. It was also identified new genes involved in tachycardia (CASQ2) or associated with alteration of cardiac muscle cell communication (PKP2). [59]

Schizophrenia Edit

While there is some research using a High-Precision Protein Interaction Prediction (HiPPIP) computational model that discovered 504 new protein-protein interactions (PPIs) associated with genes linked to schizophrenia, [60] [61] the evidence supporting the genetic basis of schizophrenia is actually controversial and may suffer from some of the limitation of this method of study. [62]

Plant growth stages and yield components Edit

GWA studies act as an important tool in plant breeding. With large genotyping and phenotyping data, GWAS are powerful in analyzing complex inheritance modes of traits that are important yield components such as number of grains per spike, weight of each grain and plant structure. In a study on GWAS in spring wheat, GWAS have revealed a strong correlation of grain production with booting data, biomass and number of grains per spike. [63]

Plant pathogens Edit

The emergences of plant pathogens have posed serious threats to plant health and biodiversity. Under this consideration, identification of wild types that have the natural resistance to certain pathogens could be of vital importance. Furthermore, we need to predict which alleles are associated with the resistance. GWA studies is a powerful tool to detect the relationships of certain variants and the resistance to the plant pathogen, which is beneficial for developing new pathogen-resisted cultivars. [64]

GWA studies have several issues and limitations that can be taken care of through proper quality control and study setup. Lack of well defined case and control groups, insufficient sample size, control for multiple testing and control for population stratification are common problems. [3] Particularly the statistical issue of multiple testing wherein it has been noted that "the GWA approach can be problematic because the massive number of statistical tests performed presents an unprecedented potential for false-positive results". [3] Ignoring these correctible issues has been cited as contributing to a general sense of problems with the GWA methodology. [65] In addition to easily correctible problems such as these, some more subtle but important issues have surfaced. A high-profile GWA study that investigated individuals with very long life spans to identify SNPs associated with longevity is an example of this. [66] The publication came under scrutiny because of a discrepancy between the type of genotyping array in the case and control group, which caused several SNPs to be falsely highlighted as associated with longevity. [67] The study was subsequently retracted, [68] but a modified manuscript was later published. [69]

In addition to these preventable issues, GWA studies have attracted more fundamental criticism, mainly because of their assumption that common genetic variation plays a large role in explaining the heritable variation of common disease. [70] Indeed, it has been estimated that for most conditions the SNP heritability attributable to common SNPs is <0.05. [71] This aspect of GWA studies has attracted the criticism that, although it could not have been known prospectively, GWA studies were ultimately not worth the expenditure. [49] GWA studies also face criticism that the broad variation of individual responses or compensatory mechanisms to a disease state cancel out and mask potential genes or causal variants associated with the disease. [72] Additionally, GWA studies identify candidate risk variants for the population from which their analysis is performed, and with most GWA studies stemming from European databases, there is a lack of translation of the identified risk variants to other non-European populations. [73] Alternative strategies suggested involve linkage analysis. [74] [75] More recently, the rapidly decreasing price of complete genome sequencing have also provided a realistic alternative to genotyping array-based GWA studies. It can be discussed if the use of this new technique is still referred to as a GWA study, but high-throughput sequencing does have potential to side-step some of the shortcomings of non-sequencing GWA. [76]

Genotyping arrays designed for GWAS rely on linkage disequilibrium to provide coverage of the entire genome by genotyping a subset of variants. Because of this, the reported associated variants are unlikely to be the actual causal variants. Associated regions can contain hundreds of variants spanning large regions and encompassing many different genes, making the biological interpretation of GWAS loci more difficult. Fine-mapping is a process to refine these lists of associated variants to a credible set most likely to include the causal variant.

Fine-mapping requires all variants in the associated region to have been genotyped or imputed (dense coverage), very stringent quality control resulting in high-quality genotypes, and large sample sizes sufficient in separating out highly correlated signals. There are several different methods to perform fine-mapping, and all methods produce a posterior probability that a variant in that locus is causal. Because the requirements are often difficult to satisfy, there are still limited examples of these methods being more generally applied.


ملاحظات ختامية

Despite the enormous progress achieved by DNA- investigating technologies, such as SNP arrays and exome capturing/re-sequencing, the current knowledge on how genetic variants influence exceptional longevity in humans is still based on the old candidate gene approaches. The adoption of innovative study designs combined with novel genetic platforms and innovative statistical methods hopefully will bring to the identification of new intervention points at which to modulate aging and the diseases of aging.


شاهد الفيديو: أندر الطفرات الجينية لدى البشر - الجزء الثاني (ديسمبر 2022).