معلومة

النوكليوتيدات المفردة والأمراض

النوكليوتيدات المفردة والأمراض


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أكتب تقريرًا عن كيفية حدوث تعدد أشكال النوكليوتيدات المفردة في كل منطقة من هذه المناطق:

  1. مواقع ربط عامل النسخ (TF)
  2. إشارات Epigentic
  3. متغيرات الربط
  4. مواقع ربط MicroRNA
  5. مناطق الترميز

يمكن أن تسبب الأمراض. اقتراح الأدبيات ذات الصلة منك أو مجرد المعلومات التي تعرف أنها ستكون ممتنة


ستقوم SNPs في جميع هذه المناطق بتعديل تسلسل الحمض النووي. تعتمد التأثيرات على مكان وجود SNP بالضبط. سوف ألخص الشروط التي يمكن أن تكون فيها التأثيرات قصوى

  1. مواقع ربط عوامل النسخ (TFs): SNP في مواضع النيوكليوتيدات التي ترتبط بالتعرف على الأحماض الأمينية في TF
  2. الإشارات الطارئة: C-> X [x: A، G، T] يمكن أن تؤدي SNPs إلى تعطيل النقاط الساخنة لمثيلات الحمض النووي
  3. متغيرات الربط: يمكن أن تتسبب النيوكلوتايد في مواقع المانحين / المتقبلين في احتباس الإنترون
  4. مواقع ربط microRNA: SNP في منطقة البذور يمكن أن يلغي استهداف ميرنا
  5. مناطق الترميز: يمكن لبعض SNPs إنشاء أكواد توقف سابقة لأوانها على سبيل المثال CAG (Gln) -> UAG (توقف)

هناك الكثير من العمل على تعدد الأشكال. إذا بحثت في جميع هذه الفئات في موقع منشور ، فستحصل على العديد من المقالات البحثية بالإضافة إلى المراجعات.


علم الأحياء / DNA

مقدمة

تعدد الأشكال أحادي النوكليوتيدات (SNPs) هي اختلافات زوج أساسي (bp) في مواقع محددة في الجينوم. وفقًا للتعريف ، لا يُعتبر التباين الجيني في موضع bp واحد بمثابة SNP ما لم يكن لدى أليلين على الأقل ترددات تزيد عن 1 ٪ في مجموعة كبيرة من الأفراد غير المرتبطين. يتكون الجينوم البشري أحادي الصبغة من حوالي 3 مليارات نقطة أساس. يقدر عدد SNPs بـ 10-11 مليون ، مما يعطي متوسط ​​SNP واحد لكل 275 نقطة أساس. تحتوي الغالبية العظمى من SNPs على أليلين فقط لأن معدل الطفرة في موقع bp معين منخفض للغاية ومن غير المرجح أن تحدث طفرات نقطية في نفس الموضع بمرور الوقت. لهذا السبب ، تم استخدام SNPs على نطاق واسع لرسم خريطة لتاريخ السكان من خلال تحديد توزيع أليلات SNP بين المجموعات السكانية الحالية والسابقة. تعد علامات SNP أيضًا الخيار الأفضل لبناء مجموعة كثيفة من العلامات متعددة الأشكال التي يمكن استخدامها لدراسة الارتباط بين العلامات وسمة أو مرض معين.

تستخدم النيوكلوتايد في العديد من الاستخدامات المحتملة في التحقيقات الجينية الجنائية ، بما في ذلك تقدير العرق أو السمات البشرية أو الأمراض. تم تناول هذه القضايا في مقالات أخرى من هذا الكتاب. هنا ، تتم مناقشة استخدام النيوكلوتايد لتحديد الهوية البشرية.


الدراسات الجينية لسمك السلور: التقدم والمنظورات

يولين جين. Zhanjiang Liu، in Genomics in Aquaculture، 2016

النوكليوتيدات المفردة

تعدد أشكال النوكليوتيدات المفردة (SNPs) هي تعدد الأشكال التي تسببها الطفرات النقطية التي تؤدي إلى ظهور أليلات مختلفة تحتوي على قواعد بديلة في موضع معين من النوكليوتيدات داخل موضع معين. بسبب وفرتها العالية في الجينوم ، تعمل SNPs بالفعل كنوع العلامة السائد. يتم تطبيق العديد من تقنيات التسلسل وأساليب المعلوماتية الحيوية لتطوير وتحديد SNP ، مثل التسلسل العشوائي للبندقية ، والتسلسل المستهدف PCR amplicon ، وتسلسل RNA ، والتعدين المعلوماتي الحيوي لقواعد بيانات ESTs (Liu and Cordes ، 2004). لتحديد تعدد الأشكال المشتقة من EST ، تم وضع معايير الجودة من أجل تقليل احتمالية حدوث أخطاء في التسلسل (Wang et al. ، 2008). قدمت Contigs مع أربعة متواليات على الأقل مع تمثيل تسلسل أليل ثانوي مرتين على الأقل معدلًا عاليًا للتحقق من صحة SNP. باستخدام موارد EST من سمك السلور القناة ، وانج وآخرون. (2010) حددت أكثر من 300000 تعدد الأشكال المفترضة. استنادًا إلى RNA-Seq ، تم تحديد أكثر من 2 مليون تعدد الأشكال المفترضة من سمك السلور القناة ، في حين تم تحديد ما يقرب من 2.5 مليون تعدد الأشكال المفترضة من سمك السلور الأزرق باستخدام الجيل التالي من تكنولوجيا تسلسل الحمض النووي (Liu et al. ، 2011). من هذه النيوكلوتايد المفترضة ، تم تحديد مجموعة من النيوكلوتايد المفلترة ، والتي تضمنت 342،104 تعدد أشكال النيوكلوتايد غير المحدد لسمك السلور القناة ، و 366،269 تعدد أشكال النيوكلوتايد غير النوعي لسمك السلور الأزرق ، و 420،727 تعدد الأشكال متعدد الأنواع بين سمك السلور وسمك السلور الأزرق. تم توزيع هذه النيوكلوتايد المفلترة ضمن 16،562 جينًا فريدًا في سمك السلور القناة و 17،423 جينًا فريدًا في سمك السلور الأزرق (Liu et al. ، 2011). في الآونة الأخيرة ، قدمت إعادة تسلسل الجينوم الكامل لأربعة مجموعات رئيسية لتربية الأحياء المائية من أسماك السلور ، بالإضافة إلى مجموعة طبيعية واحدة ، ما مجموعه 8.4 مليون تعدد الأشكال المفترضة (Sun et al. ، 2014). توفر النيوكلوتايد التي تم تحديدها موردًا تشتد الحاجة إليه للدراسات الجينية في المجتمع العلمي لسمك السلور ، مما يساهم في تطوير منصات التنميط الجيني عالية الكثافة والفعالة من حيث التكلفة. سيشكل التحقق من صحة واختبار تعدد الأشكال باستخدام مصفوفات SNP الأساس المادي لدراسات ارتباط الجينوم والاختيار الكامل المستند إلى الجينوم في سمك السلور (Liu et al. ، 2011 ، 2014).


تعدد أشكال النوكليوتيدات المفردة (SNP): المعنى والأصل وتفاصيل أخرى

إن تعدد الأشكال أحادي النوكليوتيدات أو SNP (يُنطق & # 8216snip & # 8217) هو تغيير جيني صغير ، أو اختلاف ، يمكن أن يحدث داخل تسلسل الحمض النووي.

تحدد أحرف النوكليوتيدات الأربعة A (الأدينين) و C (السيتوزين) و T (الثايمين) و G (الجوانين) الشفرة الجينية.

يحدث تباين SNP عندما يحل نيوكليوتيد واحد ، مثل A ، محل أحد الأحرف النوكليوتيدية الثلاثة الأخرى & # 8211 C أو G أو T (الشكل 20-1).

من خلال التعريف الكلاسيكي لتعدد الأشكال ، يجب أن يكون تواتر الاختلاف 1 ٪ على الأقل لتأهيل تغيير النيوكليوتيدات كتعدد الأشكال. هذه التغييرات النوكليوتيدية التي تحدث بنسبة أقل من 1٪ تسمى متغير نادر.

نظرًا لأن حوالي 1.1 إلى 1.4 ٪ فقط من رموز تسلسل الحمض النووي للشخص والبروتينات ، تم العثور على معظم SNPs خارج تسلسلات الترميز. لا يُتوقع عادةً أن يكون للنيوكليوتيدات SNP الموجودة خارج منطقة الترميز أي تأثير على النمط الظاهري للكائن الحي. تعتبر SNPs الموجودة في تسلسل تشفير ذات أهمية خاصة للباحثين حيث من المرجح أن تغير الوظيفة البيولوجية للبروتين ، على الرغم من أن هذه التغييرات لها تأثير أقل خطورة بكثير من تأثير الطفرات.

نظرًا للتطورات الحديثة في مجال تحديد الجينات وتوصيفها ، كانت هناك موجة هائلة من اكتشاف SNP. يبدو أن العثور على تغييرات نوكليوتيدات مفردة في جميع أنحاء الجينوم البشري هو عمل ضخم ، ولكن على مدار العشرين عامًا الماضية ، طور الباحثون عددًا من التقنيات التي تجعل ذلك ممكنًا.

تستخدم كل تقنية طريقة غير متطابقة مماثلة لمقارنة مناطق مختارة من تسلسل الحمض النووي التي تم الحصول عليها من عدة أفراد يشتركون في سمة مشتركة. في كل اختبار ، تُظهر النتيجة اختلافًا في عينات الحمض النووي عندما يتم اكتشاف SNP في فرد واحد في مجموعة قيد الاختبار.

توزيع النيوكلوتايد:

لا يتم توزيع النيوكلوتايد بشكل موحد على الجينوم. يتم توزيع عدد كبير من SNPs في جميع أنحاء المنطقة غير المشفرة من الجينوم. نظرًا لأن هذه المناطق خالية من ضغط الاختيار ، يتم تحديد هذه التغييرات بشكل محايد ويتم إصلاحها بمرور الوقت. تختلف أنماط توزيع SNPs حتى في كروموسوم واحد.

على سبيل المثال ، تظهر المناطق المسؤولة عن تقديم المستضد إلى الجهاز المناعي ، الموجودة على الكروموسوم 6 ، تباينًا عاليًا جدًا في النوكليوتيدات على عكس المناطق الأخرى من نفس الكروموسوم.

أصل وبقاء وتثبيت النيوكلوتايد:

يعد SNP المصدر الرئيسي للتباين في الجينوم ويمثل 90٪ من تعدد الأشكال البشرية.

هناك نوعان من استبدال قاعدة النيوكليوتيدات:

يحدث التحول ، الذي يمثل ما يقرب من ثلثي جميع SNPs ، بين البيورينات (على سبيل المثال A & gt G) أو بيريميدين (مثل C & gt T).

يحدث التحويل بين البيورينات والبيريميدين (مثل A & gt C و G & gt T).

يخضع SNP لسلسلة من إجراءات الاختيار قبل أن يتم إنشاؤه في النهاية.

يمكن تقسيم حياته تقريبًا إلى 4 مراحل:

1) الظهور بوسائل الطفرات النقطية.

2) النجاة من ضغط اختيار الطبيعة.

3) الانتشار عبر الأجيال.

4) إثبات نفسها بنسبة 1٪ على الأقل من جميع الأليلات.

التغيير الأكثر شيوعًا في البشر هو الطفرة من CpG إلى TpG (يمثل الانتقال حوالي 25 ٪ من جميع الطفرات). تسبب هذه الآلية انخفاضًا في عدد ثنائي النوكليوتيدات CG في الجينوم نظرًا لأن العديد منها يصبح في النهاية TG ، بينما سيتم إنشاء مواقع CpG الجديدة بواسطة طفرات أخرى أقل تكرارًا.

نظرًا لأن 1.1 ٪ فقط إلى 1.4 ٪ من أكواد الجينوم للبروتينات من المحتمل أن تحدث SNPs في التسلسلات غير المشفرة بشكل متكرر. حتى لو حدث SNP في تسلسل تشفير ، فقد يكون له في الغالب تأثير خفي وغير ضار على البروتينات المعبر عنها. تتم إزالة التغييرات التي تمثل التأثيرات الضارة في النهاية من الجينوم عن طريق الانتقاء الطبيعي. ومن ثم للوصول إلى حالة SNP ، يجب أن تكون الطفرة النقطية غير ضارة ليتم اختيارها (Miller and Kwok ، 2001).

الاستعداد الجيني:

لا تنتج معظم الأمراض الشائعة بين البشر عن اختلاف جيني داخل جين واحد ، ولكنها تتأثر بالتفاعلات المعقدة بين الجينات المتعددة بالإضافة إلى العوامل البيئية ونمط الحياة. على الرغم من أن العوامل البيئية وعوامل نمط الحياة تضاف إلى النمط الظاهري للمرض ، إلا أنه من الصعب قياس وتقييم تأثيرها العام على عملية المرض.

يشار إلى احتمال إصابة الفرد بمرض يعتمد على الجينات والعوامل الوراثية على أنها الاستعداد الوراثي. تمنح العوامل الوراثية القابلية أو المقاومة للمرض وتحدد شدة المرض أو تطوره.

لا تزال معظم عوامل الاستعداد غير معروفة. وجد الباحثون صعوبة في تطوير اختبارات الفحص لمعظم الأمراض والاضطرابات. أدى الارتباط المظهري لبعض SNPs الترميز مع اضطراب في ذلك الجين المحدد إلى تحديد الجانب الوظيفي لـ SNPs.

يمكن أيضًا استخدام تعدد الأشكال للنيوكليوتيدات المنفردة كأداة لتحديد الجينات المسؤولة عن المرض أو الجينات التي تنقل نمطًا ظاهريًا معينًا للمرض. من خلال دراسة امتدادات تسلسل الحمض النووي التي تم العثور عليها لإيواء SNP المرتبط بسمة المرض ، قد يبدأ الباحثون في الكشف عن الجينات ذات الصلة المرتبطة بمرض ما.

سيسمح فهم دور العوامل الوراثية في المرض أيضًا للباحثين بإجراء تقييم أفضل لدور العوامل غير الجينية - مثل الموطن والتربية والسلوك والنظام الغذائي ونمط الحياة والنشاط البدني على المرض.

نظرًا لأن العوامل الوراثية تؤثر أيضًا على استجابة الفرد للعلاج بالعقاقير ، فإن النيوكلوتايد (SNPs) ستكون مفيدة في مساعدة الباحثين على تحديد وفهم سبب اختلاف الأفراد في قدراتهم على استقلاب بعض الأدوية ، وكذلك تحديد سبب تعرض الفرد لأثر جانبي ضار. لدواء معين.

لذلك ، يعد الاكتشاف الأخير للنيوكلوتايد النيكوتين (SNPs) بإحداث ثورة ليس فقط في عملية اكتشاف المرض ، ولكن أيضًا في ممارسة الطب الشخصي والوقائي والعلاجي.

تطبيق النيوكلوتايد في دراسات علم الصيدلة:

معدلات الاستجابة تجاه الأدوية الرئيسية والشائعة تختلف بشكل واضح بين الأفراد (الجدول 1). تنسب SNPs بطريقة رئيسية نحو هذه الظاهرة. إن استخدام أشكال النيوكلوتايد في دراسة جينات الاستجابة للأدوية لديه القدرة على المساعدة في إنشاء الطب الشخصي كما هو موضح في (الشكل 20.2). كما ذكرنا سابقًا ، قد ترتبط SNPs أيضًا بعملية التمثيل الغذائي ، أي امتصاص وتصفية العوامل العلاجية.

في الوقت الحالي ، لا يوجد فحص جيني معياري لجينات استقلاب الدواء لتحديد كيفية استجابة المريض لدواء معين. قد يكون العلاج الذي أثبت فعاليته في مريض واحد غير فعال في مرضى آخرين. قد يعاني بعض المرضى أيضًا من تفاعل مناعي ضار تجاه دواء معين.

ومن ثم فإن شركات الأدوية تحد من إنتاجها من الأدوية التي يستجيب لها "متوسط ​​& # 8217 مريض". نتيجة لذلك ، تبقى مجموعة أصغر نسبيًا من المرضى الذين يؤويون أي اختلاف جيني مفترض (مثل SNP) ، مما يجعلهم غير قادرين على استقلاب هذا الدواء ، دون علاج. العديد من الأدوية التي قد تفيد تلك المجموعة الصغيرة من المرضى لا يتم تسويقها أبدًا لأن هذه الأدوية ستدر ربحًا أقل لصناعات الأدوية.

* SSRI = مثبطات امتصاص السيروتونين الانتقائية

تُظهر البيانات الواردة في الجدول أعلاه (مأخوذة من مرجع مكتب الأطباء ، الطبعة 54 ، شركة الاقتصاديات الطبية ، 2000) محدودية فعالية الأدوية الموصوفة لتخفيف المرض بين الأفراد المصابين وتؤكد على أهمية الاستكشاف من أجل التشخيص الشخصي. الطب القائم على التركيب الجيني للأفراد.

كشفت حقبة ما بعد الجينوم عن ارتباط SNP بأمراض بشرية معينة إما بشكل مباشر أو غير مباشر. على سبيل المثال ، أظهرت الدراسات الجينية وجود علاقة معقدة بين:

(أ) تعدد الأشكال في جين عامل التخثر F5 وتجلط الأوردة العميقة ،

(ب) التغيير الجيني في جين المستقبل الكيميائي CCR5 والقابلية للإصابة بفيروس نقص المناعة البشرية والعلاقة بين مجموعة من النيوكلوتايد والأمراض الأخرى (مكارثي وهيلفيكر ، 2000).

تمثل هذه الارتباطات نموذجًا لنهج الجينات المرشح وبالتالي يمكن أن تكون مفيدة لتحديد حالة الاستعداد للمرض لدى الفرد (الجدول 2). وبالمثل ، تُرى الارتباطات أيضًا بين الاختلافات في SNP والاستجابة للأدوية لدى الأفراد (الجدول 3). على سبيل المثال ، تم ربط المتغيرات الجينية في إنزيم استقلاب الدواء (ثيوبورين ميثيل ترانسفيراز TPMT) بالتفاعلات الدوائية الضائرة (Snow & amp Gibson ، 1995). . ارتبطت SNPs في جين Apolipoprotein E (APOE) بالاستجابة تجاه مثبطات الكولينستراز في مرضى الزهايمر & # 8217s.

تظهر التأثيرات المباشرة لـ SNP أيضًا في العديد من الأمراض الشائعة. في الآونة الأخيرة تم تحديد النيوكلوتايد (SNPs) المسؤولة عن زيادة خطر الإصابة بمرض السكري. المتغير الجيني الشائع بسبب SNP هو جين جاما لمستقبلات البيروكسيسوم المنشط (PPAR) ، الموجود في حوالي 25 ٪ من مرضى السكري من النوع 2 في السكان ، ويعتقد أنه يجعل الأفراد أكثر عرضة للإصابة بمرض السكري (Altshuler et al. 2000).

على الرغم من أن هذه الاختلافات لها تأثير متواضع على المخاطر الفردية ولكنها لا تزال تؤثر على جزء كبير من السكان. على عكس تحديد المشاركة المباشرة لـ SNPs في المرض ، فإن تحديد واستخدام SNPs في الجين المسؤول عن استقلاب الدواء وإزالة السموم محدود.

كأساطير استجابة الدواء عند إعطاء الدواء ، لا يمكن تحديد & # 8216 المستجيبين وغير المستجيبين & # 8217 إلا بعد تلقي الدواء. وهذا يجعل من الصعب التعرف على الأفراد من السكان (مكارثي وهيلفيكر ، 2000). قد تكون الدراسة المترابطة لتأثير دواء ما على عدد كبير من السكان معروفة بالفعل ، متبوعة بفحص SNP للجينات المشتبه بها ، متبوعة بتفسير إحصائي ، مفيدة في فهم علاقة النمط الظاهري للنيوكليوتيدات SNP.

في المستقبل ، يمكن تحديد الدواء الأنسب للفرد واستخدامه للعلاج من خلال تحليل ملف تعريف SNP للمريض. إن القدرة على استهداف دواء للأفراد الذين من المرجح أن يستفيدوا منها ، والمشار إليها بـ & # 8216 الطب المخصص & # 8217 ستسمح لشركات الأدوية بجلب المزيد من الأدوية إلى السوق والسماح للأطباء بوصف علاجات فردية خاصة باحتياجات المريض.

يمكن دمج المعلومات مع موارد أخرى مثل بنية البروتينات. باستخدام نهج حسابي ، يمكن رسم ترميز SNPs على بنية البروتين ثلاثية الأبعاد ويمكن ربط التغييرات الملحوظة بالنمط الظاهري.

إن تطبيق البيانات الهيكلية للبحث في التباين الجيني له فائدة هائلة للدراسات على الأساس الجيني للتنوع المظهرى. يمكن أن تستفيد صناعة المستحضرات الصيدلانية من جينات استقلاب الدواء & # 8216SNP وقاعدة بيانات الطفرات & # 8217 التي تحتوي على معلومات تتعلق بهيكل تعدد الأشكال ، والنسبة المئوية في السكان التي تحمل الأنماط الجينية المتغيرة ، وتأثيرها الظاهري استجابة للعلاج الدوائي.

الأهمية الهيكلية والوظيفية لـ SNPs:

بالإضافة إلى SNPs التي تحدث في تسلسل ترميز الجينات ، فقد لوحظت الأهمية الوظيفية لـ SNPs أيضًا في الحمض النووي غير المشفر (مثل الإنترونات) بما في ذلك التنظيم (مثل المروجين والمعززات وما إلى ذلك). أحد الأمثلة الجيدة على SNP الوظيفي هو في منطقة غير مشفرة هو جين تاو. تم مؤخرًا فك شفرة بنية عنصر tau exon 10 التنظيمي للربط من RNA ، وقد ثبت أنه يشكل بنية حلقة جذعية مطوية ثابتة.

أمثلة أخرى هي:

تؤثر SNP Intronic على مواقع لصق:

تسبب منطقة الترميز والطفرات المزمنة في جين تاو الخرف الجبهي الصدغي وداء باركنسون المرتبط بالكروموسوم 17. تزيد الطفرات المزمنة وبعض الطفرات المغلوطة من التضفير في إكسون 10 ، مما يؤدي إلى زيادة نسبة الأشكال الإسوية تاو المكونة من أربع مرات متكررة إلى ثلاث مرات متكررة (فاراني) وآخرون 1999).

المروج SNPs التي تؤثر على التعبير الجيني:

يمكن أن تؤثر SNPs على التعبير الجيني إذا حدث أنها تقع على المحفز أو أي تسلسل تحكم آخر في الجين. ترتبط عوامل النسخ وبوليميراز الحمض النووي الريبي بشكل تفاضلي بالمحفزات بناءً على سياق التسلسل ، مما يؤثر على نمط التعبير عن الجين. تُظهر الأدلة الحديثة أن تعدد الأشكال في المنطقة المحفزة لـ TNF-α و IL-1β وعدد قليل من السيتوكينات الأخرى تعزز تعبيرها ، وبالتالي تجعل الأفراد أكثر مناعة ضد بعض الالتهابات البكتيرية وغيرها من الأمراض المسببة للأمراض (El-Omar et al. 2000).

النيوكلوتايد في مناطق الترميز التي تؤثر على بنية البروتين:

يمكن أن يؤدي التغيير الدقيق في الحمض النووي إلى تغيير جذري في بنية البروتين كما تمت مناقشته. تم تحديد العلاقة الهيكلية والوظيفية لصميم البروتين الدهني (apo) E في استقلاب البروتين الدهني ، وأمراض القلب ، وأمراض التنكس العصبي ، بما في ذلك مرض الزهايمر ومرض # 8217. ApoE عبارة عن بروتين بطول 299 حمضًا أمينيًا مع مجالين وظيفيين.

يحتوي المجال الأميني الذي يحتوي على البقايا 1-191 على منطقة ربط مستقبلات البروتين الدهني منخفض الكثافة (LDL) ، ويحتوي المجال الطرفي الكربوكسيل على عناصر ربط الدهون الرئيسية.

تختلف الأشكال الإسوية البشرية الثلاثة الشائعة - apoE2 و apoE3 و apoE4 - في موضعين فقط في البروتين ولكن لها خصائص أيضية مختلفة تمامًا وتأثيرات دراماتيكية على المرض (الشكل 20.3). يرتبط ApoE3 (Cys-112، Arg-158) بشكل طبيعي بمستقبل LDL ويرتبط بعملية التمثيل الغذائي للدهون الطبيعية ، بينما يرتبط apoE2 (Cys-112، Cys- 158) بشكل معيب بمستقبل LDL ويرتبط بالنوع الثالث من الاضطراب الوراثي فرط بروتينات الدم. يرتبط ApoE4 (Arg-112، Arg-158) بشكل طبيعي بمستقبل LDL ولكنه يرتبط بارتفاع مستويات الكوليسترول وبالتالي زيادة خطر الإصابة بأمراض القلب والأوعية الدموية (Morrow et al.2002). بالإضافة إلى ذلك ، فقد لوحظ أن apoE4 هو عامل خطر رئيسي لمرض الزهايمر & # 8217.

لم يُظهر عدد من دراسات الحالة الحديثة حول تأثير SNP على بنية ووظيفة البروتينات التغيير الهيكلي المحدد للبروتين في المرض فحسب ، بل أعطت أيضًا نظرة ثاقبة للآليات التنظيمية للبروتين الأصلي. يؤدي وجود طفرة نقطية (Leu55Pro) في α1-antichymotrypsin ، مثبط البروتياز لعائلة السربين الفائقة ، إلى فقدان نشاطها (Sunyaev et al. 2001).

التغيير في البروتين بسبب الطفرة النقطية يسبب مرض الانسداد الرئوي. وبالمثل ، ترتبط الطفرة النقطية في صميم البروتين الشحمي البشري A-1 (ApoA-1) بمرض القلب التاجي (Sunyaev et al.2001). تعطينا هذه الدراسات حول تأثيرات تغييرات النوكليوتيدات المفردة على بنية البروتين نظرة ثاقبة لكل من سبب المرض ووظائف البروتين.

تم إجراء دراسات مماثلة في مستقبلات ميو أفيونية المفعول ، oprm 1. المستقبلات الأفيونية الميو هي الموقع الأساسي لعمل المواد الأفيونية الأكثر استخدامًا ، بما في ذلك المورفين والهيروين والفنتانيل والميثادون. أكثر أشكال SNP انتشارًا موجودة في حوالي 10 ٪ من السكان هو استبدال النيوكليوتيدات في الموضع 118 (118 A & gt G) ، مع تغير متوقع في الأحماض الأمينية في موقع N-glycosylation المفترض.

على الرغم من أن البروتين المتغير الناتج عن 118 A & gt G SNP لم يُظهر تقاربات ارتباط متغيرة لمعظم الببتيدات والقلويدات الأفيونية التي تم اختبارها ، فإن مستقبلات متغير 118 A & gt G المرتبط بـ beta-endorphin مادة أفيونية تنشط مستقبلات الأفيون ، وترتبط تقريبًا 3 مرات أكثر بإحكام من الشكل الأليلي الأكثر شيوعًا للمستقبلات.

علاوة على ذلك ، فإن بيتا إندورفين أقوى بثلاث مرات تقريبًا في مستقبل متغير 118 A & gt G مقارنة بالشكل الأليلي الشائع في التنشيط الناجم عن ناهض قنوات البوتاسيوم المقترنة بالبروتين G. تشير هذه النتائج إلى أن 118 A & gt G SNP في جين مستقبلات المواد الأفيونية قد يكون له آثار على علم وظائف الأعضاء الطبيعي وقابلية الإصابة بأمراض متنوعة بما في ذلك الأمراض المسببة للإدمان (Bond et al.1998).

كما تم تحديد علاقة النيوكلوتايد مع ضغط الدم. لوحظت تغيرات النوكليوتيدات المنفردة في جين مولد الأنجيوتنسين (AGT) ، وهو أمر شائع عند الأشخاص المصابين بارتفاع ضغط الدم. تم اختبار عزلة وراثية دينية في أمريكا الشمالية ، Hutterites ، للارتباط بين الاختلاف في ضغط الدم الانقباضي والانبساطي وتعدد أشكال الإدراج / الحذف للإنزيم المحول للأنجيوتنسين ، ACE و 2 تعدد أشكال البروتين من AGT (بمعنى ، M235T و T174M).

ارتبطت الأنماط الجينية للكودون 174 بشكل كبير مع الاختلاف في ضغط الدم الانقباضي لدى الرجال وشكلت 3.1٪ من التباين الكلي. كان للزيجوت المتماثل لـ AGT174M أعلى متوسط ​​BP ، يليه متغاير الزيجوت ومتجانسة الزيجوت لـ AGT174T كان له أدنى متوسط ​​BP (Hegele et al. 1996).

SNPs كعلامات وراثية:

معظم النيوكلوتايد غير مسؤولة عن حالة المرض. بدلاً من ذلك ، قد تكون بمثابة علامات بيولوجية لتتبع جين (جينات) المرض على خريطة الجينوم البشري. نظرًا لأن SNPs تحدث بشكل متكرر في جميع أنحاء الجينوم وهي مستقرة نسبيًا ، فإنها تعمل كواسمات بيولوجية ممتازة. الواسمات البيولوجية هي أجزاء من الحمض النووي ذات موقع مادي محدد مسبقًا في الكروموسوم ، والتي يمكن تتبعها بسهولة واستخدامها لبناء خريطة كروموسومية لموضع الجينات المعروفة بالنسبة لبعضها البعض.

تتيح هذه الخرائط التعرف على السمات الناتجة عن تفاعل أكثر من جين واحد. ومن ثم تلعب هذه الاستراتيجية دورًا رئيسيًا في حالات الاضطرابات الجينية المعقدة. تُفضل علامات SNP ، على الرغم من biallelic ، على علامات الأقمار الصناعية الدقيقة لأن الطفرات المتكررة نادرة جدًا بشكل عام في حالة SNPs.

يلعب المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) دورًا مهمًا في تسهيل تحديد وفهرسة SNPs من خلال إنشاء وصيانة قاعدة بيانات SNP العامة (dbSNP) ، ويمكن الوصول إلى هذا من قبل مجتمع الطب الحيوي في جميع أنحاء العالم ويهدف إلى تسهيل العديد مجالات البحث البيولوجي.

SNP في دراسات اختلال التوازن:

تميل الأليلات المعينة في المواقع المجاورة إلى التوارث المشترك. بالنسبة للمواضع المرتبطة بإحكام ، قد يؤدي ذلك إلى الارتباط بين الأليلات في السكان - وهي خاصية تُعرف باسم اختلال توازن الارتباط (LD) (Ardlie et al.2002). يمكن تفسير ظاهرة صعوبة التعلم على أساس الفصل المشترك بين أليلين مرتبطين بإحكام في مجتمع ما ، حيث يتم اختيار شكل واحد من النمط الفرداني عندما يواجه المجتمع عنق الزجاجة.

في وقت لاحق ، يصبح النمط الفرداني المحدد هو النمط الفرداني المؤسس كما هو موضح في (الشكل 20.4). يكون للطفرة وإعادة التركيب التأثير الأكثر وضوحًا على صعوبة التعلم. العوامل الإضافية التي تساهم في مدى وتوزيع صعوبة التعلم هي الانجراف الجيني ، النمو السكاني ، الاختلاط السكاني ، الهجرة ، الانتقاء الطبيعي ، إعادة التركيب المتغير ومعدلات الطفرات وتحويل الجينات.

مقاييس صعوبة التعلم:

يمكن حساب اختلال التوازن بين النقطتين A و B بالتعبير:

أين صAB هو تواتر النمط الفرداني الذي يتكون من الأليل A و B

صأ و صب هي ترددات الأليلين A و B في الموضعين A و B على التوالي.

يحدث تآكل LD مع مرور الوقت والمسافة. ومن ثم يجب أخذ العامل & # 8216 الوقت & # 8217 و & # 8216 المسافة & # 8217 في الاعتبار عند حساب صعوبة التعلم.

إذا كان د0 هو مدى عدم التوازن عند نقطة البداية بين أليلين ، r بعيدًا عن بعضهما البعض ، واختلال التوازن t الأجيال اللاحقة (Dر):

الأمراض المعقدة و SNP:

تم تعيين معظم الجينات المسؤولة عن الاضطرابات أحادية الجين الرئيسية عن طريق الاستنساخ الموضعي. تتبع هذه الاضطرابات النمط المندلي للوراثة. لا تظهر أمراض مثل السكري والسرطان والربو والتهاب المفاصل الروماتويدي أي نمط واضح لمثل هذه الوراثة. يشار إلى هذه الاضطرابات على أنها أمراض معقدة أو متعددة العوامل.

يُفترض أن الأشكال المتعددة للنيوكليوتيدات المفردة يمكن استخدامها لتتبع الجينات المسؤولة عن الاضطرابات المعقدة. لهذا الغرض ، يمكن استخدام النيوكلوتايد التي تظهر الفصل المشترك مع مرض معين كعلامات لتحديد (خريطة) الموقع المسؤول عن المرض.

يمكن استخدام SNPs التي تم تحديدها في الجينات المرشحة لمرض معقد لتحديد مدى حساسية الفرد تجاه المرض ، وعندما يتأثر ملف تعريف SNP الخاص به للجينات المتعلقة بهدف الدواء ويمكن استخدام أيض الدواء لتحديد فعالية الأدوية المتاحة لـ أغراض علاجية.

مشروع HapMap الدولي: فهم الاختلافات الجينية البشرية الشائعة:

كما تم وصفه سابقًا ، يؤدي التفاعل المعقد بين العديد من الجينات والعوامل البيئية ونمط الحياة إلى الإصابة بأمراض شائعة ، مثل مرض السكري والسرطان والسكتة الدماغية وأمراض القلب والاضطرابات النفسية والربو وما إلى ذلك ، على الرغم من أن أي شخصين غير مرتبطين يتشابهان في حوالي 99.9 ٪ من الحمض النووي الخاص بهم التسلسل ، فإن نسبة 0.1٪ المتبقية مهمة لأنها تحتوي على المتغيرات الجينية التي توفر هويتها الفريدة وتؤثر أيضًا على التباين في مخاطر الإصابة بالمرض والاستجابة للأدوية. يوفر اكتشاف متغيرات تسلسل الحمض النووي التي تساهم في مخاطر الأمراض الشائعة واحدة من أفضل الفرص لفهم الأسباب المعقدة للمرض لدى البشر.

كانت هناك حاجة إلى جهد مركزي ومتعدد الجنسيات لرسم خريطة للاختلافات الشائعة في الجينوم البشري واكتشافها والتحقق من صحتها. تم تحقيق الخطوة الأولى نحو استيعاب هذه المعرفة في عام 2001 ، مع الانتهاء من تسلسل الجينوم البشري. وبالتالي بدأ مشروع HapMap الدولي

الهدف من المشروع هو تطوير خريطة النمط الفرداني للجينوم البشري ، HapMap ، والتي ستصف الأنماط الشائعة لتغير تسلسل الحمض النووي البشري. يعد المشروع أداة قوية وقاعدة بيانات ، تهدف إلى تسهيل اكتشاف المساهمات الجينية للأمراض الشائعة ، ويمكن استخدامها في الدراسات التي تقارن أنماط التباين الجيني (الأنماط الفردانية) لدى الأشخاص المصابين بمرض معين بالأنماط الموجودة في الأشخاص الذين لا يمتلكون مرض.

من خلال تحديد مناطق الجينوم البشري التي تظهر اختلافات في أنماط النمط الفرداني ، يمكن تحديد المتغيرات الجينية المعينة التي تساهم في المرض بسهولة. لإنتاج HapMap ، حلل الباحثون عينات دم من إجمالي 269 شخصًا من أربعة مجموعات سكانية كبيرة.

هؤلاء السكان هم: اليوروبا في إبادان ، نيجيريا ، اليابانيون في طوكيو هان الصينيون في بكين ويوتا سكان من أصول من شمال وغرب أوروبا. تم اختيار هذه المجموعات السكانية الأربعة لتشمل أشخاصًا من أصل من مناطق جغرافية منفصلة على نطاق واسع - القوقاز (أوروبا وأمريكا الشمالية) ، اليوروبان (الزنجية) والصينية واليابانية (المنغولية). ومن المثير للاهتمام ، أن السكان الهنود أو سكان جنوب آسيا غير ممثلين في HapMap.

في الهند ، تم اتخاذ العديد من المبادرات لدراسة الاختلافات الجينية في السكان الهنود ، وأهمها & # 8216 قاعدة بيانات تباين الجينوم الهندي (IGVdb) & # 8217. إن مشروعي HapMap و IGVdb لديهم القدرة على كشف الأساس الجيني للأمراض المعقدة التي تؤدي إلى اكتشافات للوقاية من مثل هذه الأمراض وعلاجها.

مبادرة هندية:

تعد شبه القارة الهندية بوتقة تنصهر فيها مختلف السكان والثقافة منذ فجر الحضارات ، ويمكن للسكان أن يكونوا نموذجًا مثاليًا لدراسة ملف تعريف النوكليوتيدات المفردة وتنوعها بسبب تنوعها ونسبها القديمة ، ويتألف السكان الهنود من أكثر من مليار شخص ، يتألفون من 4693 مجتمعًا مع الآلاف من مجموعات الزواج الداخلي ، و 325 لغة عاملة و 25 نصًا.

لفهم الأصل والتطور والتنوع وأنماط الهجرة للسكان ، تعمل SNP كأداة وراثية مثالية. علاوة على ذلك ، فإن الاستعداد للاضطرابات المعقدة والحساسية المتغيرة ورد الفعل تجاه الأدوية المختلفة له أهمية قصوى. لهذا الغرض ، بدأت ستة مختبرات مكونة لمجلس البحث العلمي والصناعي (CSIR) بالتعاون مع معاهد بحثية رائدة أخرى في الهند برنامج شبكة.

اتحاد تنوع الجينوم الهندي (IGV) لتحديد والتحقق من صحة تعدد الأشكال وتسلسلات التكرار متعددة الأشكال في آلاف الجينات من الجينوم البشري. تم اختيار هذه الجينات على أساس أهميتها كمرشحين وظيفيين وموضعيين في العديد من الأمراض الشائعة بما في ذلك الجينات ذات الصلة بعلم الصيدلة الجيني.

تم نشر مراجعة للدراسة المخطط لها في Human Genetics (قاعدة بيانات تنوع الجينوم الهندي IGVdb ، 2005). هذا هو أول جهد شامل واسع النطاق من الهند لفهم واستخدام اختلافات الجينوم الموجودة بالفعل لنشرها في صناعة الأدوية.

يتم جمع عينات الدم التي سيتم إجراء تحليل الحمض النووي عليها من العديد من القبائل الأصلية والسكان في الهند. من المتوقع أن تعطي البيانات نظرة ثاقبة على التركيبة السكانية الهندية ، وتطورها مع تأثير بعيد المدى في دراسة الأمراض المعقدة الشائعة وعلم الصيدلة الجيني.


تعدد الأشكال النوكليوتيدات واحد

تأتي أهمية تعدد الأشكال من قدرتها على التأثير في مخاطر الأمراض ، وفعالية الأدوية والآثار الجانبية ، وإخبارك عن أسلافك ، والتنبؤ بجوانب كيف تبدو وحتى تتصرف. ربما تكون SNPs هي أهم فئة من التغيرات الجينية التي تؤثر على الأمراض الشائعة. وفيما يتعلق بالأمراض الشائعة ، فإن 9 من أهم 10 أسباب رئيسية للوفاة لها مكون وراثي ، وبالتالي من المرجح أن يؤثر واحد أو أكثر من النيوكلوتايد في مخاطر الإصابة.

تشرح مقاطع فيديو youtube هذه

يمتلك جميع البشر تقريبًا نفس التسلسل المكون من 3 مليارات قاعدة من قواعد الحمض النووي (A أو C أو G أو T) موزعة بين 23 زوجًا من الكروموسومات. ولكن توجد اختلافات في مواقع معينة - تسمى هذه الاختلافات تعدد الأشكال. تعدد الأشكال هو ما يجعل الأفراد مختلفين عن بعضهم البعض. تشير التقديرات الحالية إلى أن ما يصل إلى 0.1٪ من حمضنا النووي قد يختلف قليلاً ، مما يعني أن أي شخصين غير مرتبطين قد يختلفان في أقل من 3 ملايين موقع DNA. في حين أن العديد من الاختلافات (SNPs) معروفة ، فإن معظمها ليس لها تأثير معروف وقد تكون ذات أهمية قليلة أو معدومة.

SNPedia عبارة عن مجموعة فرعية من SNPs التي تم الإبلاغ عن كونها ذات مغزى ، إما من الناحية الطبية أو لأسباب أخرى (مثل علم الأنساب). ينصب التركيز في SNPedia على SNPs التي لها عواقب طبية كبيرة ، شائعة ، قابلة للتكرار (أو موجودة في التحليلات الوصفية أو الدراسات لما لا يقل عن 500 مريض) ، و / أو لها أهمية تاريخية أو طبية أخرى.

سيقدم لك هذا المثال SNP rs1234 تنسيق التقرير المستخدم في SNPedia.

الاختلافات الأكثر وضوحًا في الحمض النووي هي الاختلافات الخارجية ، مثل rs1805009 الذي يؤثر على لون الشعر الأحمر. معظم الأشكال المتعددة لها تأثيرات أقل وضوحًا بكثير ، وقد يكون للعديد منها عواقب طبية. لقد بدأنا للتو في معرفة أي من 30 مليون أو نحو ذلك ممكن تعدد الأشكال التي تؤثر على الصحة ، سواء بشكل فردي أو في مجموعات. من المحتمل ألا يكون للعديد من الأشكال المتعددة أي تأثير على الإطلاق ، أو أن يكون لها مثل هذه التأثيرات الدقيقة التي ستمر سنوات عديدة قبل فهم عواقبها.

يشرح توماس ميلوند كيف يحدد العلماء والإحصائيون أي تعدد أشكال النيوكلوتايد المرتبطة بالأمراض.

توفر هذه المواقع مقدمات مفيدة:

الاكتشاف الأحدث هو تكرار أكبر يسمى نسخ عدد المتغيرات. لم يتم حتى الآن تنظيم أو دراسة CNVs بشكل جيد مثل SNPs. قاعدة البيانات dbVar مخصصة للتغيرات الهيكلية.


مرض الشريان التاجي وتعدد أشكال النوكليوتيدات المفردة الثرومبوسبوندين

كان GeneQuest عبارة عن تحليل عالي الإنتاجية وواسع النطاق لتعدد أشكال النوكليوتيدات المفردة (SNPs) لتحديد الجين المرتبط بمرض الشريان التاجي العائلي المبكر واحتشاء عضلة القلب. كانت SNPs الثلاثة التي تظهر أعلى وأهم ارتباطات مع المرض هي جميع أعضاء عائلة جينات الثرومبوسبوندين ، وثرومبوسبوندين -1 ، وثرومبوسبوندين -2 ، وثرومبوسبوندين -4. أدت هذه الارتباطات غير المتوقعة إلى بذل جهود لفهم كيفية تأثير النيوكلوتايد الثلاثة على هياكل ووظائف الثرومبوسبوندين. The SNP in thrombospondin-1 and thrombospondin-4 reside in their coding regions and result in single amino acid changes: in thrombospondin-1, the predominant asparagine at position 700 is changed to a serine while, in thrombospondin-4, it is a change of an alanine to a proline at position 387. The SNP in thrombospondin-2 is a base change in the 3'-untranslated region of the mRNA. At this early stage of investigation, predictive analyses suggest that the substitutions in thrombospondin-2 and thrombospondin-4 should alter structure, and there is direct evidence to indicate that the thrombospondin-1 SNP alters conformational stability. In addition, profound differences in the function of the thrombospondin-4 SNP variants have been identified with respect to their capacity to support endothelial cell adhesion and proliferation. While substantial additional information is needed to understand if and how the polymorphic forms of the thrombospondins affect coronary artery disease, the data assembled to date suggest marked effects of these SNPs on the structures and functions of the thrombospondins, which are consistent with induction of a proatherogenic and prothrombotic phenotype.


المواد والأساليب

Datasets. The set of cSNPs associated with Mendelian diseases was taken from the Human Gene Mutation Database (HGMD), release date March 11, 2003 (11). The set of cSNPs sampled from healthy individuals was constructed from the database dbSNP of the National Center for Biotechnology Information (12), release date May 20, 2003, which provides a mapping to curated RefSeq (13) protein sequences. To ensure that we used the highest quality data, only cSNPs occurring in “reviewed” (accession number beginning with “NP”) sequences were considered. To construct the list of human complex disease-associated missense SNPs (Table 1), we took all of the human cSNPs from refs. 1, 4, and 6. From ref. 10, we considered only associations that were also replicated with statistical significance.

Substitution Position-Specific Evolutionary Conservation (subPSEC) Scores. SubPSEC scores were calculated from alignments to hidden Markov models (HMMs) in the PANTHER database version 4.1 (14), by using the methods described in ref. 9, which were slightly modified as follows. Proteins were scored against PANTHER subfamilies, and if the subfamily had a better HMM score than any family HMM, subfamily HMM probabilities were used instead. In addition, if a position was perfectly conserved in the subfamily, sequences from neighboring subfamilies of the PANTHER family tree were added to the subfamily if they also conserved the same amino acid (this procedure allows conservation for longer evolutionary times to be reflected in the scores). A total of 33 of the 37 cSNPs in the complex disease set (Table 1), 12,519 of the 14,792 cSNPs in HGMD, and 10,586 of 15,684 in dbSNP were located in positions that aligned to a PANTHER HMM and could be given scores.

Random (Neutral) Model Distributions. To generate simulated data for random cSNPs (Fig. 1 below), protein-HMM alignments were generated for the longest curated human RefSeq protein sequence of each LocusLink (13) gene. For each protein sequence, the aligned region was converted into its corresponding mRNA sequence, and then every possible single-nucleotide substitution in the mRNA sequence was made. Each single-nucleotide-substituted mRNA codon that resulted in an amino acid change was used to calculate a subPSEC score. This procedure resulted in a total of 47,085,084 scores (377,100 of which were sampled randomly). The distribution of subPSEC scores was then weighted according to the بداهة transition/transversion probabilities of the SNP, as estimated from data in the JSNP database (15).

Cumulative distributions of position-specific amino acid substitution scores for different sets of cSNPs. Distributions are shown for Mendelian disease (red), neutral variation (yellow), and “normal” human variation (green). The score distribution for complex diseases is in black squares. Shifts toward the left of the graph (smaller scores) indicate increasingly radical substitutions.

The random (neutral) model score distributions for Mendelian disease-associated genes and for complex disease-associated genes (Fig. 2 below) were calculated similarly to the random variation data above. However, to serve as a proper control for Fig. 1, the distributions need to reflect the fact that different genes have different numbers of disease-associated cSNPs. Therefore, we created random distributions for each gene separately (weighting according the transition/transversion probabilities as above). The overall random distribution for the set (Mendelian or complex disease-associated) is simply the sum of random distributions for each gene in the set, weighted for the number of cSNPs in that gene. For example, the random distribution for بطاقة 15 must be counted twice in the overall random distribution for complex disease because there are two cSNPs in this gene that are associated with complex disease (Table 1).

Cumulative random (neutral) distributions of subPSEC scores over the genes associated with Mendelian diseases vs. complex diseases are nearly identical. This is a control for the comparison shown in Fig. 1, demonstrating that there is no bias in these gene sets with respect to the subPSEC scores and that the differences between these sets in Fig. 1 are due to position-specific conservation.

Ka/Ks Ratios. Human–mouse Ka/Ks ratios were obtained from Build 36 of the HomoloGene database, release date July 23, 2004 (16). For HGMD genes, we performed a blastp search to find the corresponding proteins in the human RefSeq protein database (reviewed entries only, accession number beginning with “NP”). We defined a percent identity cutoff of 95% and required that the length of the alignment be at least 95% of both the query and the hit sequence. If there were multiple hit sequences that met the criteria, the top hit with a Ka/Ks ratio was chosen. For all sets, HomoloGene Ka/Ks ratios were used only if both the human and mouse sequences were reviewed RefSeq entries. The fraction of the different sets of genes that met these criteria were 10,536/21,494 for RefSeq (all genes), 4,139/6,902 RefSeqs with at least one cSNP in dbSNP (coding polymorphic genes), 730/950 for HGMD (Mendelian), 26/32 for complex disease genes (Table 1), and 10/12 for conservative complex disease genes (Table 1, asterisks).


المواد والأساليب

Collection of nsSNP data and PTM site data

We collected total 517,466 human nsSNPs from the NCBI dbSNP database Build 135 [15]. From 517,466 nsSNPs, 509,183 SNPs were missense SNPs and 14,878 SNPs were stop-gain (nonsense) SNPs. We linked the location of nsSNPs on protein sequences from Ref-Seq Build 37.3. The flanking peptide of nsSNP sites from -7 to +7 retrieved by using the SNP-MapLinkProtein table in dbSNP and defined as the SNP sequence.

Human PTM site data were retrieved from dbPTM3 [16], which includes 194,886 experimentally verified PTMs from MS/MS analysis based research articles and 10 external PTM-related resources. The dbPTM also provides 404,501 computationally predicted PTMs by the KinasePhos-like method based on hidden Markov models (HMMs). It includes 20 types of PTM sites predicted with the threshold of specificity 100% for minimizing false positive. Peptides of flanking PTM sites from -7 to +7, called the PTM site sequence, were retrieved by matching the PTM site with the protein sequence from UniProt [17].

Detection of PTM-SNP

PTM-SNPs were detected by aligning the SNP sequence with the PTM site sequence because not all sequences in UniProt and RefSeq are perfectly identical (end-to-end identical). Each residue in the SNP sequence is matched with the PTM site sequence by sliding one-by-one (Figure 1). The PTM-SNP is defined as the nsSNP's position of the best-aligned SNP sequence with the PTM site sequence. As Figure 1 illustrates, an SNP sequence of nsSNP, rs1803573, is aligned well with the +3 residue of the PTM site sequence. In few cases, multiple hits with diverse locations were detected due to sequence repeats. The European Molecular Biology Open Software Suite (EMBOSS) [18] Needle, a global pairwise sequence alignment tool, was applied to handle these exceptional cases.

Detection of a PTM-SNP by alignment of a PTM site sequence and a SNP site sequence. Start from -7 to 7 residues of PTM site sequences, each residue is matched with nsSNP site of the SNP sequence by sliding one-by-one. From the best aligned position of SNP sequence, the location of PTM-SNP is identified as the location of the PTM site sequence that is aligned with the nsSNP.

We also extracted and integrated PTM-SNPs from the public resource, PhosSNP 1.0. PhosSNP includes phosphorylation-associated nsSNP from computationally translating mRNA sequences. However, about 18% of SNPs in PhosSNP have not yet been defined as nsSNP by dbSNP Build 135, therefor, were removed in the integrating process.

Disease-associated PTM-SNPs

From GWASs using SNP arrays and NGS techniques, huge numbers of statistically significant disease-associated SNPs have been identified recently. National Human Genome Research Institute (NHGRI) GWAS catalog have been provided 8,771 trait-associated SNPs with p-values < 1.0 × 10 -5 (Apr 02, 2013) [19]. The genetic association database (GAD) [20] contains 29,578 disease-associated SNPs and 23,671 disease-associated SNPs are also available from Genotypes and Phenotypes (dbGaP) [21]. To find a correlation between PTM-SNPs and diseases, we collected total 52,731 distinct disease-associated SNPs from NHGRI GWAS catalog, GAD and dbGaP after then matched these SNPs with our PTM-SNPs.

Furthermore, we analyzed type 2 diabetes (T2D) associated SNPs that were identified in our previous study [22] by using Wellcome Trust Case Control Consortium (WTCCC) datasets [23]. T2D-associated SNPs with p-values < 1.0 × 10 -5 were identified from quality controlled (QC) 409,656 SNPs, based on Cochran-Armitage trend test statistics using PLINK 1.07 [24]. QC is applied as a sample missing genotype rate of > 3%, a SNP missing genotype rate of > 1%, Hardy-Weinberg Equilibrium (HWE) p-value ≤ 10 -4 , and minor allele frequency (MAF) < 1%. Linkage disequilibrium pruning was leaved out to preserve the PTM-SNP candidates. T2D PTM-SNPs were detected by mapping T2D-associated SNPs and PTM-SNPs. Significantly associated T2D PTM-SNPs were further studied to interpret disease mechanisms with various biological information resources. Known disease genes are mainly collected from OMIM [25], GAD, and KEGG [26]. Drug targets are collected from DrugBank [27], PharmGKB Drug [28], and KEGG Drug.


Single Nucleotide Polymorphisms and Osteoarthritis: An Overview and a Meta-Analysis

Osteoarthritis (OA) is a complex disorder characterized by degenerative articular cartilage and is largely attributed to genetic risk factors. Single nucleotide polymorphisms (SNPs) are common DNA variants that have shown promising and efficiency, compared with positional cloning, to map candidate genes of complex diseases, including OA. In this study, we aim to provide an overview of multiple SNPs from a number of genes that have recently been linked to OA susceptibility. We also performed a comprehensive meta-analysis to evaluate the association of SNP rs7639618 of double von Willebrand factor A domains (DVWA) gene with OA susceptibility. A systematic search of studies on the association of SNPs with susceptibility to OA was conducted in PubMed and Google scholar. Studies subjected to meta-analysis include human and case-control studies that met the Hardy-Weinberg equilibrium model and provide sufficient data to calculate an odds ratio (OR). A total of 9500 OA cases and 9365 controls in 7 case-control studies relating to SNP rs7639618 were included in this study and the ORs with 95% confidence intervals (CIs) were calculated. Over 50 SNPs from different genes have been shown to be associated with either hip (23), or knee (20), or both (13) OA. The ORs of these SNPs for OA and the subtypes are not consistent. As to SNP rs7639618 of DVWA, increased knee OA risk was observed in all genetic models analyzed. Specifically, people from Asian with G-allele showed significantly increased risk of knee OA (A versus G: OR = 1.28, 95% CI 1.13-1.46 AA versus GG: OR = 1.60, 95% CI 1.25-2.05 GA versus GG: OR = 1.31, 95% CI 1.18-1.44 AA versus GA+GG: OR = 1.34, 95% CI 1.12-1.61 AA+GA versus GG: OR = 1.40, 95% CI 1.19-1.64), but not in Caucasians or with hip OA. Our results suggest that multiple SNPs play different roles in the pathogenesis of OA and its subtypes SNP rs7639618 of DVWA gene is associated with a significantly increased risk of knee OA in Asians. Given the limited sample size, further studies are needed to evaluate this observation.

بيان تضارب المصالح

The authors have no conflicts of interest to disclose.

الأرقام

Multiple polymorphisms are associated with…

Multiple polymorphisms are associated with the risk of OA. Illustrated are 56 SNPs…

The odd ratios (OR) of the SNPs associated with OA or OA subtypes.…

Flow chart of study selection.…

Flow chart of study selection. Studies selected for current meta-analysis are as illustrated.…

Forest plot of allele comparison…

Forest plot of allele comparison of DVWA rs7639618 for overall comparison (A versus…

Meta-analysis of the association rs7639618…

Meta-analysis of the association rs7639618 and knee OA. A, Forest plot of homozygote…

Meta-analysis of the association rs7639618…

Meta-analysis of the association rs7639618 and knee OA. A, Forest plot of recessive…

Forest plot of allele comparison…

Forest plot of allele comparison of DVWA rs7639618 for overall comparison (A versus…

The result of sensitivity and…

The result of sensitivity and Funnel plot analysis. A, Sensitivity analysis showed no…


Marker-assisted selection in plant breeding

تعدد الأشكال النوكليوتيدات واحد

Single nucleotide polymorphism (SNP) is a point mutation (a change in one nucleotide) for which a short flanking sequence is known. The system is used in humans, animal husbandry, and to a lesser extent in plants.

Genotyping technology: There are various technologies to genotype SNP including the use of DNA sequencers, mass spectrometry, and more. Modern technologies are automated, requiring expensive machinery, but they are also offered by commercial companies as a service (see section Modern genotyping technologies).

التنميط الجيني: Each allele is defined by the actual nucleotide in the sequence.

Source of polymorphism: SNPs are generated by point mutations namely, any change of a single nucleotide at any place in the genome. Changes can be the replacement of one nucleotide with another and/or deletion or addition (Indels) of a single nucleotide.

مميزات: SNPs are single locus markers and mostly have two alleles in each locus (low level of polymorphism).


شاهد الفيديو: Single nucleotide polymorphism. SNPs. SNPs for beginners (شهر نوفمبر 2022).