معلومة

أهمية كتل النمط الفرداني

أهمية كتل النمط الفرداني


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لقد بحثت عن كتل النمط الفرداني في منحة جوجل، ويبدو أن النتائج التي تم إرجاعها تظهر أنه تم نشر جميع المقالات ذات الصلة تقريبًا بين عامي 2001 و 2009 ، ولم يتم نشر أي شيء تقريبًا منذ عام 2010.

لماذا تضاءل الاهتمام بكتل النمط الفرداني على ما يبدو خلال العقد الماضي؟ هل فقد المفهوم مصداقيته؟


هل تضاءل الاهتمام بكتل النمط الفرداني على مدار العقد؟

لا.

يمكنك ضبط ملف النطاق الزمني تشغيل منحة جوجل، الذي تظهره لقطة الشاشة لم يتم. فعلت ذلك و:

  • البحث عن "كتلة النمط الفرداني" من 2000 إلى 2009 يعطي 22000 زيارة.

  • البحث عن "كتلة النمط الفرداني" من 2000 إلى 2009 يعطي 25700 زيارة.

(المصطلح هابلوبلوك غالبًا ما يستخدم الآن كاختصار ، لكن اتضح أن كتلة النمط الفرداني لا يزال أكثر تواترا.)

لذلك يجب أن أستنتج أنه لا بد أنه كان هناك خطأ ما في النهج الذي اعتمده الملصق. ومن الجدير بالذكر ، مع ذلك ، أن تحليل كتب جوجل ngram ل كتلة النمط الفرداني يُظهر الاستخدام الأول في عام 2000 ، وبلغت الذروة في عام 2007 انخفاضًا تقريبًا. 30٪ من الحد الأقصى في عام 2019. قد يعكس هذا فقط اندفاعًا لنشر كتب حول موضوع جديد وانحسر ، على الرغم من أن معدل النشر في المجلات كان أكثر ثباتًا.

ما هي كتل النمط الفرداني ، ولماذا هي مثيرة للاهتمام ، وكيف تختلف عن الأنماط الفردانية؟

يتضح هذا من خلال ورقة بحثية مثيرة للاهتمام في إصدار حديث (2020) من طبيعة سجية يأتي من عمل كونسورتيوم كبير يعالج مسألة تكيف عباد الشمس مع مختلف المجالات البيئية. هذا ينطوي على تطور ما يسمى ب الأنماط البيئيةتختلف في خصائصها مثل وقت الإزهار والقدرة على النمو على الكثبان الرملية.

تكمن المشكلة في أن هذه التعديلات تتضمن العديد من الجينات المختلفة (وبالتالي الأليلات) مما يعني أنها تتضمن أنماطًا فردية مختلفة ، وفقًا للتعريف الوارد في ويكيبيديا:

أ النمط الفرداني (النمط الجيني أحادي الصيغة الصبغية) هو مجموعة من الأليلات في كائن حي موروثة معًا من والد واحد.

ومع ذلك ، لا يتم فصل هذه الأنماط البيئية المختلفة لزهرة الشمس ماديًا عن الأنواع الأخرى ، بحيث يتوقع المرء حدوث تهجين بينها ، مما يؤدي إلى فقدان النمط الفرداني والتكيف. كما تشير الورقة ، فإن هذه المشكلة هي في الواقع إعادة صياغة لـ انتقادات لنظريات داروين من قبل معاصريه:

Romanes، G.J. “الانتقاء الفسيولوجي؛ اقتراح إضافي حول أصل الأنواع ". زول. جيه لين. شركة 19, 337-411 (1886).

(على الرغم من أنني يجب أن أعترف أنني لم أقرأ النص الأصلي.)

حقيقة أن هذا لا يحدث هو أن الأليلات التي تشكل النمط الفرداني موجودة في كتل غير قابلة لإعادة التركيب - كتل النمط الفرداني.

أ كتلة النمط الفرداني هي منطقة من جينوم الكائن الحي لا يوجد فيها سوى القليل من الأدلة على تاريخ إعادة التركيب الجيني ، والتي تحتوي فقط على عدد صغير من الأنماط الفردية المتميزة.

ما الذي يمنع إعادة تركيب هذه الكتل؟ يبدو أن التفسير الأكثر شيوعًا هو أن إعادة ترتيب المناطق التي تحتوي على كتل النمط الفرداني تحدث ، مما يمنع إعادة التركيب. من أسهل طرق إعادة الترتيب التي يمكن فهمها هو الانعكاس البسيط ، حيث تم العثور على كتلتين كبيرتين على الكروموسوم 5.

بدأت الدراسات في الورقة بكتلتين من النمط الفرداني ثبت أنهما متورطان في الأنماط البيئية الموضحة ، والتي وُجد أنها تحتوي على جينات متورطة سابقًا في هذه العمليات ، مثل زهرة LOCUS T. و مضاد للحرارة 1. من خلال دراسات الارتباط على مستوى الجينوم ، حددوا ما مجموعه 37 كتلة من النمط الفرداني على أساس عدم توازن الارتباط. رسم تخطيطي لبعض هذه الكتل في أنواع مختلفة من عباد الشمس قد يبلل شهية القارئ:

إذن ، ردًا على استعلام الناشر المحدد: مفهوم الكتل الفردانية ما زال حيا للغاية!


علم البيئة السلوكي للحيوانات الاستوائية

ماريا سي دي مارسيكو ،. خوان سي ريبوريدا ، التقدم في دراسة السلوك ، 2010

C استخدام المضيف من قبل طيور البقر اللامعة والصراخ على المستوى الفردي

أظهرت توزيعات تردد النمط الفرداني بين العوائل وضع غير عشوائي في كلا نوعي طيور البقر. في طيور البقر اللامعة ، وجدنا اختلافات في توزيع الأنماط الفردانية بين طيور الزنجبيل المنزلية والمضيفات الثلاثة الأخرى (العصافير ذات الياقات الحمراء ، وطيور المستنقعات البني والأصفر ، والطيور المحاكية ذات الحاجبين الطباشيريين. Φشارع القيم = 0.20–0.23 ، ص & lt 0.001). وبالمثل ، في طائر البقر الصراخ ، وجدنا اختلافات في توزيع الأنماط الفردانية بين baywings و chopi blackbirds (Φشارع = 0.05, ص = 0.04). في سيناريو التوزيع العشوائي ، نتوقع العثور على أنماط الفرد الموزعة بالتساوي بين المضيفين. وبالمثل ، إذا كانت الإناث متخصصات مضيفات على المستوى الفردي ولكنهن لا يشاركن استخدام المضيف مع أمهاتهن ، فيجب توزيع النمط الفرداني بشكل عشوائي. قد ينشأ هذا من مشاركة الإناث للنمط الفرداني مع أمهاتهن ولكن باستخدام مضيف مختلف. وبالتالي ، سيتم تمثيل نفس النمط الفرداني في جميع المضيفات. إذا حدث هذا في جميع الإناث ، فسيتم العثور على أنماط الفرد بالتساوي في جميع المضيفات. يوضح الشكل 6 ترددات النمط الفرداني لنوع واحد من طيور البقر اللامعة والصراخ مقارنة مع عائل آخر في منطقة الدراسة. قد ينتج عن استخدام المضيف العشوائي ترددات قريبة من 50٪ لجميع الأنماط الفردانية ، بينما يُظهر استخدام المضيف غير العشوائي بعض الأنماط الفردانية فقط (أو الموجودة في مضيف واحد (100٪) أو في الآخر (0٪)).

الشكل 6. تردد Haplotype (H1-H12) لطائر بقري لامع واحد (رموز مفتوحة) وطائر بقري صارخ (رموز مغلقة) مقارنة مع مضيف آخر في منطقة الدراسة. طائر رعاة البقر اللامع: طائر النمنمة المنزلي (مقابل الطائر المحاكي ذو الحاجبين الطباشير) صراخ طائر البقر: chopi الشحرور (مقابل baywing). البيانات مأخوذة من Mahler et al. (2007 ، 2009) ، ترقيم النمط الفرداني تعسفي.


مشروع HapMap الدولي

جعل توضيح الجينوم البشري بأكمله من الممكن جهودنا الحالية لتطوير خريطة النمط الفرداني للجينوم البشري. خريطة النمط الفرداني ، أو "HapMap" ، هي أداة تسمح للباحثين بالعثور على الجينات والتغيرات الجينية التي تؤثر على الصحة والمرض.

تسلسل الحمض النووي لأي شخصين متطابق بنسبة 99.5 بالمائة. ومع ذلك ، قد تؤثر الاختلافات بشكل كبير على مخاطر إصابة الفرد بالأمراض. تسمى المواقع في تسلسل الحمض النووي حيث يختلف الأفراد في قاعدة DNA واحدة بتعدد أشكال النوكليوتيدات المفردة (SNPs). يتم توريث مجموعات من SNPs القريبة على نفس الكروموسوم في كتل. هذا النمط من SNPs على كتلة هو النمط الفرداني. قد تحتوي الكتل على عدد كبير من SNPs ، لكن عددًا قليلاً من SNPs يكفي لتحديد الأنماط الفردانية في الكتلة بشكل فريد. HapMap هي خريطة لكتل ​​النمط الفرداني وتسمى SNPs المحددة التي تحدد الأنماط الفردانية علامة SNPs.

تعد HapMap ذات قيمة من خلال تقليل عدد SNPs المطلوبة لفحص الجينوم بأكمله للارتباط بنمط ظاهري من 10 مليون SNPs الموجودة إلى ما يقرب من 500000 علامة SNPs. هذا يجعل طرق مسح الجينوم لإيجاد مناطق بها جينات تؤثر على الأمراض أكثر كفاءة وشمولية ، حيث لا يضيع الجهد في كتابة المزيد من SNPs أكثر من اللازم ويمكن تضمين جميع مناطق الجينوم.

بالإضافة إلى استخدامه في دراسة الارتباطات الجينية بالمرض ، فإن HapMap هو مورد قوي لدراسة العوامل الوراثية التي تساهم في التباين في الاستجابة للعوامل البيئية ، وفي القابلية للإصابة ، وفي فعالية الأدوية واللقاحات والاستجابات العكسية لها. تستند جميع هذه الدراسات إلى توقع وجود ترددات أعلى للمكونات الجينية المساهمة في مجموعة من الأشخاص المصابين بمرض أو استجابة معينة لعقار أو لقاح أو مُمْرِض أو عامل بيئي مقارنة بمجموعة من الأشخاص المتشابهين غير المصابين بالمرض. أو الرد. باستخدام علامة SNPs فقط ، يمكن للباحثين العثور على مناطق الكروموسوم التي لها توزيعات نمط فرداني مختلفة في مجموعتي الأشخاص ، أولئك الذين يعانون من مرض أو استجابة والذين لا يعانون. يتم بعد ذلك دراسة كل منطقة بمزيد من التفصيل لاكتشاف المتغيرات التي تساهم فيها الجينات في المنطقة في المرض أو الاستجابة ، مما يؤدي إلى تدخلات أكثر فعالية. يسمح هذا أيضًا بتطوير الاختبارات للتنبؤ بالعقاقير أو اللقاحات التي ستكون أكثر فاعلية لدى الأفراد الذين لديهم أنماط وراثية معينة للجينات التي تؤثر على استقلاب الدواء.

معلومات HapMap الدولية ، أحداث وتقارير المشروع

معلومات HapMap
    [hapmap.ncbi.nlm.nih.gov]
    موقع الويب الخاص بشراكة مشروع HapMap للعلماء ووكالات التمويل من كندا والصين واليابان ونيجيريا والمملكة المتحدة والولايات المتحدة
    [hapmap.ncbi.nlm.nih.gov]

  • بيان صحفي لمشروع HapMap: الاتحاد الدولي يطلق مشروع رسم خرائط التنوع الجيني في 29 أكتوبر 2002
الأحداث

    البث الشبكي للدورة التعليمية في 27 أكتوبر 2005: كيفية استخدام بيانات HapMap.
      [hapmap.ncbi.nlm.nih.gov]
      مواد الدعم للدورة التعليمية لمدة ساعتين حول الاستخدام الفعال لـ HapMap. يتضمن مقدمة إلى HapMap ، واستخدام HapMap لدراسات الارتباط ، واختيار علامة SNP ، وتحسين التحليلات باستخدام الرقائق مع SNPs المحددة مسبقًا ودليل إلى صفحات الويب HapMap.
    تقارير الاجتماع

    أوراق مشروع HapMap الدولي

    كونسورتيوم HapMap الدولي. خريطة النمط الفرداني البشري من الجيل الثاني لأكثر من 3.1 مليون تعدد الأشكال. طبيعة سجية، 449: 851-862. 2007. [نص كامل]

    كونسورتيوم HapMap الدولي. معلومات تكميلية عن: خريطة النمط الفرداني البشري من الجيل الثاني لأكثر من 3.1 مليون تعدد الأشكال. طبيعة سجية، 449: 1-38. 2007. [نص كامل]

    الكشف على نطاق الجينوم وتوصيف الاختيار الإيجابي في التجمعات البشرية. طبيعة سجية، 449: 913-919. 2007. [نص كامل]

    اتحاد HapMap الدولي. خريطة النمط الفرداني من الجينوم البشري. طبيعة سجية، 437: 1229-1320. 2005. [نص كامل]

    اتحاد HapMap الدولي. مشروع HapMap الدولي. طبيعة سجية، 426: 789-796. 2003. [نص كامل]

    اتحاد HapMap الدولي. دمج الأخلاق والعلوم في مشروع HapMap الدولي. علم الوراثة الطبيعي، 5: ​​467-475. 2004. [نص كامل]

    Thorisson ، GA ، Smith A.V. ، Krishnan L. ، and Stein ، L.D. موقع ويب مشروع HapMap الدولي. أبحاث الجينوم، 15: 1592-1593. 2005. [PubMed] [بحث الجينوم]

    الأوراق الدولية المتعلقة بمشروع HapMap

    كلارك ، إيه جي ، هوبيز ، إم جي ، بوستامانتي سي دي ، ويليامسون ، إس إتش ، ونيلسن ، آر. أبحاث الجينوم15: 1496-1502. 2005. [PubMed]

    غولدشتاين ، دي بي ، وكافاليري ، جي إل جينوميكس: فهم التنوع البشري. طبيعة سجية، 437: 1241-1242. 2005. [نص كامل] [nature.com]

    Hinds ، D.A. ، Stuve ، L.L. ، Nilsen ، GB ، Halperin ، E. ، Eskin ، E. ، Ballinger ، D.G. ، Frazer ، K.A. ، and Cox ، D.R. أنماط الجينوم الكاملة لتنوع الحمض النووي المشترك في ثلاثة مجموعات بشرية. علم، 307: 1072-1079. 2005. [PubMed]

    Myers، S.، Bottolo، L.، Freeman، C.، McVean، G.، and Donnelly، P. خريطة دقيقة لمعدلات إعادة التركيب والنقاط الساخنة عبر الجينوم البشري. علم، 310: 321-324. 2005. [PubMed]


    التعاريف الأساسية

    المدخل النموذجي لدراسات الاختيار على مستوى الجينوم هو مجموعة من الجينومات التي تم حلها من النمط الفرداني ، أو أنماط الفرد لفترة قصيرة. من الواضح ، بالنسبة لمجموعة معينة من الأنماط الفردانية ، فإن تلك المواقع هي فقط ذات الأهمية حيث يوجد تباين في الجينومات. لذلك ، رسميًا ، نعتبر كمدخلات في أساليبنا أ ك × نمصفوفة النمط الفرداني حيث كل من ك الصفوف يتوافق مع نمط فردى واحد وكل من ن الأعمدة تتوافق مع موقع جيني متغير واحد.

    تميز معظم الطرق فقط بين الأليل السلفي والمشتق ، مما يعكس حقيقة أن معظم المواقع هي بياليلي. لذلك ، غالبًا ما تُعتبر الإدخالات في مصفوفة النمط الفرداني ثنائية حيث يتم ترميز أليل الأسلاف بمقدار 0 ويتم ترميز الأليل المشتق بالرقم 1. ومع ذلك ، فإن المشكلة الحسابية وحلولها التي تم تناولها في هذه الورقة لا تعتمد على هذا القيد وبدلاً من ذلك تكون قابلة للتطبيق لأي نوع من التسلسل على أبجدية ذات حجم ثابت ( سيجما ).

    مفهوم الكتلة الفردانية المثالية القصوى كما هو محدد في [8] هو التالي ، أين س[أنا, ي] يشير إلى السلسلة الفرعية للسلسلة س من الموقف أنا إلى موقع ي و (S | _K ) تشير إلى عناصر مجموعة مرتبة س يقتصر على مجموعة الفهرس ك:

    التعريف 1

    منح ك التسلسلات (S = (s_1، ldots، s_k) ) بنفس الطول ن (تمثل صفوف مصفوفة النمط الفرداني) ، أ الحد الأقصى من الكتلة الفردانية المثالية هو ثلاثي (ك, أنا, ي) مع (K subseteq <1، ldots، k > )، ( vert K vert ge 2 ) و (1 le i le j le n ) بحيث

    (s [i، j] = t [i، j] ) للجميع (s، t in S | _K ) (المساواة),

    (i = 1 ) أو (s [i-1] ne t [i-1] ) لبعض (s ، t in S | _K ) (أقصى اليسار),

    (j = n ) أو (s [j + 1] ne t [j + 1] ) للبعض (s ، t in S | _K ) (أقصى اليمين)، و

    ( not موجود K ' subseteq <1، ldots، k > ) مع (K مجموعة فرعية K' ) بحيث (s [i، j] = t [i، j] ) لجميع (s ، t في S | _) (الصف الأقصى).

    التعريف 1 موضح في الشكل 1.

    توضيح للتعريف 1. مصفوفة ثنائية (3 مرات 8 ) من النمط الفرداني بثلاث كتل من النمط الفرداني المثالي الأقصى (( <1،3 > ، 1،4) ) ، (( <2،3 ) > ، 4،7) ) و (( <1،2،3 > ، 6،7) ) مميزة. (يحتوي المثال على كتل النمط الفرداني المثالية القصوى الإضافية التي لا تظهر.)

    في Cunha et al. [8] تبين أن العدد الأقصى من كتل النمط الفرداني المثالية هو ا(كن) ، بينما الخوارزمية المقدمة ، تستغرق (O (kn ^ 2) ) وقتًا للعثور على جميع الكتل. يعتمد على ملاحظة أن الرؤوس المتفرعة في trie (T_p ) من لاحقات تسلسلات الإدخال التي تبدأ من الموضع ص تتوافق مع الكتل اليمنى القصوى والصف الأقصى ، بينما يمكن اختبار أقصى اليسار من خلال مقارنة (T_p ) و (T_). نوضح في القسمين التاليين كيف يمكن تحسين وقت التشغيل هذا.


    مناقشة

    التركيب الجيني وتوصيف النمط الفرداني

    في هذا العمل ، ميزت نتائج التحليل العنقودي القائم على النموذج أربع مجموعات سكانية فرعية ، بينما في السابق [32] ، باستخدام نفس 102 صنف وعدد صغير من الواسمات المرتبطة بالجينات ذات الأهمية الزراعية والواسمات المحايدة (SSRs و ISBPs) ، اكتشفت ثلاثة المجموعات السكانية الفرعية ، والتي مع ذلك وكما هو متوقع تتداخل مع المجموعات الأربعة المحددة هنا. بشكل عام ، تتوافق المجموعات السكانية الفرعية 1 و 2 في دراستنا مع المجموعات السكانية الفرعية 1 و 3 من العمل السابق ، بما في ذلك مقدمات من أصل أوروبي والبلازما الجرثومية التقليدية ، على التوالي. تطابق المجموعات السكانية الفرعية 3 و 4 في دراستنا مجموعة سكانية فرعية 2 من العمل السابق ، بما في ذلك جميعًا في معظم الحالات أصول وراثية من أصل CIMMYT. قد تكون الاختلافات بين المجموعات السكانية الفرعية 3 و 4 مرتبطة بوجود إزاحة القمح والجاودار 1BL / 1RS ، حيث أن الأصناف 24/26 في المجموعة السكانية الفرعية 3 تحمل هذا ، في حين لا يوجد صنف في وضع مماثل في المجموعة السكانية الفرعية 4 (البيانات غير معروضة). تم استخدام هذا الانتقال على نطاق واسع في التربية لتحقيق مقاومة للعديد من مسببات الأمراض والحشرات ، لتوسيع التكيف وزيادة الغلة [34]. الأرجنتين ليست استثناء ، حيث أظهرت الأصناف الحديثة التي تحمل 1BL / 1RS: Klein Gladiador و Klein Nutria و Klein Yarará و 2333 جنيهًا مصريًا و 2341 جنيهًا مصريًا و ACA 906 ، والتي تم إصدارها بين عامي 2009 و 2010 ، تؤكد المساهمة الثابتة للانتقال إلى الأحياء وغير الحيوية تحمل الاجهاد. على الرغم من هذه المزايا ، ينبغي إيلاء اهتمام خاص لاستخدام 1BL / 1RS ، نظرًا لتأثيراته الضارة على قوة الغلوتين وجودة صنع الخبز ، وإن كانت تختلف باختلاف الخلفية الجينية [35].

    تعرض القمح لانتقاء صناعي وطبيعي مكثف منذ تدجينه ، مما أدى إلى وجود HBs كبيرة كما لوحظ في البلازما الجرثومية النخبة [18 ، 36]. يمكن ملاحظة هذه المشكلة في عملنا مع التواجد المذكور للتو لنقل 1BL / 1RS لنقل القمح إلى الجاودار (الشكل 1 ب). على أي حال ، يجب أيضًا أن نأخذ في الاعتبار موضع HB في الكروموسوم ، كما نرى في الشكل 1 أ ، حيث تتشكل أنماط الفردوس الكبيرة (& gt 30 ميجا بايت) في مناطق مركزية ومحيط مركزية لكل كروموسوم. كما ورد سابقًا في عمل [37] ، يمكن أن تشكل هذه المناطق تحديًا عند إدخال المتغيرات الأليلية ذات الأهمية في المنطقة وتقليل حجم HBs.

    تحليل GWAS

    عائد الصفات المحتملة ذات الصلة:

    تم اقتراح كفاءة الإثمار كصفة واعدة لزيادة إمكانات الغلة في القمح [12 ، 13 ، 28 ، 38 ، 39]. اكتشفنا 15 نمطًا فردانيًا / علامة ذات تأثيرات إيجابية على FEh وسلبيتين فقط (الجدول 5). تم اكتشاف أقوى الارتباطات الجينية لـ FEh في المواقع الجنوبية Azul و Balcarce ، مع ملاحظة ارتباطات أقل في Marcos Juárez. تشير هذه النتائج إلى أن FEh يمكن أن يوفر وسيلة لزيادة الغلة في المناطق التي تكون فيها إمكانات الغلة عالية ، كما هو الحال في المواقع الجنوبية في دراستنا.

    في دراسة سابقة ، تم الكشف عن ارتباط إيجابي بين FEh وعدد الحبوب [13 ، 39]. هنا ، اكتشفنا النمط الفرداني Chr2A-B49-Hap2 (704.8-705.8 ميجا بايت) على الكروموسوم 2A ، والذي يعدل بشكل إيجابي الصفات FEh و GNS (الجدول 5). في دراسة أخرى ، [40] اكتشف SNP مرتبطًا بـ FE والحبوب لكل spikelet (RFL_Contig3780_64) ، الموجود عند 676.24 ميجا بايت على الكروموسوم 2A. اقترحوا جينات CONSTANS 4 (CO4) و TaVrs1 كمرشحين لشرح التباين المكتشف. ومع ذلك ، بناءً على IWGSC Ref Seq. يقع V1.0 ، CO4 على 594.58 ميجا بايت (81.66 ميجا بايت بالقرب من RFL_Contig3780_64). يقع النمط الفرداني الخاص بنا Chr2A-B49-Hap2 على بعد 28.56 ميجا بايت بعيدًا عن RFL_Contig3780_64. تقدر المسافة المادية بين Chr2A-B49-Hap2 و CO4 بـ 110.22 ميجا بايت ، ومع الأخذ في الاعتبار القيمة الحرجة لانحلال عدم توازن الارتباط (LD) بمقدار 0.1 يقدر بمتوسط ​​50 ميجا بايت لجينوم القمح [ 41] ، سوف يتخلص من CO4 كمرشح لـ FEh QTL المكتشف في Chr2A-B49-Hap2. من ناحية أخرى ، الجين TaVrs1، وتسمى أيضا GNI-A1، تم استنساخه مؤخرًا وتميز بـ [42] للأسف GNI-A1 لم يتم تجميع الجين على IWGSC Ref Seq. لا يمكن مقارنة كروموسوم V1.0 2A وموقعه مع النمط الفرداني Chr2A-B49-Hap2.

    في المقابل ، تم وصف علاقة سلبية بين FEh و TGW [28 ، 39]. في العمل الحالي ، اكتشفنا النمط الفرداني Chr6A-B24-Hap2 (205.1-233.3 ميجا بايت) الذي يزيد من قيم FEh ، ولكنه يعاقب TGW.

    لا يُعرف الكثير عن العلاقة بين FEh و PH. اكتشفنا النمط الفرداني على الكروموسوم 5A ، Chr5A-B33-Hap4 (445.2 ميجا بايت) الذي يرتبط بكلتا السمتين ، ولكن في اتجاهين متعاكسين.

    سمة أخرى ذات صلة في تحديد إمكانات الغلة هي وزن الحبوب. اكتشفنا ستة أنماط فردية / علامات ذات تأثيرات إيجابية وخمسة لها تأثيرات سلبية على TGW (الجدول 5). تتضمن هذه القائمة أربعة أنماط فردية على الكروموسوم 6A المرتبط بـ TGW ، أحدها Chr6A-B24-Hap2 (205.1-233.3 ميجا بايت). هذا النمط الفرداني ، المرتبط سلبًا بـ TGW والمرتبط بشكل إيجابي بـ FEh ، كان يقع 4.5 ميجا بايت بالقرب من الجين TaGW2-A1، والذي يقع عند 237.75 ميجا بايت على الكروموسوم 6 أ وقد ثبت أنه مرتبط بوزن الحبوب [43]. المسوخات غير الوظيفية لهذا الجين تزيد من وزن وحجم حبوب القمح [44]. وظيفة مشتركة والموقع المادي سوف تتحول TaGW2-A1 في جين مرشح واعد لـ Chr6A-B24-Hap2. من ناحية أخرى ، الجين TaGS5-3A يقع عند 176.55 ميجا بايت على الكروموسوم 3 أ وقد ارتبط أيضًا بحجم حبة أكبر ووزن أعلى لألف حبة [45]. وجدنا نمطًا فرديًا واحدًا و SNP واحدًا مرتبطًا بـ TGW على الكروموسوم 3A (الجدول 5) ، لكنهما كانا بعيدًا جدًا عن TaGS5-3A (123 و 510 ميغا بايت على التوالي) ليتم اعتباره مرشحًا للجينات. في الاتجاه المعاكس لذلك الذي لوحظ في FEh ، تم اكتشاف أقوى الارتباطات الجينية لـ TGW في الموقع الشمالي Marcos Juárez ، مما يروج لـ TGW كصفة مثيرة للاهتمام لزيادة العائد على خطوط العرض تلك.

    بالنسبة لـ GNS ، [46] استخدم GWAS لاكتشاف منطقة تقع عند 691.22 ميجا بايت على الكروموسوم 2A والتي تؤثر بشكل كبير على عدد الحبوب لكل سنبلة. اكتشفنا النمط الفرداني Chr2A-B49-Hap2 ، الموجود في 704.8-705.8 ميجا بايت ، والذي يؤثر بشكل إيجابي على GNS ، على بعد 13 ميجا بايت فقط من المنطقة [46].

    السمات المتعلقة بالتكيف مع المحاصيل:

    بالنسبة إلى HD ، وجدنا أن ملف Ppd-D1 علامة الجين [47] هي الأقوى المرتبطة بالسمة ، لا سيما في موقع ماركوس خواريز ، الواقع في أدنى خط عرض في دراستنا. هذه النتائج تتفق مع تلك التي حصل عليها [33] ، حيث Ppd-D1 تم العثور على الجين ليكون المحدد الرئيسي لدورة الحياة في أصناف القمح الأرجنتيني.

    على الكروموسوم 1 ب ، اكتشفنا ثلاثة أنماط فردية مرتبطة بـ HD. [48] ​​اقترح الجين TaFT-B3 (581.4 ميجا بايت) كمعدل HD لأيام قصيرة على هذا الكروموسوم. يقع أقرب نمط فرداني مهم لدينا ، Chr1B-B76-Hap2 (الجدول 5) ، على بعد 61.7 ميجا بايت من القاصي. TaFT-B3، كونها أبعد قليلاً من القيمة الحرجة 0.1 لتضاؤل ​​LD المقدرة بـ 50 ميغا بايت [41].

    من ناحية أخرى ، أظهر [49] أن فقدان وظائف المسوخ PHYTOCLOCK 1 (WPCL1) ، الموجود عند 740.1 ميجا بايت على الكروموسوم 3 أ ، مرتبط بوقت الإزهار المبكر الإضافي. اكتشفنا أربعة أنماط فردية على الكروموسوم 3A المرتبط بـ HD. أقرب نمط فرداني مهم ، Chr3A-B-Hap4 (الجدول 5) ، يقع بالقرب من WPCL1 وضع WPCL1 كمرشح لجمعية Chr3A-B-Hap4 HD.

    أخيرًا ، لم يتم الكشف عن ارتباطات مهمة لـ HD مع الجينات Vrn-A1 (5 أ) [50] ، Vrn-B1 (5 ب) ، VR-D1 (5D) [51] و Ppd-B1 (2B) [52] ، مما يشير إلى أن هذه المجموعة من الجينات لا يبدو أنها تؤثر على وقت العنوان في مجموعة الصنف لدينا. التفسير الأكثر ترجيحًا هو أنه قد يأتي من الظروف الميدانية حيث تم تقييم المجموعة ، مع تلبية متطلبات التقسيم ، أو التفاعلات المعرفية العالية المحتملة بين جينات التبخير ، مما يتسبب في صعوبات في اكتشاف التأثيرات الطفيفة على وقت الإزهار.

    في حالة PH ، لم نجد ارتباطات ذات دلالة إحصائية بين السمة والعلامات الجزيئية لجينات تقزم "الثورة الخضراء" Rht-B1 و Rht-D1، التي وصفها [53]. على الرغم من أن المجموعة قدمت تباينًا كبيرًا في الرقم الهيدروجيني ، إلا أنه يجب الإشارة إلى أن مجموعة القمح المستخدمة في دراستنا تتكون أساسًا من أصل وراثي النخبة شبه القزم وأن Rht-B1 و Rht-D1 الجينات متوازنة.

    ضمن 51 ارتباطًا مهمًا تم اكتشافه ، كان الكروموسوم 1B النمط الفرداني Chr1B-B17-Hap4 والكروموسوم 6B SNP AX-94943227 (234.8 ميجا بايت) جديرًا بالملاحظة بشكل خاص ، حيث كانا مهمين عبر المواقع الثلاثة في جميع السنوات التي تم تحليلها. على حد علمنا ، لا توجد جينات مرتبطة بارتفاع النبات موصوفة في هذه الكروموسومات ، مما يشير إلى أن ارتباطات PH-HB / SNP المتسقة هي أهداف واعدة لمزيد من مشاريع استنساخ الجينات.

    اكتشفنا أربعة أنماط فردانية على الكروموسوم 5A المرتبط بـ PH. في عمل الخرائط [54] يقع GA-response رت الجينات Rht9 و Rht12 على ذراع الكروموسوم 5AL ، حيث Rht9 كان مرتبطًا بـ SSR barc151 (558.34 ميجا بايت) و Rht12 كان يقع على بعد 5.4 سم من SSR Xgwm291 (698.19 ميجا بايت). قد يكون النمط الفرداني الخاص بنا Chr5A-B54-Hap3 المعين على 516.1-527.9 ميجا بايت مرتبطًا بـ Rht9 مرتبط بـ SSR barc151 بسرعة 558.34 ميجا بايت. ومع ذلك ، مثل هذا الارتباط مع Rht12 يجب التخلص منها في دراستنا ، حيث يتم وضع أنماط فردانية PH إضافية في مناطق وراثية بعيدة عن جين PH هذا.

    على الكروموسوم 6A ، اكتشفنا ستة أنماط فردانية مرتبطة بـ PH على وجه الخصوص ، كان النمط الفرداني Chr6A-B54-Hap5 (610.0 ميجا بايت) مرتبطًا بشكل كبير بـ PH في المواقع الثلاثة وفي جميع سنوات التقييم ، باستثناء Balcarce 2015. ومع ذلك ، لا يوجد أي من المرتبطين بها. تم تحديد أنماط الفردانية في مواضع مادية قريبة من أي من جينات PH المعروفة على 6A ، وهي Rht25 (144.0-148.3 ميجا بايت) تم الكشف عنها بواسطة [55] و Rht18 / Rht14 / Rht24(413.73 ميجا بايت) وصفها سابقًا [56].

    من المهم تسليط الضوء على أن لوحات الارتباط الصغيرة قد ثبت أنها تزيد من معدلات الخطأ من النوع 1 والنوع 2 ، وتفشل في اكتشاف الارتباطات الحقيقية بينما تولد أيضًا معدلًا أعلى من الارتباطات الإيجابية الخاطئة [57]. في هذا العمل ، استخدمنا لوحة ارتباط صغيرة (102 صنفًا) ، لكننا استخدمنا نهجًا متحفظًا لـ GWAS ، من أجل تقليل الارتباطات الزائفة. ومع ذلك ، قد نفشل في اكتشاف المناطق الجينومية التي لديها معدلات منخفضة لتفسير القيم المظهرية أو توجد بتردد منخفض في اللوحة. يوصى بالتحقق من صحة الارتباطات التي تم الإبلاغ عنها في العشائر المستقلة قبل استخدامها في برامج تربية القمح.


    كتلة النمط الفرداني المرتبطة بوزن الألف نواة على الكروموسوم 5DS في القمح الشائع (Triticum aestivum L.)

    عدد السنابل لكل وحدة مساحة ، وعدد الحبوب في السنبلة ، ووزن الألف نواة (TKW) هي مكونات إنتاجية مهمة للقمح (Triticum aestivum L.). تمتلك TKW أعلى نسبة وراثة بين المكونات الثلاثة. لقد تحققنا من صحة 27 موقع تكرار تسلسل بسيط (SSR) مرتبط بـ TKW في F2:5 نمت عشيرة التربية في أربع بيئات. أ CFD78265 نقطة أساس أظهر علامة على الكروموسوم 5DS أقوى ارتباط مع TKW وكان له تأثير إيجابي بشكل ملحوظ على TKW مقارنة بالأليل CFD78259 نقطة أساس، بمتوسط ​​زيادات قدرها 5.17 و 3.63 و 4.11 و 5.16 جم في البيئات الأربع. علامات CFD67 و CFD40 المرافقة CFD78 أظهر أيضًا ارتباطات إيجابية بشكل ملحوظ مع TKW مع زيادات قدرها 5.11 و 3.29 و 4.31 و 4.50 جم لـ CFD67205و 4.98 و 3.49 و 4.06 و 4.84 جم لـ CFD40187 مقارنة مع CFD67203 و CFD40190 في البيئات الأربع ، على التوالي. تم اكتشاف موضع سمة كمية رئيسية لـ TKW الذي يمتد على 2.94 سم على كروموسوم 5DS عن طريق رسم خرائط الارتباط. اختلال توازن قوي في الارتباط (LD) (ص 2 & gt 0.2) بين العلامات المرتبطة الثلاثة ، والتي شكلت ثلاث كتل من النمط الفرداني في F.2:5 تكاثر السكان. يعني TKW الاختلافات بين HapB-انا و HapB-II كانت 5.80 و 4.41 و 4.02 و 5.06 جم في البيئات الأربع على التوالي. علاوة على ذلك ، تم الكشف عن LD كبير فقط بين CFD78 و CFD67 وبين CFD67 و CFD40 في مجموعة الأصول الوراثية. توفر هذه الدراسة أساسًا لاستنساخ الجينات المتعلقة بـ TKW على الكروموسوم 5DS.


    مقدمة

    مع انخفاض التكلفة وزيادة إنتاجية تسلسل الجيل التالي ، يتزايد عدد المُدخلات التي يمكن استخدامها لدراسة الارتباط على مستوى الجينوم (GWAS) [1-3]. باستخدام بيانات التسلسل الكبيرة هذه ، تُستخدم GWAS الآن على نطاق واسع ليس فقط في الوراثة البشرية ولكن أيضًا في الوراثة والتربية النباتية والحيوانية ، وقد حددت جينات جديدة مرتبطة بالسمات الزراعية الهامة [4-6]. أحد الأمثلة على بيانات التسلسل الكبيرة من الجيل التالي هو "مشروع 3000 جينوم للأرز" كما هو مستخدم في هذه الدراسة [7 ، 8] ، تتوفر البيانات منها في "قاعدة بيانات Rice SNP-Seek" [9-11]. تم بالفعل الإبلاغ عن نتائج GWAS باستخدام هذه البيانات [12].

    على الرغم من تعزيز مثل هذه البيانات العامة ، لا تزال طريقة GWAS التقليدية تواجه عقبات في اكتشاف الجينات المرشحة غير المعروفة. أحد الأمثلة الشائعة هو صعوبة اكتشاف الأليلات النادرة أو المتغيرات النادرة. إحدى المشكلات التي تسببها المتغيرات النادرة هي أن العلامات غير السببية التي لها اختلال توازن قوي في الارتباط (LD) مع أحد المتغيرات السببية النادرة تشير إلى قوة اكتشاف أعلى من المتغير السببي الحقيقي النادر ، والذي قد يتداخل مع اكتشاف المتغير السببي الحقيقي . تُعرف هذه الظاهرة باسم "الارتباط التركيبي" ، وغالبًا ما تحدث عندما يكون تردد الأليل الصغير (MAF) للعلامة غير السببية أعلى من المتغير النادر الحقيقي [13]. ترتبط هذه المشكلة ارتباطًا وثيقًا بالتركيبات الجينية المعقدة التي تشتمل على أليلات متعددة مثل الأنماط الفردانية لأن الجينات المرتبطة بالسمات الزراعية المهمة تتكون غالبًا من أليلات نادرة متعددة ، ولهذا السبب يصعب اكتشاف الأنماط الفردية باستخدام GWAS [14].

    تم اقتراح عدة طرق لحل هذه المشكلة. يعد اختبار ارتباط نواة التسلسل (SKAT) أحد الأساليب المستخدمة للكشف عن المتغيرات النادرة ، وقد تم استخدامه بشكل أساسي في علم الجينوم البشري [15]. يستخدم SKAT نهج مجموعة تعدد أشكال النيوكليوتيدات الفردي (SNP) ، والذي يختبر تعدد أشكال تعدد الأشكال في كل مجموعة SNP في نفس الوقت. يقوم SKAT بتقييم أهمية التباين الموضح من خلال مجموعة الاهتمام SNP كتأثير عشوائي باستخدام نهج نموذج التأثير المختلط [16 ، 17]. يتمثل العيب القاتل في SKAT الأصلي في أن النموذج لا يأخذ في الاعتبار تأثيرات العلاقة الأسرية كتأثير عشوائي ، مما يؤدي إلى نتائج إيجابية خاطئة لـ GWAS في المواد ذات البنية السكانية القوية أو الارتباط بالعائلة ، كما هو الحال في المجموعة العالمية من الأصول الوراثية للأرز المستخدمة في هذه الدراسة. تم اقتراح عدة طرق أيضًا للتغلب على عيب SKAT آخر: يمكن أن يؤدي مخطط الترجيح لـ SKAT للمتغيرات النادرة والشائعة إلى فقدان قوة المتغيرات الشائعة ، لكن نماذجهم أيضًا لا تتضمن المصطلح الخاص بتصحيح الآثار المربكة للعلاقة الأسرية [ 18 ، 19].

    لحل العيوب القاتلة في SKAT الأصلي ، تم اقتراح العديد من الطرق التي تتضمن نماذجها مصطلح العلاقة الأسرية كآثار عشوائية للتحكم في الإيجابيات الخاطئة [20-22]. من وجهة نظر إحصائية ، عادةً ما تؤدي هذه الطرق اختبار الدرجة [23] ، وهي طريقة حسابية فعالة لأنها تتطلب تقدير مكون التباين فقط للنموذج الفارغ. من حيث قوة الكشف ، ومع ذلك ، فإن اختبار الدرجة ليس بالضرورة أفضل طريقة لاختبار التأثيرات العشوائية في نموذج التأثيرات المختلطة [24]. اختبار نسبة الاحتمالية (LR) [25 ، 26] هو مرشح آخر يستخدم لاختبار تباين مجموعة اهتمامات SNP ، وقد تم اقتراح عدة طرق تستخدم اختبار LR لـ GWAS مجموعة SNP في عينات الأسرة [24 ، 27]. على وجه الخصوص ، ليبرت وآخرون. نفذت طريقة GWAS ذات الكفاءة الحسابية لمجموعة SNP باستخدام اختبار LR ، وذكرت أن اختبار LR أظهر قوة أكبر من اختبار النتيجة [24]. على الرغم من كونها طريقة فعالة ، ليبرت وآخرون. تستخدم بشكل أساسي نواة خطية لبناء مصفوفة جرام من كل مجموعة SNP ، وبالتالي لا يمكن استخدام نواة أخرى ، مثل نواة Gaussian أو نواة أسية ، لبناء مصفوفة جرام في طريقتها.

    النهج القائمة على النمط الفرداني ، والتي تحاول تحسين قوة الكشف عن الأنماط الفردية السببية ، تبدو منطقية من وجهة نظر أن الجين يعمل كمجموعة جينية واحدة ، وليس كل SNP في مجموعة الجينات. من المتوقع أن تتحكم هذه الأساليب القائمة على النمط الفرداني في الإيجابيات الخاطئة بشكل أفضل من طريقة SNP الأحادية لأن الأساليب القائمة على النمط الفرداني تركز على كتلة النمط الفرداني بأكملها ، وليس على كل SNP في كتلة النمط الفرداني. من المتوقع أيضًا أن تكشف هذه الطرق عن الآلية المعقدة للأنماط الفردانية السببية التي لا يمكن اكتشافها عند التركيز على SNP واحد ، مثل حالات التنافر بين موقعين سببيين للسمات الكمية (QTL) يقعان بالقرب من بعضهما البعض. ومع ذلك ، تم اقتراح عدد قليل فقط من الطرق لـ GWAS المستندة إلى النمط الفرداني. في علم الجينوم النباتي ، يانو وآخرون. أجرى GWAS على أساس النمط الفرداني عن طريق اختبار تأثيرات الأنماط الفردانية مع الأخذ في الاعتبار المتغيرات الوهمية لمجموعات النمط الفرداني كتأثيرات ثابتة ، ووجد جينات مرشحة جديدة مرتبطة بتاريخ العنوان للأرز [28]. تم اقتراح طرق أخرى في علم الجينوم الحيواني ، والتي قدرت تأثيرات النمط الفرداني الأسلاف من خلال اعتبارها تأثيرات عشوائية [29 ، 30]. في أساليبهم ، تم تحديد كل عنصر زوجي من مصفوفة التغاير للتأثيرات العشوائية على أنه 1 إذا كان الأفراد ينتمون إلى نفس النمط الفرداني السلفي ، و 0 إذا كان غير ذلك. ومع ذلك ، تتطلب أساليب GWAS التقليدية القائمة على النمط الفرداني معلومات عن النمط الفرداني مسبقًا ، وليس من السهل تطبيق هذه الأساليب على مستوى الجينوم.

    في هذه الدراسة ، قمنا بتوسيع نموذج التأثيرات المختلطة متعددة النواة بشكل عام لأخذ العلاقة الأسرية في الاعتبار ، مع تمكين التسريع الحسابي لبعض الحالات المحدودة ، وطورنا نهج GWAS جديد SNP-set باسم RAINBOW (الاستدلال الموثوق به عن طريق التحسين) الأوزان). We also estimated haplotype blocks from genome-wide marker genotype data, and used them as SNP-sets for analysis with RAINBOW to enable haplotype-based GWAS without prior haplotype information.


    Availability of data and materials

    WhatsHap polyphase is available as open source code under the MIT License [35]. The version to generate the results in this paper is archived at [36]. All scripts needed to handle the input data and to reproduce the analyses can be found at https://github.com/eblerjana/whatshap-polyphase-experiments. The input files for the data generation are alignments of the diploid samples and gold standard phasings of these samples, which can be found at ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/hgsv_sv_discovery/working/ 20180102_pacbio_blasr_reheader/and on https://zenodo.org/record/3999218, respectively. For read simulation, the pipeline uses the file SRR3658380.fastq as example file, which is available at https://www.ncbi.nlm.nih.gov/sra/SRX1837675. Solanum tuberosumsequencing data has been made available at the NCBI with accession number PRJNA587397 [37].


    The HapMap Project

    The International HapMap Consortium reported in the 27 October 2005 issue of طبيعة سجية the location of >1 million SNPs in the human genome. These were found by sequencing the DNA of all 22 autosomes, the X and Y chromosomes, and the mitochondrial DNA from 169 people drawn from populations living in Nigeria (90), Utah (90), China (45), and Japan (40). The Nigerian and Utah populations were made up of 30 parent-offspring groups of three.

    They discovered that a particular SNP is usually associated with a number of other SNPs forming a block inherited together &mdash a haplotype.

    Because of this tendency of a particular set of SNPs to remain together, called الربط اختلال التوازن, one can use one probe for a single SNP (called a "tag SNP") to search for the presence of the complete haplotype.

    • A sample of the subject's DNA is digested with a restriction enzyme.
    • The digest is applied to a DNA chip array with each spot containing an oligodeoxynucleotide (

    • a disease thought to have a genetic component (e.g., schizophrenia)
    • or a bad reaction to a drug
      of criminal suspects
    • establish family relationships
    • hunt for genes that cause &mdash or predispose to &mdash disease.
    • the Y chromosome and in (mtDNA).

    Selective Sweeps

    Extended haplotype homozygosity

    The extended haplotype homozygosity (EHH) statistic was introduced by Sabeti وآخرون. (2002) and is defined as the homozygosity of all haplotypes surrounding a core locus. For a sample of ن chromosomes, the set ج contains all possible distinct haplotypes at a core locus. For simplicity, we assume the core locus and all adjacent markers are biallelic SNPs, thus C:=<0,1>, where 0 represents the ‘ancestral allele’ and 1 denotes the derived allele. The set C(xأنا) contains all possible distinct haplotypes extending from the core locus in one direction (upstream or downstream) to the أنا th marker. Therefore, C(x1):=<00,01,10,11>, C(x2):=<000, 001, 010, 011, 100, 101, 110, 111>, etc. The EHH of a sample of haplotypes extending from the core locus to marker xأنا is then

    أين نح is the number of observed haplotypes of type h∈C(xأنا) and by definition ( x 2 ) = 0 for all x<2. EHH(xأنا) thus measures haplotype homozygosity within an interval ex tending from a core locus and is expected to be high for short intervals and monotonically decay as the interval widens since mutation and recombination events break up haplotypes. If the core locus contains an adaptive variant that is sweeping toward or has recently reached fixation, then we expect very long high-frequency haplotypes extending from the core and we should observe EHH(xأنا) decay slower than around a neutral locus. In practice, we select a query locus in the genome to test for evidence of a selective sweep and compute EHH at this locus with successively wider genomic intervals. We then compare this to a null distribution of EHH that is computed around a large number of randomly selected, putatively neutral loci, with similar allele frequencies.

    We illustrate this using mssel to simulate genetic data and the program selscan ( Szpiech and Hernandez, 2014 ) to compute EHH curves. We simulate 200 replicates of 50 haploid samples of 3 Mbp in a constant population size (effective population size نه=10 000) with a recently fixed positively selected allele placed at the center of the region with a selection coefficient of س=0.02 and a dominance coefficient of ح=0.5. We also perform 200 replicate neutral simulations of 50 haploid samples in a constant population size (نه=10 000). Each EHH calculation was centered on the middle of the simulated region and extended out 100 kbp on either side. Figure 5(a) shows the EHH decay curves for both neutral (blue) and non-neutral (red) simulations, demonstrating the slow decay of haplotype homozygosity around a positively selected versus neutral loci.

    Figure 5 . (a) Extended haplotype homozygosity (EHH) calculated from 50 haploid samples for 200 simulated replicates of a hard sweep (red lines) and 200 simulated replicates of neutrally evolving regions (blue lines), illustrating a slower EHH decay away from the adaptive locus as compared to neutral ones. (b) One example of EHH calculated on ancestral (blue line) and derived (red line) haplotypes separately in the vicinity of a hard sweep.


    شاهد الفيديو: أيمن عبدالرحيم فوضى الحدود في البلاد الإسلاميه (شهر نوفمبر 2022).