معلومة

تنسيق مصفوفة التعبير الجيني ميكروأري

تنسيق مصفوفة التعبير الجيني ميكروأري


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

بعد مسح شريحة ميكروأري نحصل على بيانات RAW بتنسيقات مختلفة حسب نوع ميكروأري المستخدم. ومع ذلك ، يمكن تطبيع ملفات بيانات RAW هذه ومعالجتها لإنشاء مصفوفة بيانات التعبير الجيني.

لقد كنت أحاول معرفة ما هي بالضبط نتيجة البيانات المعالجة وما هو تنسيق تلك البيانات. كما رأيت حتى الآن ، لا يوجد تنسيق محدد للبيانات المعالجة. بالطبع يتفق معظمهم على أن الأعمدة تمثل التجارب والصفوف تمثل الجينات ، لكن المعلومات الإضافية في الأعلى ، عادةً ما تكون مختلفة ولكني لست متأكدًا بناءً على ما. هل يمكن لأي شخص أن يقترح علي التنسيقات الأكثر استخدامًا؟ هل هناك أي معلومات إضافية عن ملف البيانات الذي تمت معالجته في حال أردت تطبيق التصنيف عليه؟


يتم تحويل قيم إشارة RAW من كل ميكروأري ومعالجتها لمنحك قيم إشارة طبيعية لكل ميكروأري. تعتبر خطوات التحويل والمعالجة قياسية ولكنها مختلفة لكل مصنع. يستخدم كل مصنع طريقة / تقنية مختلفة للحصول على قيم الإشارة. وبالتالي ، لا يمكن مقارنة قيم الإشارة بشكل مباشر بين تقنيات المصفوفات الدقيقة المختلفة.

قد تحصل التجارب التي تستخدم تقنيات مختلفة على تصنيف متشابه من النتائج ولكن قيم الإشارة العادية ستكون مختلفة. يمكنك إلقاء نظرة على GEO للحصول على قائمة بمجموعات البيانات والتقنيات الشائعة الاستخدام. ليس لدي أدنى فكرة عما تقصده بتطبيق التصنيف (هل تتطلع إلى تجميع النتائج من تقنيات ميكروأري مختلفة تعمل على نفس التجربة؟ أنا متأكد تمامًا من إجراء مقارنة بين تقنيات ميكروأري من قبل / بالفعل)


استخدام R لرسم خريطة حرارية من Microarray Data

يستخدم القسم الأول من هذه الصفحة R لتحليل مجموعة بيانات ميكروأري لسرطان الدم الليمفاوي الحاد (ALL) ، مما ينتج عنه خريطة حرارية (مع dendrograms) للجينات التي يتم التعبير عنها تفاضليًا بين نوعين من سرطان الدم.

هناك متابعة في الصفحة تتناول كيفية القيام بذلك من Python باستخدام RPy.

الاقتباس الأصلي للبيانات الأولية هو & quot ؛ ملف تعريف التعبير الجيني لسرطان الدم الليمفاوي الحاد للخلايا التائية البالغة ، يحدد مجموعات فرعية متميزة من المرضى الذين لديهم استجابة مختلفة للعلاج والبقاء على قيد الحياة & quot ؛ بواسطة Chiaretti وآخرون. Blood 2004. (PMID: 14684422)

التحليل عبارة عن وصفة & quot خطوة بخطوة & quot بناءً على هذه الورقة ، الموصل الحيوي: تطوير البرمجيات المفتوحة للبيولوجيا الحاسوبية والمعلوماتية الحيوية ، جنتلمان وآخرون. 2004. الشكل 2 خريطة التمثيل اللوني ، التي نعيد إنشائها ، مستنسخة هنا:


خلفية

من بين التحديات العديدة التي تطرحها المصفوفات الدقيقة لكل من علماء المعلومات الحيوية وعلماء الأحياء ، يعد اتصال البيانات أحد أهم التحديات. ينبع هذا من حقيقة أنه ، على عكس التسلسلات البيولوجية ، تتطلب بيانات المصفوفات الدقيقة هياكل بيانات متعددة الأبعاد ومتنوعة ، ولا توجد طرق طبيعية أو قياسية لنقل النتائج بين مجموعات البحث حتى الآن. ينطبق هذا على كل من بيانات التعبير الجيني الأساسية والتعليقات التوضيحية البيولوجية الوصفية التي توفر سياقًا لقياسات التعبير الجيني. تم نشر المئات من الأوراق البحثية ، ولكن ما لا يزيد عن حفنة قليلة قدمت بيانات بنفس التنسيق ، ولم يقدم أي منها معلومات سياقية كافية للسماح بإعادة إنتاج التجارب.

على مدار العامين الماضيين ، كانت MGED (مجموعة بيانات التعبير الجيني للمصفوفة الدقيقة) تتصارع مع تبادل بيانات ميكروأري القائم على المعايير. نشرت MGED مؤخرًا مواصفات تصف MIAME ، الحد الأدنى من المعلومات للتعليق التوضيحي لتجربة المصفوفة الدقيقة [1]. يعتمد MIAME على إجماع مئات المشاركين في مؤتمرات MGED (لمزيد من المعلومات ، انظر [2]) ويحدد البيانات والمعلومات السياقية التي يجب توفيرها عند نشر مجموعة بيانات التعبير الجيني للمصفوفة الدقيقة. بعض المجلات (على سبيل المثال ، طبيعة سجية) في تأييد أو تشجيع امتثال MIAME للأوراق التي تصف نتائج تجارب ميكروأري. ومن المتوقع (من المأمول بالفعل) أن تطلب المجلات ووكالات التمويل في المستقبل بيانات متوافقة مع MIAME من أجل استمرار التمويل والنشر ، على التوالي.

لا يكفي تحديد توفير بعض البيانات والمعلومات الملحقة. من الضروري ، إذا كان MIAME أن يكون مفيدًا ، وجود تنسيق إرسال قياسي للبيانات. لقد استجاب العديد من مؤلفي هذه الورقة سابقًا لهذه الحاجة من خلال تطوير تراكيب اتصالات البيانات المستندة إلى XML لتجارب المصفوفات الدقيقة (GEML ، لغة ترميز التعبير الجيني [3] من Rosetta Inpharmatics ، و MAML ، لغة ترميز ميكروأري من MGED).

XML (لغة الترميز الموسعة) هي مجموعة من القواعد التي يمكن من خلالها تحديد المفردات الجديدة نفسها. في بعض النواحي ، يشبه HTML ، حيث يتم استخدام العلامات لتشفير المعلومات ، ولكن في HTML ، ترتبط المعلومات بتنسيق المستند ، باستخدام مجموعة محددة مسبقًا من العلامات. في XML ، لا تشير العلامات إلى كيفية تنسيق المستند ، ولكنها بدلاً من ذلك توفر السياق الدلالي لمحتوى المستند. تحدد مفردات XML العلامات الخاصة بها ، وبالتالي تستخدم XML للاحتفاظ بالمعلومات بطريقة يمكن من خلالها فهم هذه المعلومات. وبسبب هذا ، فإن الدعم الواسع الذي تلقته XML منذ إصدارها كتوصية W3C في عام 1998 [4] اختار كل من GEML و MAML XML لتشفير بيانات المصفوفة الدقيقة. عادةً لا يكون مستند XML مستندًا مستقلاً ، ولكنه يشير إلى مستند آخر ، يسمى تعريف نوع المستند ، أو DTD. يحتوي DTD على مجموعة من القواعد أو "الإعلانات" التي تحدد العلامات التي يمكن استخدامها وما تحتويه. إنه DTD الذي نحدده في MAGE-ML. ستشير مستندات XML التي تم إنشاؤها لاستخدام MAGE-ML إلى DTD هذا. استجابة لطلب تقديم مقترحات من OMG (مجموعة إدارة الكائنات [5]) لطرق توصيل بيانات التعبير الجيني ، قدم مصممو GEML و MAML مفرداتهم كحلول محتملة لهذه المشكلة.


مراجع

Chen، D.-R.، Chang، R.-F.، & amp Huang، Y.-L. (2000). تشخيص سرطان الثدي باستخدام خرائط ذاتية التنظيم لـ Sonog-raphy. الموجات فوق الصوتية في الطب والبيولوجيا 26: 3, 405–411.

Chen، G.، Jaradat، S.، Banerjee، N.، Tanaka، T.، Ko، M.، & amp Zhang، M. (2002). تقييم ومقارنة خوارزميات التجميع في تحليل بيانات التعبير الجيني للخلايا الجذعية الجنينية. ستاتستيكا سينيكا ، 12, 241–262.

آيزن ، إم ، سبيلمان ، بي ، براون ، بي ، أند بوتستين ، دي (1998). تحليل الكتلة وعرض أنماط التعبير على مستوى الجينوم. وقائع الأكاديمية الوطنية للعلوم ، الولايات المتحدة الأمريكية ، 95, 14863–14868.

جيبونز ، إف ، وأمبير روث ، ف. (2002). الحكم على جودة طرق التجميع المستندة إلى التعبير الجيني باستخدام الشرح الجيني. بحوث الجينوم ، 12, 1574–1581.

Hautaniemi، S.، Ringnér، M.، Kauraniemi، P.، Kallioniemi، A.، Edgren، H.، Yli-Harja، O.، Astola، J.، & amp Kallion-iemi، O.-P. (2002). استراتيجية لتحديد الأسباب المفترضة للاختلاف في التعبير الجيني في سرطان الإنسان. في وقائع ورشة العمل حول معالجة الإشارات الجينومية والإحصاء (GENSIPS) ، رالي ، نورث كارولاينا ، الولايات المتحدة الأمريكية ، أكتوبر 2002.

هايكين ، س. (1999). الشبكات العصبية ، مؤسسة شاملة ، الطبعة الثانية ، برنتيس هول.

Hedenfalk، I.، Duggan، D.، Chen، Y.، Radmacher، M.، Bittner، M.، Simon، R.، Meltzer، P.، Gusterson، B.، Esteller، M.، Kallioniemi، O.- P.، Wilfond، B.، Borg، Å.، & amp Trent، J. (2001). ملامح التعبير الجيني في سرطان الثدي الوراثي. مجلة نيو إنجلاند الطبية ، 344:8, 539–548.

Hill، A.، Hunter، C.، Tsung، B.، Tucker-Kellogg، G.، & amp Brown، E. (2000). التحليل الجيني للتعبير الجيني في C. elegans. العلم ، 290, 809–812.

هيمان ، إي ، كورانييمي ، بي ، أوتانييمي ، إس ، وولف ، إم ، موسيس ، إس ، روزينبلوم ، إي ، رينجنير ، إم ، سوتر ، جي ، مونني ، أو. ، الكحلون ، إيه ، Kallioniemi، A.، & amp Kallioniemi، O.-P. (2002). تأثير تضخيم الحمض النووي على أنماط التعبير الجيني في سرطان الثدي. أبحاث السرطانح ، في الصحافة.

Kallioniemi، A.، Kallioniemi، O.-P.، Sudar، D.، Rutovitz، D.، Gray، J.، Waldman، F.، & amp Pinkel، D. (1992). التهجين الجيني المقارن للتحليل الخلوي الجزيئي للأورام الصلبة. علم ، 258, 818–882.

Kaski، S.، Kangas، J.، & amp Kohonen، T. (1998). ببليوغرافيا أوراق الخرائط ذاتية التنظيم (SOM): 1981-1997. استطلاعات الحوسبة العصبية 1 ، 102–350.

Kaski، S.، Nikkilä، J.، Törönen، P.، Castrén، E.، & amp Wong، G. (2001). تحليل وتصور بيانات التعبير الجيني باستخدام الخرائط ذاتية التنظيم. في وقائع NSIP-01 ، ورشة عمل IEEE-EURASIP حول الإشارات غير الخطية ومعالجة الصور.

Kaski، S.، & amp Sinkkonen، J. (2002). التجميع على أساس التوزيعات الشرطية في مساحة إضافية. الحساب العصبي ، 14, 217–239.

Kauraniemi، P.، Bärlund، M.، Monni، O.، & amp Kallioniemi، A. (2001). تم اكتشاف جينات جديدة مكبرة ومُعبر عنها بشدة في أمبليكون ERBB2 في سرطان الثدي بواسطة مصفوفات cDNA الدقيقة. أبحاث السرطان ، 61, 8235–8240.

كوهونين ، ت. (2001). خرائط ذاتية التنظيم ، الطبعة الثالثة ، سبرينغر.

Mangiameli، P.، Chen، S.، & amp West، D. (1996). مقارنة بين الشبكة العصبية SOM وطرق التجميع الهرمي. المجلة الأوروبية للبحوث التشغيلية ، 93, 402–417.

Monni، O.، Bärlund، M.، Mousses، S.، Kononen، J.، Sauter، G.، Heiskanen، M.، Paavola، P.، Avela، K.، Chen، Y.، Bittner، M.، & amp Kallioniemi، A. (2001). رقم نسخة شامل وتنميط التعبير الجيني لـ 17q23 amplicon في سرطان الثدي البشري. وقائع الأكاديمية الوطنية للعلوم ، الولايات المتحدة الأمريكية ، 98:10, 5711–5716.

موسيس ، إس ، واغنر ، يو ، تشين ، واي ، كيم ، جي ، بوبندورف ، إل ، بيتنر ، إم ، بريتلو ، تي ، الكحلون ، إيه ، تريبيل ، جي ، أند كاليونييمي ، أو. -P. (2001). يتضمن فشل العلاج بالهرمونات في سرطان البروستاتا الاستعادة المنتظمة للجينات المستجيبة للأندروجين وتفعيل الإشارات الحساسة للراباميسين. Oncogene، 20:46, 6718–6723.

Oja، M.، Nikkilä، J.، Törönen، P.، Wong، G.، Castrén، E.، & amp Kaski، S. (2002). المجموعات الاستكشافية لمحات التعبير الجيني لسلالات الخميرة الطافرة. في W. Zhang & amp I. Shmulevich (محرران) ، المناهج الحسابية والإحصائية للجينومs ، Kluwer Academic Publishers.

بارميجياني ، جي ، جاريت ، إي ، أنبازهاجان ، آر ، وأم غابريلسون ، إي (2002). الإطار الإحصائي للتصنيف الجزيئي القائم على التعبير في السرطان. مجلة الجمعية الإحصائية الملكية: السلسلة ب (المنهجية الإحصائية) ، 64, 1–20.

بولاك ، جيه ، بيرو ، سي ، أليزاده ، إيه ، آيزن ، إم ، بيرجامينشيكوف ، إيه ، ويليامز ، سي ، جيفري ، إس ، بوتستاين ، دي ، وأمبير براون ، بي (1999). التحليل على مستوى الجينوم لتغييرات رقم نسخ الحمض النووي باستخدام المصفوفات الدقيقة (كدنا). علم الوراثة الطبيعي ، 23: 1, 41–46.

راماسوامي ، س ، تامايو ، ب ، ريفكين ، آر ، موخيرجي ، س ، يانج ، سي ، أنجيلو ، إم ، لاد ، سي ، رايش ، إم ، لاتوليب ، إي ، ميسيروف ، ج. بوجيو ، ت. ، جيرالد ، دبليو ، لودا ، إم ، لاندر ، إي ، & أمبير جولوب ، ت. (2001). تشخيص السرطان متعدد الطبقات باستخدام بصمات التعبير الجيني للورم. وقائع الأكاديمية الوطنية للعلوم ، الولايات المتحدة الأمريكية ، 98: 26, 15149–15154.

Raychaudhuri، S.، Stuart، J.، & amp Altman، R. (2000). تحليل المكونات الرئيسية لتلخيص التجارب السابقة للمصفوفات الدقيقة: التطبيق على السلاسل الزمنية للتلوث. وقائع ندوة المحيط الهادئ حول المعلوماتية الحيوية ، 5, 452–463.

Siegler ، M. ، Jain ، U. ، Raj ، B. ، & amp Stern ، R. (1997). تجزئة وتصنيف وتجميع آلي للأخبار الصوتية المذاعة. في وقائع ورشة عمل DARPA للتعرف على الكلام (97–99).

Tamayo ، P. ، Slonim ، D. ، Mesirov ، J. ، Zhu ، Q. ، Kitareewan ، S. ، Dmitrovsky ، E. ، Lander ، E. ، & amp Golub ، T. (1999). تفسير أنماط التعبير الجيني باستخدام طرق الخرائط ذاتية التنظيم وتطبيقها على التمايز المكونة للدم. وقائع الأكاديمية الوطنية للعلوم ، الولايات المتحدة الأمريكية ، 96, 2907–2912.

Törönen، P.، Kolehmainen، M.، Wong، G.، & amp Castrén، E. (1999). تحليل بيانات التعبير الجيني باستخدام الخرائط ذاتية التنظيم. رسائل FEBS ، 451: 2, 142–146.

Ultsch، A.، & amp Siemon، H. (1989). تحليل البيانات الاستكشافية: استخدام شبكات Kohonen على المحولات. التقرير الفني 329 ، جامعة دورتموند ، ألمانيا.

Vesanto، J.، Himberg، J.، Alhoniemi، E.، & amp Parhankangas، J. (2000). مجموعة أدوات SOM لـ Matlab 5. التقرير الفني A57 ، جامعة هلسنكي للتكنولوجيا ، فنلندا.

Wall ، M. ، Dyck ، P. ، & amp Brettin ، T. (2001). SVDMAN- تحليل تحلل القيمة المفرد لبيانات المصفوفة الدقيقة. المعلوماتية الحيوية 17: 6, 566–568.

Xiong، M.، Fang، X.، & amp Zhao، J. (2001). تحديد العلامات الحيوية بواسطة أغلفة الميزات. بحوث الجينوم 11:11, 1878–1887.


تنسيق مصفوفة التعبير الجيني ميكروأري - علم الأحياء

Neuroevolution كأداة لتحديد نمط التعبير الجيني Microarray في أبحاث السرطان

مرحبا بكم في هذا المستودع. ستجد هنا كل الكود اللازم لتشغيل خوارزمية N3O لتصنيف ميكروأري واختيار الجينات.

لا تزال المصفوفات الدقيقة إحدى التقنيات الرئيسية المستخدمة لدراسة بيولوجيا السرطان. ومع ذلك ، لا يزال تحديد أنماط التعبير من مجموعات بيانات ميكروأري يمثل تحديًا كبيرًا يجب التغلب عليه. في هذا العمل ، يقدم نهج جديد باستخدام Neuroevolution ، وهو مجال التعلم الآلي الذي يجمع بين الشبكات العصبية والحساب التطوري ، المساعدة في هذا التحدي من خلال تصنيف بيانات المصفوفات الدقيقة في نفس الوقت واختيار مجموعة فرعية من الجينات الأكثر صلة. تم تكييف الخوارزمية الرئيسية FS-NEAT عن طريق إضافة عوامل هيكلية جديدة مصممة لهذه البيانات عالية الأبعاد. بالإضافة إلى ذلك ، تم استخدام بروتوكول ترشيح ومعالجة مسبقة صارم لتحديد مجموعات بيانات ميكروأري عالية الجودة للطريقة المقترحة ، واختيار 13 مجموعة بيانات من ثلاثة أنواع مختلفة من السرطان. تُظهر النتائج أن Neuroevolution كان قادرًا على تصنيف عينات المصفوفة الدقيقة بنجاح عند مقارنتها بالطرق الأخرى في الأدبيات ، مع العثور أيضًا على مجموعات فرعية من الجينات التي يمكن تعميمها لخوارزميات أخرى وتحمل المعلومات البيولوجية ذات الصلة. اكتشف هذا النهج 177 جينًا ، وتم التحقق من صحة 82 جينًا على أنها مرتبطة بالفعل بأنواع السرطان الخاصة بكل منها ، وارتبط 44 منها بأنواع أخرى من السرطان ، لتصبح أهدافًا محتملة يمكن استكشافها كمؤشرات حيوية للسرطان. كما تم الكشف عن خمسة رنا طويلة غير مشفرة ، منها أربعة لم تصف الوظائف حتى الآن. ترتبط أنماط التعبير الموجودة ارتباطًا جوهريًا بالمصفوفة خارج الخلية والإكسوسومات وتكاثر الخلايا. يمكن أن تساعد النتائج التي تم الحصول عليها في هذا العمل في كشف الآليات الجزيئية الكامنة وراء عملية الورم ووصف الأهداف المحتملة الجديدة التي سيتم استكشافها في الأعمال المستقبلية.

Neuroevolution كأداة لتحديد نمط التعبير الجيني Microarray في أبحاث السرطان

برونو أيوشينز غريسكي ، برونو سيزار فيلتيس ، مارسيو دورن

معهد المعلوماتية ، الجامعة الفيدرالية في ريو غراندي دو سول ، بورتو أليغري ، جمهورية صربسكا ، البرازيل

إذا كنت تستخدم N3O في منشور علمي ، فنحن نقدر الاستشهاد بالورقة التالية:

برونو أيوشينز جريسكي ، برونو سيزار فيلتيس ، ومارسيو دورن. "Neuroevolution كأداة لتحديد نمط التعبير الجيني Microarray في أبحاث السرطان." مجلة المعلوماتية الطبية الحيوية (2018). https://doi.org/10.1016/j.jbi.2018.11.013

إذا كنت تبحث عن عمل سابق يستخدم FS-NEAT خالص لتصنيف ميكروأري ، يرجى الرجوع إلى https://doi.org/10.1109/CEC.2018.8477813

قم بتنزيل الدليل الأنيق (الذي كان متاحًا في السابق كملف .zip) بجميع الملفات وقم بتشغيل الأمر التالي من داخله:

python NEAT.py save_dir number_generations number_cores k_cross_validation data_file label_file index_file

  • save_dir: مسار الدليل (String) حيث يجب حفظ النتائج
  • number_generations: (Int) عدد أجيال الخوارزمية الجينية
  • number_cores: (Int) عدد النوى المتاحة للتوازي
  • k_cross_validation: (Int) يحدد عدد الطيات من أجل التحقق المتقاطع الطبقي ، مضبوطًا على 0 لعدم التحقق المتبادل
  • data_file: مسار ملف (String) إلى ملف .gct مع بيانات تعبير الجينات
  • label_file: مسار ملف (سلسلة) إلى ملف .cls مع تسمية العينات
  • index_file: مسار الملف (String) إلى ملف .txt مع فهارس عينات كل طية في التحقق المتبادل. استخدم لا شيء لإنشاء الطيات تلقائيًا

سيتم حفظ اختيار الجين النهائي باسم tr_selection.gct

سيتم حفظ الدقة النهائية على أنها دقة .txt

سيتم حفظ الشبكة العصبية النهائية باسم reqnet.svg

سيتم حفظ مصفوفة الارتباك النهائية كـ cv_cm.svg

تحذير: يرجى ملاحظة أنه نظرًا لمشاكل توافق المعالجة المتعددة ، فإن هذا الرمز مدعوم حاليًا فقط بواسطة أنظمة تشغيل Unix (Linux و macOS).

للتحقق مما إذا تم تثبيت جميع المكتبات المطلوبة.

برنامج Graphviz مطلوب أيضًا: https://www.graphviz.org/

يرجى ملاحظة أن الكود يجب أن يعمل مع Python 2.7.

الرجاء استخدام تنسيقات الملفات .gct و .cls لتشغيل هذا البرنامج النصي.

تحذير: يرجى ملاحظة أنه للاستخدام مع N3O ، يجب أن تكون جميع مشكلات التصنيف ثنائية (يجب أن تحتوي ملفات الإدخال على فئتين بالضبط!).

بيانات الميكرو للاختبارات

البيانات المستخدمة في الورقة الأصلية متاحة (مضغوطة) في دليل البيانات.

إذا كنت بحاجة إلى بيانات للاختبارات أو المعايير ، أو كنت تريد فقط مجموعات بيانات ميكروأري لتجاربك الخاصة ، فتحقق من CuMiDa (قاعدة بيانات ميكرواري المنسقة) على: http://sbcb.inf.ufrgs.br/cumida

جميع البيانات المستخدمة في هذه الورقة متاحة من خلال CuMiDa.

تحذير: يرجى ملاحظة أنه للاستخدام مع N3O ، يجب أن تكون جميع مشكلات التصنيف ثنائية (يجب أن تحتوي ملفات الإدخال على فئتين بالضبط!). يمكنك تكييف المشاكل متعددة الفئات (مثل بعض مجموعات البيانات المتاحة في CuMiDa) باستخدام تصنيف واحد مقابل الكل: https://en.wikipedia.org/wiki/Multiclass_classification#One-vs.-rest


مقارنة تقنية RNA-Seq و Microarray

تتيح تقنية تسلسل الحمض النووي الريبي (RNA-Seq) التنميط السريع والتحقيق العميق في النسخ ، لأي نوع. يقدم هذا النهج عددًا من المزايا مقارنة بتحليل المصفوفات الدقيقة ، وهي تقنية قديمة غالبًا ما تستخدم في دراسات التعبير الجيني.

فوائد RNA-Seq مقابل تقنية Microarray

القدرة على اكتشاف النصوص الجديدة: على عكس المصفوفات ، لا تتطلب تقنية RNA-Seq تحقيقات خاصة بالأنواع أو النسخ. يمكنه اكتشاف النسخ الجديدة ، اندماج الجينات ، متغيرات النوكليوتيدات المفردة ، indels (عمليات الإدراج والحذف الصغيرة) ، والتغييرات الأخرى غير المعروفة سابقًا والتي لا تستطيع المصفوفات اكتشافها. 1،2

نطاق ديناميكي أوسع: باستخدام تقنية تهجين الصفيف ، يكون قياس التعبير الجيني مقيدًا بالخلفية عند الطرف المنخفض وتشبع الإشارة في النهاية العليا. تنتج تقنية RNA-Seq أعداد قراءة منفصلة للتسلسل الرقمي ، ويمكنها تحديد التعبير عبر نطاق ديناميكي أكبر (& gt10 5 لـ RNA-Seq مقابل 10 3 للمصفوفات). 1،2،3

خصوصية وحساسية أعلى: بالمقارنة مع المصفوفات الدقيقة ، يمكن لتقنية RNA-Seq اكتشاف نسبة أعلى من الجينات المعبر عنها تفاضليًا ، خاصة الجينات ذات التعبير المنخفض. 4-6

الاكتشاف البسيط للنصوص النادرة والمنخفضة الوفرة: يمكن زيادة عمق تغطية التسلسل بسهولة لاكتشاف النصوص النادرة ، أو النصوص الفردية لكل خلية ، أو الجينات المعبر عنها بشكل ضعيف.

الانتقال من Arrays إلى RNA-Seq

قم بالوصول إلى مقارنة مفصلة لتقنيات microarray و RNA-Seq ، من منظور مزود خدمة التسلسل.


الملخص

توضح هذه المقالة إجراءات محددة لإجراء تقييم جودة بيانات جينوم فول الصويا Affymetrix GeneChip® ولإجراء التحليلات لتحديد التعبير الجيني التفاضلي باستخدام بيئة برمجة R مفتوحة المصدر جنبًا إلى جنب مع برنامج Bioconductor مفتوح المصدر. وصفنا إجراءات استخراج معرّفات مجموعة مجسات Affymetrix المرتبطة تحديدًا بجينوم فول الصويا على شريحة فول الصويا Affymetrix ونوضح استخدام المؤامرات الاستكشافية بما في ذلك صور البيانات الأولية على مستوى المسبار ، والمخططات الصندوقية ، ومخططات الكثافة ، والمؤامرات M مقابل A. تمت مناقشة تدهور الحمض النووي الريبي والإجراءات الموصى بها من Affymetrix لمراقبة الجودة. يوفر نموذج مستوى التحقيق المناسب أداة ممتازة لتقييم الجودة. لإثبات ذلك ، نناقش ونعرض صورًا زائفة للشرائح للأوزان والمخلفات والمخلفات الموقعة ومخططات النمذجة الإضافية على مستوى المسبار التي يمكن استخدامها لتحديد الرقائق الشاذة. تم استخدام إجراء متوسط ​​متعدد الرقائق (RMA) لتصحيح الخلفية وتطبيع وتلخيص بيانات مستوى مسبار AffyBatch للحصول على بيانات مستوى التعبير واكتشاف الجينات المعبر عنها تفاضليًا. يتم تقديم أمثلة على boxplots و MA لبيانات مستوى التعبير. تُستخدم المخططات البركانية وخرائط الحرارة لتوضيح استخدام تغييرات الطي (اللوغاريتمي) بالتزامن مع التغييرات العادية والمعتدلة ر- إحصائيات لتحديد الجينات المثيرة للاهتمام. نعرض ، ببيانات حقيقية ، كيف نجح تنفيذ الوظائف في R و Bioconductor في تحديد الجينات المعبر عنها تفاضليًا والتي قد تلعب دورًا في مقاومة فول الصويا لمسببات الأمراض الفطرية ، Phakopsora pachyrhizi. يمكن تنزيل كود المصدر الكامل لأداء جميع عمليات تقييم الجودة والإجراءات الإحصائية من مصدر الويب الخاص بنا: http://css.ncifcrf.gov/services/download/MicroarraySoybean.zip.


تنسيق مصفوفة التعبير الجيني ميكروأري - علم الأحياء

بدأت هذه التقنية الجديدة في الظهور خلال النصف الثاني من التسعينيات ، وقد تطورت تاريخيًا من التقارير التجريبية الأولية التي نُشرت في منتصف السبعينيات والتي أشارت إلى أنه يمكن استخدام الأحماض النووية المسمى في مراقبة التعبير عن جزيئات الحمض النووي المرتبطة بدعامة صلبة. ومع ذلك ، لم يتم نشر المقال الأول الذي يصف تطبيق تقنية ميكروأري DNA لتحليل التعبير في الأدبيات العلمية حتى عام 1995 من قبل باتريك براون وزملائه في جامعة ستانفورد (براون. وآخرون. 1995).

اليوم ، ومع ذلك ، هناك أدلة بارزة على أن التكنولوجيا قد حققت تقدمًا كبيرًا منذ تطويرها واكتسبت شعبية متزايدة بين الباحثين العلميين. كما أنه مما لا شك فيه أن العديد من الباحثين العلميين يفترضون حداثة هذه التكنولوجيا معتبرين أنها أداة بحث لا غنى عنها وكذلك ضرورية.

كان هذا التبني الواسع النطاق لتقنية ميكروأري DNA في كل من الصناعة والعديد من مختبرات البحث الأكاديمي ، يرجع إلى حد كبير إلى قدرتها على توفير الفرصة للباحثين العلميين لإجراء تحليل متزامن سريعًا ودقيقًا لآلاف الجينات حرفيًا بطريقة متوازية على نطاق واسع ، أو حتى الجينوم بأكمله من كائن حي على سبيل المثال (البكتيريا ، الخميرة ، الفيروسات ، البروتوزوا ، الفأر أو الإنسان) في تجربة واحدة ، وبالتالي توفير معلومات شاملة وقيمة عن التفاعل الجيني والوظيفة.

هنا ، هدفنا هو تقديم نظرة عامة موجزة عن تقنية cDNA microarray ، ولا سيما شرح (Watson. ، وآخرون. 1998) ما هي تقنية cDNA microarray (Sinclair. ، 1999) الأنواع / المنصات المختلفة لتكنولوجيا cDNA microarray ، مع إبراز مزاياها وعيوبها وكذلك كيفية تصنيعها أو تصنيعها (Burgess. ، 2001) المبادئ الأساسية للتكنولوجيا وكيفية عمله كما تم توضيح التطبيقات المحتملة.

ومع ذلك ، للحصول على معلومات مفصلة عن الإمكانات والقيمة العلمية لتقنية ميكروأري (كدنا) في البحث الحديث ، يُنصح القارئ بالبحث عن العدد الكبير من المراجعات الممتازة لتكنولوجيا مجموعة الحمض النووي المتاحة (Rhodius. وآخرون 2002). نوصي على وجه الخصوص بملحق يناير 1999 من Nature Genetics (Bowtell. ، 1999).

ما هي تقنية DNA microarray؟

في مصطلحها الأوسع ، يمكن تعريف تقنية ميكروأري للحمض النووي على أنها تقنية عالية الإنتاجية ومتعددة الاستخدامات تستخدم لتحليل التعبير الجيني الموازي لآلاف الجينات ذات الوظائف المعروفة وغير المعروفة ، أو تحليل تماثل الحمض النووي للكشف عن تعدد الأشكال والطفرات في كل من الجينوم بدائية النواة وحقيقية النواة الحمض النووي.

ومع ذلك ، فإن المصفوفة الدقيقة للحمض النووي في تعريفها الدقيق والدقيق هي ترتيب منظم لآلاف الجينات المتسلسلة المحددة المطبوعة على دعامة صلبة غير منفذة ، وعادة ما تكون من الزجاج أو رقائق السيليكون أو غشاء النايلون.

يتوافق كل جين متسلسل تم تحديده على الزجاج أو رقائق السيليكون أو غشاء النايلون مع جزء من الحمض النووي الجيني أو cDNAs أو منتجات PCR أو قليلات النوكليوتيدات المركبة كيميائيًا لما يصل إلى 70 مترًا ويمثل جينًا واحدًا.

عادةً ما تحتوي شريحة / شريحة ميكروأري واحدة من الحمض النووي على آلاف البقع التي تمثل كل منها جينًا واحدًا ومجموعًا الجينوم الكامل للكائن الحي. يظهر الرسم التخطيطي لاثنين من أكثر تنسيقات ميكروأري استخدامًا حتى الآن في الشكل 1 و 2.

الشكل 1. مصفوفة ميكروأري للحمض النووي التكميلي للزجاج (cDNA) تم إنتاجها باستخدام روبوت عالي السرعة. يمكن لهذا النوع من المصفوفة الدقيقة للحمض النووي أن يتحمل ما بين 10000 - 20000 بقعة (جينات) على مساحة 3.6 سم 2. تمثل كل بقعة نتاج جين معين ويتم إنشاؤها عن طريق ترسيب عدد قليل من لترات النانو من منتج PCR الذي يمثل ذلك الجين المحدد عادةً بتركيز 100-500 ميكروغرام / مل. يبلغ قطر كل بقعة أيضًا 50-150 ميكرومتر.

الشكل 2. رسم توضيحي ل GeneChip DNA (Affymetrix).

أنواع المصفوفات الدقيقة للحمض النووي

يوجد حاليًا نوعان من المنصات / أنواع المصفوفات الدقيقة للحمض النووي المتوفرة تجاريًا.

1. المصفوفات الدقيقة للحمض النووي الزجاجي التي تتضمن الإكتشاف الدقيق لشظايا (كدنا) مسبقة الصنع على شريحة زجاجية.
2. المصفوفات الدقيقة قليلة النوكليوتيد عالية الكثافة يشار إليها غالبًا باسم "الرقاقة" التي تتضمن فى الموقع تخليق قليل النوكليوتيدات.

ومع ذلك ، من وجهة نظر التصنيع ، هناك اختلافات جوهرية بين النظامين فيما يتعلق بأحجام أجزاء الحمض النووي المطبوعة ، وطرق طباعة بقع الحمض النووي على الشريحة / الرقاقة ، وكذلك صور البيانات التي تم إنشاؤها.

المصفوفات الدقيقة الزجاجية (كدنا)

كانت المصفوفات الدقيقة للحمض النووي الزجاجي هي النوع الأول من تقنية المصفوفات الدقيقة للحمض النووي التي تم تطويرها. ابتكرها باتريك براون وزملاؤه في جامعة ستانفورد ، وتم إنتاجه باستخدام جهاز آلي ، يقوم بترسيب (بقع) نانوليتر من الحمض النووي (قطره 50-150 ميكرومتر) على سطح منزلق زجاجي مطلي بالمجهر بالترتيب التسلسلي باستخدام مسافة تقارب 200-250 ميكرومتر عن بعضها البعض ، جين واحد موضعي. تحمل مصفوفات (كدنا) الزجاجية متوسطة الحجم هذه أيضًا حوالي 10000 بقعة أو أكثر على مساحة 3.6 سم 2.

كما يوحي الاسم ، تستخدم المصفوفات الدقيقة الزجاجية (كدنا) شرائح زجاجية مصنعة خصيصًا لها خصائص فيزيائية كيميائية مرغوبة ، على سبيل المثال مقاومة كيميائية ممتازة ضد المذيبات ، واستقرار ميكانيكي جيد (زيادة نقطة الإجهاد الحراري) وخصائص مضان جوهرية منخفضة. ومع ذلك ، لإنتاج ميكروأري كامل للحمض النووي الزجاجي للجينوم ، يتم اتباع سلسلة من الخطوات المتتالية ، من الناحية المثالية تتطلب كل خطوة نهجًا مناسبًا ودقيقًا. هنا ، لن نناقش بالتفصيل كيفية تنفيذ كل خطوة ، لكننا نحدد هذه الخطوات بإيجاز بالترتيب المتبع.

تتمثل الخطوة الأولى في تصنيع ميكروأري زجاجي (كدنا) في اختيار المادة المراد وضعها على سطح الزجاج المجهر ، على سبيل المثال. الجينات من قواعد البيانات العامة / المستودعات أو المصادر المؤسسية. ويتبع ذلك إعداد وتنقية متواليات الحمض النووي التي تمثل الجين المعني. في عملية التحضير ، يتم استخدام تفاعل البوليميراز المتسلسل لتضخيم الحمض النووي من المكتبة ذات الأهمية باستخدام بادئات عالمية أو بادئات خاصة بالجينات ويتم فحص نقاء شظايا الحمض النووي التي تمثل الجينات ذات الأهمية بشكل عام عن طريق التسلسل أو استخدام هلام الاغاروز للحصول على تقدير متزامن من تركيز الحمض النووي. هذه خطوة مهمة لأن جميع شظايا الحمض النووي يجب أن تكون ذات تركيز / مولارية وحجم متشابهين ، لتحقيق حركيات تفاعل مماثلة لجميع التهجين. تتمثل الخطوة الثالثة في اكتشاف محلول الحمض النووي على شرائح زجاجية معدلة كيميائيًا عادةً باستخدام بولي (L-lysine) أو مواد طلاء كيميائية أخرى متشابكة مثل بولي إيثيلين أمين بوليمر p-aminophenyl trimethoxysilane / كيمياء diazotization وبنية dendrimeric. هذه الركائز المطلية على سطح الشريحة الزجاجية هي التي تحدد كيفية تثبيت محلول الحمض النووي على السطح ، على سبيل المثال. تساهمية أو غير تساهمية. ومع ذلك ، في سياق بولي (L-lysine) ، تشكل مجموعات الفوسفات سالبة الشحنة في جزيء الحمض النووي رابطة أيونية مع سطح مشتق أمين موجب الشحنة. يتم تحقيق خطوة الإكتشاف هذه من خلال طباعة جهات الاتصال باستخدام دبابيس روبوتية يتم التحكم فيها بدقة أو أي تقنية توصيل معادلة أخرى مثل الطباعة بنفث الحبر.

الخطوة الأخيرة لتصنيع المصفوفات الدقيقة للحمض النووي الزجاجي هي خطوة معالجة ما بعد الطباعة التي تتضمن تجفيف الحمض النووي على الشريحة طوال الليل في درجة حرارة الغرفة واستخدام الارتباط المتقاطع للأشعة فوق البنفسجية لمنع الارتباط اللاحق للحمض النووي وتقليل إشارة الخلفية عند تهجين هدف محدد.

الشكل 3. خطوات تصنيع المصفوفات الدقيقة الزجاجية (كدنا).

مزايا المصفوفات الدقيقة (كدنا)

تشمل مزايا المصفوفات الدقيقة الزجاجية (كدنا) قدرتها النسبية على تحمل التكاليف بتكلفة أقل. لا تتطلب إمكانية الوصول إليها أي معدات محددة للاستخدام بحيث لا يحتاج التهجين إلى معدات متخصصة ، ويمكن إجراء التقاط البيانات باستخدام المعدات التي غالبًا ما تكون متاحة بالفعل في المختبر ومرونة التصميم على النحو الذي تقتضيه الأهداف العلمية للتجربة. بالإضافة إلى ذلك ، تتمتع المصفوفات الدقيقة الزجاجية (كدنا) أيضًا بزيادة حساسية الكشف بسبب تسلسل الهدف الأطول (2 كيلو بايت).

مساوئ المصفوفات الدقيقة (كدنا)

على الرغم من استخدامها على نطاق واسع ، فإن ميكروأري الزجاج (كدنا) له بعض العيوب مثل متطلبات العمالة المكثفة لتخليق وتنقية وتخزين حلول الحمض النووي قبل تصنيع ميكروأري. علاوة على ذلك ، يتطلب المزيد من أجهزة الطباعة مما يجعل المصفوفات الدقيقة أكثر تكلفة. أيضًا أثناء تجارب المصفوفة الدقيقة في المختبر ، قد تؤدي التماثلات المتسلسلة بين الحيوانات المستنسخة التي تمثل أعضاء مختلفين وثيق الصلة من نفس عائلة الجينات إلى فشل في الكشف عن الجينات الفردية على وجه التحديد ، وبدلاً من ذلك قد تهجين إلى بقعة (مناطق) مصممة لاكتشاف نسخة من جين مختلف. تُعرف هذه الظاهرة باسم التهجين المتقاطع.

فى الموقعفى الموقع تنسيق مصفوفة قليل النوكليوتيد

فى الموقع (على الرقاقة) تنسيق مصفوفة قليل النوكليوتيد عبارة عن منصة متطورة لتقنية ميكروأري التي يتم تصنيعها باستخدام تقنية فى الموقع التوليف الكيميائي الذي تم تطويره لأول مرة بواسطة ستيفن فودور وآخرون. (1991). ومع ذلك ، فإن الشركة الرائدة في مجال الصناعة فى الموقع كانت المصفوفات الدقيقة قليلة النوكليوتيد (Affymetrix) رائدة في هذا النوع من التكنولوجيا لتصنيع ما يسمى GeneChips الذي يشير إلى مصفوفات الحمض النووي عالية الكثافة القائمة على قليل النوكليوتيد.

تتمثل المبادئ الأساسية لتصنيع GeneChips Affymetrix في استخدام الطباعة الحجرية الضوئية والكيمياء التوافقية لتصنيع خيوط مفردة قصيرة من الحمض النووي على رقائق كوارتز بحجم 5 بوصات مربعة. على عكس الزجاج (كدنا) ، تم تصميم الجينات الموجودة على الرقاقة بناءً على معلومات التسلسل وحدها ، ثم باستخدام مُصنِّع شرائح الصناعة ، يتم تصنيع التسلسلات مباشرة على سطح رقاقة الكوارتز المربعة مقاس 5 بوصات في مواضع محددة مسبقًا.

التوليف التفصيلي التدريجي لـ فى الموقع تخليق قليل النوكليوتيدات (Affymetrix GeneChips) خارج نطاق هذه النظرة العامة ، لكننا سنلخص بإيجاز بعض المفاهيم المتعلقة بعملية التصنيع.

تبدأ عملية تصنيع GeneChips Affymetrix باستخدام عملية الطباعة الحجرية الضوئية للحمض النووي من خلال اشتقاق الدعامة الصلبة ، وعادةً ما يكون الكوارتز مع جزيء رابط تساهمي ينتهي بمجموعة حماية ملفوفة ضوئيًا. يتم تحقيق ذلك أولاً عن طريق غسل الكوارتز لضمان انتظام هيدروكسيل عبر سطحه ثم وضعه في حمام من السيلان ، والذي يتفاعل مع مجموعات الهيدروكسيل في الكوارتز ويشكل مصفوفة من الجزيئات المرتبطة تساهميًا.

ال فى الموقع يحدث تخليق قليل النوكليوتيدات بالتوازي ، مما يؤدي إلى الإضافة المتتالية للنيوكليوتيدات A و C و G و T إلى التسلسلات الجينية المناسبة في الصفيف. At each step in the synthesis process, oligonucleotide chains that for example require adenine in the next position are deprotected by light at the appropriate positions by a mask. The quartz (chip) is then flooded with a solution containing activated adenine nucleotides with a removable protection group, which are coupled to the deprotected positions. Uncoupled adenine residues are washed away and another mask is applied to further carry out the deprotection of the next nucleotide. Finally, repeating the process

70 times, with 70 different masks, allows synthesis of the complete array of thousands of 25-mer oligonucleotides in parallel.

مزايا فى الموقع oligonucleotide array format

Advantages offered by the فى الموقع oligonucleotide array format include speed, specificity and reproducibility. Speed, in terms of generating the array is prime advantage because, spotting the DNA onto the chip requires only that the DNA sequence of interest be known, therefore no time is spent in the handling of cDNA resources such as the preparation and accurate determination of handling bacterial clones, PCR products, or cDNAs, thus reducing the likelihood of contamination and mix up. However, before manufacturing the array, prior knowledge of the genome sequence is required to design the oligonucleotide sets, and when this is not available, alternative methods of printing isolated genetic material may be preferred.

Other advantages of the فى الموقع oligonucleotide array format include high specificity and reproducibility. Both of these attributes are due to the way oligonucleotide sequences to be printed on the chip are designed and the use of multiple, short sequence(s) representing the unique sequence of genes. For example, when designing oligonucleotide sequences for a gene, each sequence is designed to be perfectly complementary to a target gene sequence, at the same time an additional partner sequence is designed that is identical except for a single base mismatch in its centre. This sequence mismatch strategy, along with the use of multiple sequence(s) for each gene increases specificity and helps to identify and minimise the effects of non-specific hybridisation and background signal. This strategy also allows the direct subtraction of cross-hybridisation signals and discrimination between real and non-specific signals.

Disadvantages of فى الموقع oligonucleotide array format

There are several disadvantages to the فى الموقع oligonucleotide array format including practical limitations in terms of affordability and flexibility. أولا، فى الموقع oligonucleotide array formats tend to have expensive specialised equipments e.g. to carry out the hybridisation, staining of label, washing, and quantitation process. Secondly, ready made in situ oligonucleotide array format (GeneChips) are still expensive, although there has been reductions in cost as the market of microarrays has expanded. Thirdly, although short-sequences used on the array confer high specificity, they may have decreased sensitivity/binding compared with glass cDNA microarrays. Such low sensitivity however is compensated for by using multiple probes.

فى الموقع oligonucleotide array format also offers reduced flexibility although this is not the case with respect to the array design. However, there are occasions when the production of the array, hybridisation and detection equipment are restricted to centralised manufacturer facilities, thus limiting the researcher's flexibility. Similarly, the cost and time needed to manufacture the فى الموقع oligonucleotide array format makes it uneconomical for an average laboratory to synthesise its own chips.

Principles of DNA Microarray experiments

The principle of DNA microarray technology is based on the fact that complementary sequences of DNA can be used to hybridise immobilised DNA molecules. This involves three major multi-stage steps

1- Manufacturing of microarrays: This step involves the availability of a chip or a glass slide with its special surface chemistry, the robotics used for producing microarrays by spotting the DNA (targets) onto the chip or for their فى الموقع synthesis.
2- Sample preparation and array hybridisation step: This step involves mRNA or DNA isolation followed by fluorescent labelling of cDNA probes and hybridisation of the sample to the immobilised target DNA.
3- Image acquisition and data analysis: Finally, this step involves microarray scanning, and image analysis using sophisticated software programs that allows us to quantify and interpret the data.

However, here, we will concentrate on how microarray experiments are performed in the laboratory, rather than the technological developments involving array construction or manufacturing using precision robotic devices.

Typically, a microarray experiment involves the comparison of a query or experimental sample representing the expression pattern of genes in a specific set of conditions, with a control sample representing all the genes that are expressed in the cells/tissue to be analysed.

An example of this is comparisons made between expression profiles of bacteria within infected cells (query) and the same bacteria cultured under standardised في المختبر conditions of growth (control). Or similarly a comparison made between an isogenic mutant and the wildtype strain.

There are four major steps in performing a typical microarray experiment.

1. Sample preparation and labelling
2. Hybridisation
3. Washing
4. Image acquisition and Data analysis

Sample preparation and labelling

There are a number of different ways in which a DNA microarray sample is prepared and labelled. All of these different approaches however have their own advantages and disadvantages with respect to many factors such as the starting amount of RNA or DNA required, through to cost, time and data acquisition and transformation. However the choice of which one to use depends on these factors as well as the type of microarray technology used, for example the slide type and the detection equipment. Here, we used the term "sample" to refer to the free, fluorescently labelled cDNA, not to confuse with the immobilised DNA known as reporter element (s)

Initially, the sample preparation starts by isolating a total RNA containing messenger RNA that ideally represents a quantitative copy of genes expressed at the time of sample collection (experimental sample & reference sample). This step is crucial, simply because the overall success of any microarray experiment depends on the quality of the RNA.

For example purity in the sense of homogeneity or uniformity of the mRNA is a critical factor in the downstream hybridisation performance, particularly when fluorescence is used, as cellular proteins, lipids, and carbohydrates can mediate significant nonspecific binding of labeled cDNAs to matrix surfaces. The sample mRNA extracted from the biological sample of interest and the reference are then separately converted into complementary DNA (cDNA) using a reverse-transcriptase enzyme. This step also requires a short primer to initiate cDNA synthesis. Next, each cDNA (Sample and Control) are labelled with a different tracking molecule, often fluorescent cyanine dyes (i.e. Cy3 and Cy5)

Hybridisation is the process of joining two complementary strands of DNA to form a double-stranded molecule. Here, the labelled cDNA (Sample and Control) are mixed together, and then purified to remove contaminants such as primers, unincorporated nucleotides, cellular proteins, lipids, and carbohydrates. Purification is usually carried out using filter spin columns such as Qiaquick from Qiagen. After purification, the mixed labelled cDNA is competitively hybridised against denatured PCR product or cDNA molecules spotted on a glass slide. Ideally, each molecule in the labelled cDNA will only bind to its appropriate complementary target sequence on the immobilised array.

Before hybridisation however, the microarray slides are incubated at high temperature with solutions of saline-sodium buffer (SSC), Sodium Dodecyl Sulfate (SDS) and bovine serum albumin (BSA) to reduce background due to nonspecific binding.

The slides are washed after hybridisation, first to remove any labelled cDNA that did not hybridise on the array, and secondly to increase stringency of the experiment to reduce cross hybridisation. The later is achieved by either increasing the temperature or lowering the ionic strength of the buffers.

Image acquisition and data analysis is the final step of microarray experiments. The aim is to produce an image of the surface of the hybridised array. Here the slide is dried and placed into a laser scanner to determine how much labelled cDNA (probe) is bound to each target spot. Laser excitation of the incorporated targets yield an emission with characteristic spectra, which is measured using a confocal laser microscope. Classically, microarray software often uses green spots on the microarray to represent genes upregulated compared to control, red to represent those genes that are downregulated in the experimental sample, and yellow to represent those genes of equal abundance in both experimental and control samples.

Figure 4. Microarray experimental principles.

Applications of DNA Microarray Technology

The range of applications for microarray technology is enormous. However, although in depth details of each one is beyond the scope of this overview, there are two distinctive applications of microarrays that are in wide spread use.

1. Gene expression profiling to measure the expression of genes between different cell populations.
2. Comparative genomics to analyse genomic alterations such as sequence and single nucleotide polymorphisms.

Microarray as a gene expression profiling tool

The principle aim of using microarray technology as a gene expression profiling tool is to answer some of the fundamental questions in biology such as "when, where, and to what magnitude genes of interest are expressed.'' Clearly, if a gene is not expressed in a defined time/condition at a defined cell compartment, then it is possible to imagine it can play no role in that subnetwork. This approach is based on the assumption that cellular genes are expressed in response to a particular state and that the expression profile represents the subset of gene transcripts or mRNA expressed in a cell or tissue. In addition to that, expression profiling by microarray analysis provides another approach to measure changes in the multigene patterns of expression to better understand about regulatory mechanisms and broader bioactivity functions of genes.

It is therefore appreciable that the knowledge obtained from microarray gene expression analysis will probably increase our basic understanding of the cause and consequences of diseases (pathogenesis), how drugs and drug candidates work in cells and organisms, and what gene products might have therapeutic uses or may be studied further as an appropriate targets for therapeutic intervention.

For example, in the context of microbiology, microarray gene expression is used to analyse complex cellular behaviour and to explore the complex interaction between host and microbial pathogens. This ambitious and plausible attempt to understand such molecular interaction is achieved by directly comparing gene expression profiles of host cell to the expression profile of the pathogen. Also an خارج الجسم الحي measurement of gene expression for host cells before and after they are infected with a microbial pathogen can greatly increase our understanding of such complex molecular interplay. Furthermore by following the pattern of gene expression at different times, it is possible to elucidate which host or pathogen genes are up or downregulated over the course of infection to further identify critical target genes and drug-specific targets in both host and microbial pathogens.

Microarray as a comparative genomics tool

Another important application of microarray technology, which is also finding a widespread use is gene mutation analysis to analyse genomic alterations such as sequence and single nucleotide polymorphisms. Currently, in the context of microbiology microarray gene mutation analysis is directed to characterisation of genetic differences among microbial isolates, particularly closely related species. For example detecting the presence or absence of DNA sequences/gene(s) between pathogenic and non-pathogenic strains of the same species. Such informative approach would allow us to reveal genes exclusively present in the former that may be required for infectivity, virulence or adaptation to a particular host niche

Similarly, DNA microarray technology can be used to compare between a fully sequenced genome and an unsequenced but related genome of closely related bacteria. Interestingly, such approach can provide us a valuable information about the diversity and evolution of pathogens and symbionts. Comparisons of this kind use a microarray containing representations of all the open reading frames (ORFs) of the sequenced, reference strain and labelled DNA from the unsequenced, experimental strain. The resulting hybridised array will then reveal genes common to both strains and genes that are present in the reference strain but absent in the experimental strain. This method, however, may not detect genes present in the experimental strain, but missing in the reference strain, although the use of multi-genome (species array) may detect genes present in the experimental strain. This method may not also detect point mutations, including frame-shift mutations, small deletions and deletions in homologous repetitive elements, rearrangements of the genome that have not resulted in deletion of a gene from the experimental strain. However the use of affymetrix gene chip can identify these mutations.

An elegant and well known example of using microarray as a comparative genomics tool is the comparison made by Behr et al., 1999 between several المتفطرة البقريّة vaccine strains e.g. the genome composition of the sequenced M. tuberculosis laboratory strain H37Rv with the closely related pathogenic species, M. bovis, and with several strains of the bacille Calmette-Guerin (BCG) vaccine variant that was produced by serial في المختبر passage of M. bovis between 1908 and 1921.

This particular study, has revealed several chromosomal deletions in the different vaccine strains in comparison to their progenitor, these deletions are possibly thought to be responsible for the variable effectiveness of the BCG vaccine seen worldwide.


Best Microarray Data Analysis Software

High quality image processing and appropriate data analysis are important steps of a microarray experiment. This BiologyWise article outlines some of the best microarray data analysis software available to extract statistically and biologically significant information from microarray experiments.

High quality image processing and appropriate data analysis are important steps of a microarray experiment. This BiologyWise article outlines some of the best microarray data analysis software available to extract statistically and biologically significant information from microarray experiments.

هل كنت تعلم؟
A single microarray generates about 10 5 – 10 6 fragments of data.

هل تود الكتابة لنا؟ حسنًا ، نحن نبحث عن كتاب جيدين يريدون نشر الكلمة. تواصل معنا وسنتحدث.

Microarray experiments followed by accurate analysis of the enormous amount of data generated have developed to be a rich source of information with respect to several aspects of biology, including gene function, gene expression, pathway analysis, genomic comparisons, etc.

Given below are some of the best and most used comprehensive software that enable preprocessing, normalization, filtering, clustering, and finally, the biological interpretation and analysis of microarray data. In addition, specific software that provide tools for a particular type of analysis have also been described.

نوع: Free and open source
Maintained by: Fred Hutchinson Cancer Research Center
Operating System: Windows, Linux, Mac OS X
Functionality: شامل

This open development project was initiated in 2001, and is based on the R programming language. It comprises R packages that provide statistical, graphical, and other computational tools for DNA microarray image processing and data analysis, sequence analysis, as well as SNP (Single Nucleotide Polymorphism) data analysis. Specific packages are available that cater to several commercial microarray platforms like Affymetrix.

نوع: Free and open source
Maintained by: Institute for Genomic Research and other contributors
Operating System: Windows, Linux, Mac OS X
Functionality: شامل

The TM4 Microarray Software Suite provides the following applications that have been developed in Java and C/C++.

  1. MADAM (Microarray Data Manager) is developed to manage and store microarray data as well as the associated information, like experimental design, parameters, protocols, etc. This data is stored in a MySQL database in accordance with the MIAME (Minimal Information About a Microarray Experiment) standards.
  2. MIDAS (Microarray Data Analysis System) is developed for normalizing and filtering the data obtained. The resultant output is stored in .tav format in the MADAM associated database.
  3. Spotfinder is designed for rapid image processing and quantification of signals at each spot to quantify gene expression.
  4. MeV (MultiExperiment Viewer) enables the analysis of the normalized and filtered microarray data. It provides tools for clustering and classification, graphical visualization, statistical analysis, as well as annotation.
  5. AMP (Automated Microarray Pipeline) is a web-based application where microarray data in the form of Affymetrix CEL files can be submitted for further analysis. The workflow or pipeline can be specified for normalization and statistical analysis followed by gene classification and annotation. AMP is comparatively user-friendly, and the results are displayed in a web-based format which can be easily stored and used for further analysis.

هل تود الكتابة لنا؟ حسنًا ، نحن نبحث عن كتاب جيدين يريدون نشر الكلمة. تواصل معنا وسنتحدث.

نوع: Free and open source, as well as in the form of a public web server
Maintained by: Broad Institute
Operating System: Windows, Linux, Ubuntu, SuSE, CentOS, Mac OS 10.7 and later
Functionality: Comprehensive

Developed using the R programing language, this is a highly user-friendly system and comprises several analysis modules that can be easily arranged and interconnected to form a customized pipeline. Microarray data can be normalized, preprocessed, and analyzed for gene expression patterns, predicting the class of desired genes, clustering and discovering the gene class, as well as pathway analysis.

نوع: Free and open source
Maintained by: GenMAPP.org
Operating System: شبابيك
Functionality: محدد

Developed using Visual Basic 6.0, GenMAPP or the Gene Map Annotator and Pathway Profiler is specifically designed for the analysis of genomic microarray data for understanding and identifying biological pathways, like anabolic and catabolic pathways as well as signaling pathways.

It contains gene databases for selected model organisms, including بكتريا قولونية, humans, mouse, zebrafish, etc. The gene expression data obtained from custom as well as commercial microarrays can be analyzed, and the desired genes can be visualized in the form of a pathway by using a color-coded format as per the criteria indicated by the user. It provides tools to construct and modify pathways using earlier information about gene annotations.

نوع: تجاري
Provided by: BioDiscovery
Operating System: Windows, Mac, and Linux
Functionality: شامل

This is a Java-based commercial software for analyzing data from almost any platform and type of microarray. It even provides ready-to-use templates for standard microarray platforms, like Agilent 244K, 4x44K, 44K arrays, etc.

Analyzing microarray data depends on the type of microarray as well as the design of the study. In addition to convenience, the choice of microarray data analysis software and the statistical analysis tools should be made after careful consideration of the experimental conditions and precise objective.

المنشورات ذات الصلة

The two gene therapy types are germ line gene therapy and somatic gene therapy. While the germ line type is aimed at permanent manipulation of genes in the germ cells,&hellip

Gene therapy is the recent development in the field of medicine, with the potential of being useful in the treatment of some serious diseases like cancer. The therapy basically tries&hellip

Severe combined immunodeficiency (SCID) is a life-threatening disease, also known as the 'Boy in the Bubble' syndrome. Here's more. Lymphocytes are white blood cells present in the immune system of&hellip


الاستنتاجات

We have demonstrated that support vector machines can accurately classify genes into some functional categories based on expression data from DNA microarray hybridization experiments and have made predictions aimed at identifying the functions of unannotated yeast genes. Among the techniques examined, SVMs that use a higher-dimensional kernel function provide the best performance—better than Parzen windows, Fisher's linear discriminant, two decision tree classifiers, and SVMs that use the simple dot product kernel. These results were generated in a supervised fashion, as opposed to the unsupervised clustering algorithms that have been previously considered (1, 3). The supervised learning framework allows a researcher to start with a set of interesting genes and ask two questions: What other genes are coexpressed with my set? And does my set contain genes that do not belong? This ability to focus on the key genes is fundamental to extracting the biological meaning from genome-wide expression data.

It is not clear how many other functional gene classes can be recognized from mRNA expression data by this (or any other) method. We caution that several of the classes were selected based on evidence that they clustered using the mRNA expression vectors defined by the 79 experiments available (1). Other functional classes may require different mRNA expression experiments, or may not be recognizable at all from mRNA expression data alone. However, SVMs are capable of using other data, such as the presence of transcription factor binding sites in the promoter region or sequence features of the protein (16). We have begun working with SVMs that classify using training vectors concatenated from multiple sources (16, 33). We believe these approaches have significant potential.


شاهد الفيديو: اللائحة الجينية والنظام من الأوبرا (شهر نوفمبر 2022).