معلومة

قياس التعبير الجيني

قياس التعبير الجيني


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لقد وجدت أن العديد من الدراسات تستخدم تركيز الرنا المرسال "كبديل" لنشاط البروتين لأنه يجب أن يكون هناك ارتباط بين مستويات الرنا المرسال ومستويات التعبير عن البروتينات. كيف يتم قياس نشاط البروتين؟ ما هي الكمية المستخدمة؟ ما هي مستويات التعبير عن البروتين؟

أقوم ببعض تحليل البيانات الإحصائية باستخدام مجموعة البيانات هذه. أود أن أفهم سبب اهتمامهم بقياس تركيز الرنا المرسال بعد تشعيع الخلايا بأشعة جاما (وبوجه عام يبدو لي أن علماء الأحياء في العديد من التجارب مهتمون بذلك). لقد وجدت في هذا الموقع أن النقاش حول الارتباط بين تركيز الرنا المرسال (وبالتالي مستوى التعبير الجيني) و "مستوى التعبير البروتيني". لذلك أردت أن أعرف ما هو هذا الأخير. علاوة على ذلك ، في المقالة المتعلقة بمجموعة البيانات الخاصة بي مكتوب

أظهر عدد قليل جدًا من جينات إصلاح الحمض النووي تعبيرًا تفاضليًا كبيرًا في P. furiosus بعد تشعيع جاما.

وثم

البيانات التي أبلغنا عنها هنا تشير إلى ذلك بروتينات إصلاح الحمض النووي في P. furiosus والعديد من العتائق الأخرى يتم التعبير عنها بشكل أساسي وأنها قد تكون موجودة في الخلية عند مستوى كافٍ للحفاظ على سلامة المادة الوراثية للخلية.

لذا ، بتجميع ما استنتجه العلماء بما أجابني عليه MattDMo وما تمت مناقشته هنا ، أعتقد أنه يمكنني استنتاج أن "مستوى تعبير البروتين" هو مقياس لكمية البروتين المترجمة فعليًا من mRNA ، ثم (في هذه الحالة) ستعمل بشكل فعال لإصلاح الحمض النووي. لذلك ، يشير "مستوى التعبير البروتيني" ، وكذلك "نشاط البروتين" ، إلى البروتينات المترجمة من mRNA والتي ستعمل بنشاط لإصلاح تلف الحمض النووي (في هذه الحالة نتحدث عن بروتينات إصلاح الحمض النووي وجينات إصلاح الحمض النووي).

يجب أن أقول إنني لا أعرف جيدًا ما تعنيه عبارة "يتم التعبير عن بروتينات إصلاح الحمض النووي بشكل أساسي" ، لكنني أعتقد أن بروتينات إصلاح الحمض النووي قد تمت ترجمتها بالفعل من mRNA وبالتالي فهي "موجودة في الخلية على مستوى كافية للحفاظ على سلامة المادة الوراثية للخلية "(كما يقولون بعد ذلك بفترة وجيزة).

كل هذا يبدو منطقيًا بالنسبة لي إذا فكرت في هدفي الأول وهو فهم سبب قياس تركيز الرنا المرسال. نحن مهتمون به لأنه يجب أن يكون هناك ارتباط بين تركيز mRNA (مستوى التعبير الجيني) والبروتينات المترجمة فعليًا من mRNA من هذا الجين المحدد ، من أجل معرفة أي نوع من البروتينات سيعمل بشكل فعال في عمليات إصلاح الحمض النووي (في هذه الحالة ).

أتساءل ما إذا كان كل هذا التفسير صحيحًا ...


ما هو مستوى التعبير عن البروتين؟

كان هذا هو العنوان الأصلي للمنشور ، الذي قمت بتحريره بنفسي لأنني أعتبر الإجابة تافهة ، لكن السؤال أكثر جوهرية. للتعامل مع التافه أولاً:

"المستوى" ليس وحدة علمية ، ولا يمكن استخدامه إلا بشكل لا لبس فيه كمصطلح علمي بمعناه الإنجليزي فيما يتعلق بالسوائل ، على سبيل المثال. "انخفض مستوى الزئبق في مقياس الحرارة." ، "الأرض 10 أمتار فوق مستوى سطح البحر."

يتم استخدامه من قبل بعض الأشخاص في خطاب أو كتابة غير رسمية للإشارة إلى كمية غير محددة ، وبسبب غموضها الشديد يجب تثبيطها بشدة في التواصل العلمي.

لذلك لا يمكنني ولا أي شخص آخر تحديد ما هو "مستوى التعبير البروتيني" دون معرفة ما يقصده منشئ العبارة (إذا كان يعرف بالفعل) في أي حالة فردية: كمية البروتين أو تركيزه ، أو معدل تركيبه.

الكميات

دعونا نفكر في البعض الجوانب العامة للجزيء الخلوي التي قد تتطلب القياس الكمي: مقدار ، ومعدل التوليف ، ومعدل التحلل ، وعند الاقتضاء ، النشاط البيولوجي.

الكميات من الجزيئات في أبسط صورها هو عدد الأنواع ، أو عمليًا ، كتلتها الإجمالية (جرام) ، حيثما أمكن ذلك تتعلق بكتلتها الجزيئية (أي الشامات). يتم التعبير عن معدل تركيبها أو تدهورها من حيث تغيير مقدارها في وحدة الوقت.

من أجل مقارنة الأنظمة المختلفة مرجع مطلوب للقياس الكمي. قد يكون هذا لكل وحدة حجم ، لكل خلية ، لكل جرام بروتين خلوي ، لكل جرام DNA إلخ. (ومع ذلك ، للمقارنة بين أنظمة مماثلة أو داخل نظام واحد ، غالبًا ما يتم حذف المرجع.)

النشاط البيولوجي من الجزيئات لها معنى فقط إذا كانت الجزيئات نشطة بيولوجيًا بالفعل (مثل الإنزيمات). يتم التعبير عنها بالوحدات المتعلقة بهذا النشاط.

أمثلة على الكميات للبروتينات

يتم تحديد الوحدات الفعلية المستخدمة في القياس الكمي من خلال مدى قدرة المرء على قياس معلمة الفائدة.

المبلغ النسبي من البروتين: قد تكتشف بروتينًا عن طريق كثافة تلطيخ الشريط على مادة هلامية ، أو عن طريق مدى الترسيب باستخدام الجسم المضاد المقابل. يجب معايرتها وفقًا للمعايير من أجل تحويل القياسات التجريبية الخام إلى بروتين g أو مول. الوحدات النموذجية للكمية النسبية هي g / g البروتين الكلي ، g / g DNA.

معدل التوليف أو التدهور من البروتين. قد تكتشف تخليق البروتين من خلال معدل دمج الأحماض الأمينية المشعة في البروتين غير المشع ، ومعدل التحلل عن طريق تحرير الأحماض الأمينية المشعة من البروتين المحدد مسبقًا. ستكون الوحدات النموذجية للتوليف عبارة عن مجم من الأحماض الأمينية المدمجة في الدقيقة لكل مجم من البروتين الكلي. (يمكن تحويل هذا إلى جزيئات مركبة أو متحللة في الدقيقة ، إذا لزم الأمر).

"نشاط البروتين": استخدام هذا المصطلح ليس موصى به. من الناحية الكيميائية ، يعتبر نشاط الجزيء مقياسًا لـ "تركيزه الفعال" ، وفيما يتعلق بالبروتينات ، فإن ذلك سيكون مصدر قلق علماء الفيزياء الحيوية وما شابه ذلك. قد يربط علماء أحياء آخرون المصطلح بالنشاط البيولوجي الذي قد يمتلكه بروتين مثل الإنزيم ، ولكن نظرًا لأن العديد من البروتينات هيكلية ، لا يمكن تطبيق مصطلح "النشاط" على البروتينات بشكل عام. وحيثما يكون ذا فائدة ، فسيتم قياسه كمياً من حيث طبيعة النشاط ، على سبيل المثال. يتم تحديد كمية الإنزيم في الوحدات المتعلقة بكمية الركيزة المحولة إلى منتج في وقت معين.

التقدير الكمي للتعبير الجيني باستخدام المصفوفات الدقيقة قليلة النوكليوتيد

النقيضان في قياس التعبير الجيني هما الدراسة التفصيلية للتعبير عن جين واحد معين ترميز بروتين تتوافر عنه المعلومات والأدوات ؛ والدراسة العامة للتعبير عن العديد من الجينات باستخدام الأساليب الحديثة التي تسمح بدراسة العديد من الجزيئات في وقت واحد. تضمنت هذه الطرق قياس الطيف الكتلي (للمستقلبات الصغيرة) ، والرحلان الكهربائي للهلام ثنائي الأبعاد (للبروتينات) والمصفوفات الدقيقة أو RNAseq (لـ mRNA). بشكل عام في الحالة الأخيرة يمكن للمرء أن يفحص تأثير عامل أو شرط ما على كامل طيف التعبير الجيني.

دعونا نفحص تقنية ميكروأري لأن هذا هو الشغل الشاغل للناشر.

تقيس تقنية Microarray الكميات النسبية من mRNA.

تتضمن المنهجية تضخيم أنواع خليط الرنا المرسال عن طريق النسخ العكسي إلى cDNAs ، والتي يتم وضع العلامات عليها باستخدام صبغة الفلورسنت. يتم تهجين (كدنا) إلى قليل النوكليوتيدات المعطلة بناءً على تسلسل الجينات في الكائن الحي ، ويُفترض أن تكون قوة إشارة التألق متناسبة مع كمية أنواع الرنا المرسال الفردية في العينة. ومع ذلك ، فإن البيانات المقدمة للمستخدم هي كثافة الصورة النسبية داخل التجربة ، بدلاً من الوحدات التي تسمح للشخص بحساب الكمية الفعلية من mRNA.

كيف ترتبط هذه الكميات النسبية من الرنا المرسال بالتعبير الجيني؟

  1. تعتبر الكميات النسبية من mRNA مقياسًا نسبيًا لـ معدل تخليق البروتينات (3 في الحفر) ، إذا افترض المرء أن معدل تخليق كل بروتين يتناسب بشكل مماثل مع كمية mRNA الخاصة به (a in dig.) والتي ستكون محدودة. هذا افتراض معقول في معظم الحالات نظرًا لأن mRNA يتحلل بسرعة أكبر من البروتين. (إنها ليست مقياسًا لكمية البروتين - ب في الحفر.)

  2. لا يمكن أخذ الكميات النسبية من الرنا المرسال كمقياس لمعدل نسخ الرنا المرسال من جينه (1 في الحفر) بسبب التأثير الأكبر نسبيًا لتحلل الرنا المرسال (2 في الحفر.) على تركيز الحالة المستقرة من الرنا المرسال ، وحقيقة أن mRNAs المختلفة لها فترات نصف عمر مختلفة.

بوستسكريبت للملصق

لقد حاولت أن أجعل هذه الإجابة عامة ، لتكون مفيدة لعدد أكبر من الناس. نظرًا لأن الملصق ليس عالمة أحياء ، فقد لا تزال تواجه صعوبة في فهم خلفية التجارب البيولوجية التي أنتجت البيانات التي تقوم بتحليلها.

النظام البيولوجي المهم هو التعبير الجيني ، والذي يشمل سلسلة كاملة من الأحداث من نسخ الجينات إلى mRNA وترجمتها إلى بروتين. خلفية ذلك هو أن هناك بعض الجينات التي يتم التعبير عنها (تقريبًا) دائمًا ، بغض النظر عن الظروف الفسيولوجية لأنها ضرورية للحفاظ على الهيكل والوظائف اليومية للخلية. هذا يسمى التأسيسي التعبير ، الأمثلة هي التعبير عن الجينات للأكتينات الهيكلية الخلوية أو البروتينات الريبوسومية. يتم التعبير عن الجينات الأخرى ("قيد التشغيل") فقط عند الحاجة (ويمكن تسميتها محرض). يبدو أن السؤال هنا هو ما إذا كانت جينات الإنزيمات المشاركة في إصلاح الحمض النووي يتم التعبير عنها طوال الوقت (بشكل أساسي) للتعامل مع `` التآكل والتمزق '' الطبيعي للحمض النووي ، أو ما إذا كان تعبيرها يحدث فقط استجابة لبعض الإهانات المعروفة تلف الحمض النووي ، مثل تشعيع جاما.

كما ذكرت ، بصفتي عالمًا تجريبيًا ، فإن أحد الأساليب التي يمكن تبنيها هنا هو النظر إلى تعبير واحد أو اثنين من البروتينات المميزة جيدًا والمعروفة بالمشاركة في إصلاح الحمض النووي. ومع ذلك ، قد تكون هناك بروتينات متورطة في هذه العملية لا تكون على دراية بها ، لذا فإن الأساليب الحديثة للنظر في التعبير عن جميع الجينات في الكائن الحي (إذا كان تسلسل الحمض النووي معروفًا) - المصفوفات الدقيقة قليلة النوكليوتيد أو ، الأفضل ، RNASeq. تقيس هذه الطرق الكميات النسبية من الرنا المرسال في الخلية. هذا هو ليس أ الوكيل بالنسبة لكمية البروتين أو معدل تركيبه (مصطلح "نشاط البروتين" لا معنى له ولا يجب استخدامه ولا ينبغي استخدامه) ، هو كما هو، ولكنه أيضًا ملف انعكاس التابع التعبير عن الجينات التي تشفر mRNAs. لا يوجد تعبير ، لا مرنا.

يمكنك التفكير في نهج ميكروأري و RNASeq على أنهما رحلات صيد. إذا وجدت mRNAs موجودة فقط بعد تلقي الخلية منبهًا أو إهانة ، فقد حدث تعبير عن mRNA (سواء كانت الكميات تتناسب طرديًا مع معدل التوليف أم لا). إذا تم تصنيع الرنا المرسال ، يمكنك افتراض أنه تمت ترجمته إلى البروتين الذي يشفره. في حالة تشعيع جاما ، قد تفترض أن أي مرنا يُظهر زيادة كبيرة في الكمية يشفر بروتينًا يشارك في حماية الخلية من الإشعاع. سيكون هذا ذا أهمية علمية ، خاصة إذا لم يكن هذا ما توقعه المرء.


يعمل تجميع النسخ على تحسين تقدير التعبير الكمي للعناصر القابلة للنقل في بيانات تسلسل الحمض النووي الريبي أحادية الخلية

العناصر القابلة للتحويل (TEs) هي جزء لا يتجزأ من نسخة المضيف. تُظهر الحمض النووي الريبي غير المشفر (ncRNAs) المحتوية على TE خصوصية كبيرة في الأنسجة وتلعب أدوارًا مهمة أثناء التطور ، بما في ذلك صيانة الخلايا الجذعية وتمايز الخلايا. أحدثت التطورات الحديثة في تسلسل الحمض النووي الريبي أحادية الخلية (scRNA-seq) ثورة في تحليل التعبير الجيني الخاص بنوع الخلية. ومع ذلك ، فإن أدوات القياس الكمي الفعالة لـ scRNA-seq المصممة خصيصًا لـ TEs غير متوفرة ، مما يحد من قدرتنا على تشريح ديناميكيات التعبير TE بدقة خلية واحدة. لمعالجة هذه المشكلة ، أنشأنا خط أنابيب لقياس تعبيرات TE المتوافق مع بيانات scRNA-seq التي تم إنشاؤها عبر منصات تقنية متعددة. قمنا ببناء مراجع ncRNA المحتوية على TE باستخدام بيانات RNA-seq السائبة وأظهرنا أن قياس تعبير TE على مستوى النص يقلل بشكل فعال من الضوضاء. كدليل على المبدأ ، طبقنا هذه الإستراتيجية على الخلايا الجذعية الجنينية للماوس وتمكننا من التقاط ملف تعريف التعبير للفيروسات القهقرية الذاتية في الخلايا المفردة. قمنا كذلك بتوسيع تحليلنا ليشمل بيانات scRNA-seq من المراحل المبكرة من التطور الجنيني للفأر. أوضحت نتائجنا تعبير TE الديناميكي في مراحل ما قبل الزرع وكشفت عن 146 نسخة من ncRNA تحتوي على TE مع خصوصية نسيجية كبيرة أثناء المعدة وتكوين الأعضاء في وقت مبكر.


قياس التعبير الجيني - علم الأحياء

يتم توفير جميع المقالات المنشورة بواسطة MDPI على الفور في جميع أنحاء العالم بموجب ترخيص وصول مفتوح. لا يلزم الحصول على إذن خاص لإعادة استخدام كل أو جزء من المقالة المنشورة بواسطة MDPI ، بما في ذلك الأشكال والجداول. بالنسبة للمقالات المنشورة بموجب ترخيص Creative Common CC BY ذي الوصول المفتوح ، يمكن إعادة استخدام أي جزء من المقالة دون إذن بشرط الاستشهاد بالمقال الأصلي بوضوح.

تمثل الأوراق الرئيسية أكثر الأبحاث تقدمًا مع إمكانات كبيرة للتأثير الكبير في هذا المجال. يتم تقديم الأوراق الرئيسية بناءً على دعوة فردية أو توصية من قبل المحررين العلميين وتخضع لمراجعة الأقران قبل النشر.

يمكن أن تكون ورقة الميزات إما مقالة بحثية أصلية ، أو دراسة بحثية جديدة جوهرية غالبًا ما تتضمن العديد من التقنيات أو المناهج ، أو ورقة مراجعة شاملة مع تحديثات موجزة ودقيقة عن آخر التقدم في المجال الذي يراجع بشكل منهجي التطورات الأكثر إثارة في العلم. المؤلفات. يوفر هذا النوع من الأوراق نظرة عامة على الاتجاهات المستقبلية للبحث أو التطبيقات الممكنة.

تستند مقالات اختيار المحرر على توصيات المحررين العلميين لمجلات MDPI من جميع أنحاء العالم. يختار المحررون عددًا صغيرًا من المقالات المنشورة مؤخرًا في المجلة ويعتقدون أنها ستكون مثيرة للاهتمام بشكل خاص للمؤلفين أو مهمة في هذا المجال. الهدف هو تقديم لمحة سريعة عن بعض الأعمال الأكثر إثارة المنشورة في مجالات البحث المختلفة بالمجلة.


ملفات وروابط أخرى

  • APA
  • اساسي
  • هارفارد
  • فانكوفر
  • مؤلف
  • BIBTEX
  • RIS

مخرجات البحث: المساهمة في المجلة ›المقال› مراجعة الأقران

T1 - قياس التعبير الجيني

T2 - أهمية أن تكون دقيقًا

الاتحاد الافريقي - سيلفا ، غوستافو مونتيرو

N1 - حقوق النشر للناشر: © 2016 المؤلفون. منشور بموجب شروط ترخيص CC BY 4.0

N2 - يتم تنظيم التعبير الجيني على مستوى كل من الرنا المرسال والبروتين من خلال مفاتيح التشغيل والإيقاف والتحكم الدقيق. في دراستهم الأخيرة ، استخدم Edfors et al (2016) طرقًا بروتينية دقيقة للغاية وموجهة ويفحصون إلى أي مدى تختلف كمية البروتين المنتجة لكل نسخة mRNA عبر الأنسجة المختلفة. وجدوا أن الجزء الأكبر من تركيزات البروتين يتم تحديده على مستوى كل جين: هذه العلاقة ، نسبة البروتين / الرنا المرسال ، ثابتة عبر أنواع الخلايا والأنسجة ، ولكنها تختلف بعدة أوامر من حيث الحجم عبر الجينات.

AB - يتم تنظيم التعبير الجيني على مستوى كل من الرنا المرسال والبروتين من خلال مفاتيح التشغيل والإيقاف والتحكم الدقيق. في دراستهم الأخيرة ، استخدم Edfors et al (2016) طرق بروتينية دقيقة للغاية وموجهة وفحص مدى اختلاف كمية البروتين المنتجة لكل نسخة mRNA عبر الأنسجة المختلفة. وجدوا أن الجزء الأكبر من تركيزات البروتين يتم تحديده على مستوى كل جين: هذه العلاقة ، نسبة البروتين / الرنا المرسال ، ثابتة عبر أنواع الخلايا والأنسجة ، ولكنها تختلف بعدة أوامر من حيث الحجم عبر الجينات.


يمكن أن تؤدي ضوضاء التعبير الجيني إلى تمايز الخلايا الجذعية

أثناء تطور الخلية ، غالبًا ما يتم التعبير عن الجينات الأساسية ، مثل عوامل النسخ ، بشكل ضعيف في تمايز الخلايا ويمكن أن تظهر تقلبات عالية. يشار إلى هذا باسم "الضوضاء البيولوجية". يُنظَر إلى أن ضوضاء التعبير الجيني هي عامل حاسم لمصير الخلية ، ولكن يصعب اكتشاف الاختلافات في التعبير عن هذه الجينات في البيانات.

الآن ، ابتكر دومينيك غرون ، الباحث من مجموعة ماكس بلانك البحثية في جامعة فرايبورغ (ألمانيا) ، طريقة لقياس ضوضاء التعبير الجيني عبر مجموعات من حالات الخلايا المتشابهة جدًا أو ذات الصلة. وهو يأمل أن يوفر هذا نظرة ثاقبة أكبر لمدى الضجيج الذي ينظم نمو الخلية.

تركز طرق التحليل المتاحة حاليًا بشكل حصري تقريبًا على قياس مستويات التعبير الجيني وتفسيرها داخل خلية فردية. ولكن لم يتم استكشاف الآثار البيولوجية لضوضاء التعبير الجيني أثناء تمايز الخلايا وتحولات حالة الخلية في الأعماق ، "علق غرون.

تتضمن الطريقة الحسابية الجديدة ، المعروفة باسم VarID ، خوارزمية قادرة على تحديد ديناميكيات تقلب التعبير الجيني من بيانات تسلسل الحمض النووي الريبي أحادية الخلية. لذلك ، فإنه يحدد الأحياء المتجانسة محليًا مع تباين التعبير الجيني التفاضلي.

باستخدام طريقة VarID ، من الممكن التحقيق في ديناميكيات ضوضاء التعبير الجيني خلال تمايز الخلايا الجذعية إلى خلايا ناضجة. يمكن أن يوضح هذا مقدار التطور الذي يتحكم فيه ضوضاء التعبير الجيني وما إذا كان ضروريًا حتى للتمايز الخلوي.

تنشأ العديد من الأمراض ، مثل السرطان ، لأن الخلايا لا تتطور بشكل كامل من الخلايا الجذعية حتى مرحلة النضج. وبدلاً من ذلك ، فإنها تظل في مرحلة النشوء وتتكاثر خارج نطاق السيطرة "، أوضح جرون. "نريد أن نفهم ما يحدث في الخلية عندما يكون التطور مضطربًا بهذه الطريقة. لذلك ، توصلنا إلى خوارزميات فريدة لمعالجة وتحليل بيانات الخلية الواحدة ".

استخدم Grün طريقة VarID لتتبع نشاط عوامل النسخ الأساسية أثناء نمو خلايا الدم الحمراء في الفئران. وجد أن عوامل النسخ الأساسية هذه يتم التعبير عنها بشكل متواضع ولكنها شديدة التباين في خلايا الدم الجذعية ، مما يشير إلى أنها مسؤولة عن إثارة التمايز.

"طريقة فاريد تفتح الباب لإلقاء الضوء على دور ضوضاء التعبير الجيني أثناء تمايز الخلايا الجذعية. نظرًا لأننا الآن قادرون على القراءة في ضوضاء تمايز الخلايا الجذعية ، فإننا نأمل في اكتشاف كيفية التحكم في هذه العملية لفهم كيفية تنظيم الضوضاء قرارات مصير الخلية بشكل أفضل.


افاق المستقبل

مع تقدم تقنيات التسلسل ، ستحتاج الأدوات الحسابية إلى التطور بالتوازي لحل التحديات التقنية الجديدة ودعم التطبيقات الجديدة. على سبيل المثال ، نظرًا لأن قدرة الأنظمة الأساسية المتسلسلة على إنتاج قراءات أطول أصبحت حقيقة واقعة ، يلزم وجود طرق جديدة لرسم الخرائط لمحاذاة القراءات الطويلة بدقة وكفاءة. نظرًا لأن القراءات الأطول يمكن أن تمتد عبر تقاطعات exon و # x02013exon المتعددة ، فإن تحديد وتقدير الأشكال الإسوية البديلة سوف يتحسن بشكل كبير مع المعلومات الإضافية المشفرة في القراءات الأطول. علاوة على ذلك ، مع نضوج الأساليب المختبرية لتمكين تسلسل كميات دقيقة من الحمض النووي الريبي ، ستكون هناك حاجة إلى مناهج إحصائية معقدة للتمييز بين الضوضاء التقنية والتباين البيولوجي الهادف. سيسهل هذا التقدم تحليل النسخ في أنواع الخلايا النادرة وحالات الخلايا ، مما يمكّن الباحثين من إعادة بناء الشبكات البيولوجية النشطة على المستوى الخلوي. بالإضافة إلى ذلك ، ستسمح هذه التطورات لتحليل النسخ بالانتقال إلى مجال التشخيص السريري ، على سبيل المثال ، يمكن إجراء المراقبة المبكرة للكشف عن السرطان والحمل عن طريق تسلسل الحمض النووي الريبي السرطاني أو الحمض النووي الريبي الجنيني في دم الأم. علاوة على ذلك ، فإن تكامل تسلسل الجينوم الكامل مع RNA-Seq في عينات أكبر سيوفر نظرة ثاقبة للتباين التنظيمي الجيني. ستوفر هذه التطورات التجريبية والمعلوماتية الحيوية مجموعة أدوات قوية لوصف الترنسكريبتوم بالكامل من حيث صلته بالأسئلة البيولوجية الأساسية ، فضلاً عن تأثيره المتزايد على الطب الشخصي.


جميع رموز تصنيف Science Journal (ASJC)

  • APA
  • اساسي
  • هارفارد
  • فانكوفر
  • مؤلف
  • BIBTEX
  • RIS

مخرجات البحث: المساهمة في المجلة ›المقال› مراجعة الأقران

T1 - طرق قياس التعبير الجيني في المناعة البيئية

AU - فاسبيندر أورث ، كارول أ.

N1 - معلومات التمويل: تم دعم هذا العمل من قبل جمعية علم الأحياء التكاملية والمقارنة (DAB ، DCE ، DCPB) وشبكة تنسيق أبحاث مؤسسة العلوم الوطنية في علم المناعة البيئية [NSF ISO 094177].

N2 - ملخص تاريخيًا ، كان استخدام التقنيات الجزيئية المتطورة لدراسة التعبير الجيني المناعي والمسارات الخلوية ذات الصلة مقصورًا إلى حد كبير على الكائنات الحية النموذجية. تم إجراء عدد قليل من الدراسات التي تحدد الاستجابات المناعية الجزيئية للأنواع غير النموذجية ، خاصةً في الاستجابة للعوامل البيئية أو أحداث تاريخ الحياة أو التعرض للطفيليات. حدث هذا النقص في المعلومات إلى حد كبير بسبب عدم توفر تسلسل الجينات غير الخاص بالأنواع والكواشف المناعية وأيضًا بسبب التكنولوجيا الباهظة الثمن. ومع ذلك ، مع التطور السريع لمختلف تقنيات التسلسل والنسخ ، أصبح من الممكن تحديد ملامح التعبير الجيني للكائنات غير النموذجية. تتضمن التقنيات والمفاهيم التي تم استكشافها هنا نظرة عامة على التقنيات الحالية لقياس التعبير الجيني ، بما في ذلك: qPCR ، ومقايسات الحمض النووي المتفرعة المتعددة ، والمصفوفات الدقيقة ، وتوصيف التعبير الجيني (تسلسل الحمض النووي الريبي [RNA-Seq]) استنادًا إلى تسلسل الجيل التالي. تمت مناقشة أمثلة على تقدم هذه التقنيات في الأنظمة غير النموذجية. بالإضافة إلى ذلك ، يتم تناول التطبيقات والقيود وجدوى استخدام هذه المنهجيات في الأنظمة غير النموذجية لمعالجة الأسئلة في علم المناعة البيئية وعلم البيئة المرضي بشكل خاص.

AB - ملخص تاريخيًا ، كان استخدام التقنيات الجزيئية المتطورة لدراسة التعبير الجيني المناعي والمسارات الخلوية ذات الصلة مقصورًا إلى حد كبير على الكائنات الحية النموذجية. تم إجراء عدد قليل من الدراسات التي تحدد الاستجابات المناعية الجزيئية للأنواع غير النموذجية ، خاصةً في الاستجابة للعوامل البيئية أو أحداث تاريخ الحياة أو التعرض للطفيليات. حدث هذا النقص في المعلومات إلى حد كبير بسبب عدم توفر تسلسل الجينات غير الخاصة بالأنواع والكواشف المناعية وأيضًا بسبب التكنولوجيا الباهظة الثمن. ومع ذلك ، مع التطور السريع لمختلف تقنيات التسلسل والنسخ ، أصبح من الممكن تحديد ملامح التعبير الجيني للكائنات غير النموذجية. تتضمن التقنيات والمفاهيم التي تم استكشافها هنا نظرة عامة على التقنيات الحالية لقياس التعبير الجيني ، بما في ذلك: qPCR ومقايسات الحمض النووي المتفرعة المتعددة والمصفوفات الدقيقة والتعبير الجيني (تسلسل الحمض النووي الريبي [RNA-Seq]) استنادًا إلى تسلسل الجيل التالي. تمت مناقشة أمثلة على تقدم هذه التقنيات في الأنظمة غير النموذجية. بالإضافة إلى ذلك ، يتم تناول التطبيقات والقيود وجدوى استخدام هذه المنهجيات في الأنظمة غير النموذجية لمعالجة الأسئلة في علم المناعة البيئية وعلم البيئة المرضي بشكل خاص.


تحليل الطيف الفردي الشكل لقياس التعبير الجيني ، مع التطبيق في وقت مبكر ذبابة الفاكهة الجنين

في السنوات الأخيرة ، مع تطور تقنيات الفحص المجهري الآلي ، زاد حجم وتعقيد بيانات الصور الخاصة بالتعبير الجيني بشكل كبير. الطريقة الوحيدة لتحليل هذه البيانات البيولوجية كمياً وشاملاً هي من خلال تطوير وتطبيق مناهج رياضية متطورة جديدة. هنا ، نقدم امتدادات لتحليل الطيف الفردي ثنائي الأبعاد (2D-SSA) للتطبيق على مجموعات البيانات ثنائية وثلاثية الأبعاد لصور الأجنة. يتم تطبيق هذه الامتدادات ، الدائرية والشكلية 2D-SSA ، على التعبير الجيني في الطبقة النووية تحت سطح ذبابة الفاكهة (ذبابة الفاكهة) الجنين. نحن نعتبر الإسقاط الأسطواني الشائع الاستخدام للإهليلجي ذبابة الفاكهة الجنين. نوضح كيف تساعد الإصدارات الدائرية والشكلية من 2D-SSA في تحليل بيانات التعبير إلى مكونات يمكن تحديدها (مثل الاتجاه والضوضاء) ، وكذلك فصل الإشارات عن الجينات المختلفة. تتم معالجة اكتشاف وتحسين التصحيح الناقص والإفراط في التصوير متعدد القنوات ، بالإضافة إلى استخراج وتحليل الميزات ثلاثية الأبعاد في أنماط التعبير الجيني ثلاثية الأبعاد.

1 المقدمة

في حين أن توافر تسلسل الجينوم قد أحدث ثورة جذرية في البحوث البيولوجية والطبية الحيوية ، فإن فهمنا لكيفية ترميز الجينات لآليات التنظيم لا يزال محدودًا. يعتمد التطور الجنيني بشكل حاسم على مثل هذه الآليات التنظيمية حتى تتمكن الخلايا من التمايز في المواضع الصحيحة وفي الأوقات الصحيحة. يتطلب الفهم العالمي لتنظيم الجينات في التنمية تحديد الدقة الخلوية في الجسم الحي متى وأين يتم التعبير عن كل جين. ستعالج أطالس الدقة الخلوية الديناميكية الجديدة مسألة كيفية تأثير عوامل النسخ الجيني على نمذجة التعبير [1].

مع تطور تقنيات الفحص المجهري الآلي في السنوات الأخيرة ، زاد حجم وتعقيد بيانات الصورة إلى المستوى الذي لم يعد من الممكن فيه استخراج المعلومات دون استخدام الأدوات الحسابية. يعتمد علماء الأحياء بشكل متزايد على علماء الكمبيوتر للتوصل إلى حلول وبرامج جديدة [2]. كانت هذه الأدوات الحسابية ضرورية لمعالجة الصور الناتجة عن الفحص المجهري عالي الإنتاجية لأعداد كبيرة وأنواع من العينات البيولوجية في ظل مجموعة متنوعة من الظروف. تتيح التطورات الحديثة في وضع العلامات والتصوير وتحليل الصور الحسابية إجراء القياسات الكمية بسهولة أكبر وبتفاصيل أكبر بكثير في مجموعة من الكائنات الحية (على سبيل المثال ، أرابيدوبسيس, سيونا, ذبابة الفاكهة, C. ايليجانس، الفئران، بلاتينيريس، وسمك الزرد) [١ ، ٣-٦]. على وجه الخصوص ، تصوير كائنات صغيرة واحدة سليمة ، مثل ذبابة الفاكهة و C. ايليجانس، أصبح الآن ممكنًا بدقة عالية في بعدين وثلاثة أبعاد وعبر الوقت ، مما يؤدي إلى مجموعات بيانات صور ضخمة متاحة للتحليل الحسابي الشامل.

توفر مجموعات البيانات الكمية واسعة النطاق هذه رؤى جديدة لمعالجة العديد من الأسئلة الأساسية في علم الأحياء التنموي. عادةً ما تكون المدخلات الأولية لاشتقاق المعلومات الكمية للتعبير الجيني والتشكل الجنيني عبارة عن بيانات صور أولية لعلامات الفلورسنت الملطخة في مادة ثابتة. يتم بعد ذلك تحليل مجموعات الصور الأولية هذه بواسطة خوارزميات حسابية تستخرج ميزات مثل موقع الخلية وشكل الخلية وتركيز المنتج الجيني. في نهاية المطاف ، تتمثل أقوى طريقة لتحليل البيانات المكانية ثلاثية الأبعاد في علم الأحياء في تطوير وتطبيق مناهج رياضية متطورة جديدة ، مما يسمح بإجراء مقارنة دقيقة بين الخصائص الكمية المتعددة [8 ، 9].

في هذا المنشور ، نقدم أدوات حسابية جديدة لتحليل أنماط الجينات لمجموعات بيانات ثلاثية الأبعاد المكانية ، مطبقة على ذبابة الفاكهة الأجنة. هذه الأدوات هي امتداد لتحليل الطيف الفردي ثنائي الأبعاد (2D-SSA).

مقدمة عن الطريقة. تم اقتراح تحليل الطيف الفردي [10-15] في الأصل كطريقة لتحليل السلاسل الزمنية إلى مجموع المكونات التي يمكن تحديدها مثل الاتجاه (أو النمط) والتذبذبات والضوضاء. تتمثل إحدى مزايا هذه الطريقة في أنها لا تحتاج إلى نموذج ضوضاء ليتم إعطاؤه مسبقًا. نقوم بتفكيك سلسلة البيانات إلى مجموعة من السلاسل الأولية ، ونحللها ، ونختار المكونات المناسبة ، وأخيراً نجمع المكونات التي يمكن تحديدها معًا في فئات. على سبيل المثال ، يمكن أن ينتج عن اختيار المكونات الملساء تجانس تكيفي. تعد SSA مفيدة جدًا للتحليل الاستكشافي نظرًا لأن الطريقة يمكن أن تتعامل مع الضوضاء المعدلة ، أي الضوضاء التي يمكن أن تعتمد على قيم الاتجاه (على سبيل المثال ، لها طبيعة مضاعفة).

تم تمديد SSA مؤخرًا لتحليل الكائنات ثنائية الأبعاد (2D-SSA) ، على سبيل المثال ، الصور الرقمية [16 ، 17]. يعد تحلل الصور أكثر تعقيدًا مقارنةً بتحليل السلاسل الزمنية بسبب تباين الأنماط ثنائية الأبعاد. لكن الأساليب التي يمكن التحكم فيها بسهولة والتكيف ، مثل 2D-SSA ، يمكن أن يكون لها قابلية تطبيق واسعة.

تشترك 2D-SSA كثيرًا مع طريقة 2D-ESPRIT (انظر [18]) ، والتي تعتمد على شكل حدودي للصور ولها العديد من التطبيقات. يتم تطبيق 2D-SSA والطرق ذات الصلة القائمة على الفضاء الجزئي في تحليل النسيج [19] ، وعلم الزلازل [20] ، وبيانات التعبير الجيني المكاني [21] ، والتصوير الطبي [22].

طبقت الورقة [23] 2D-SSA على تحليل التضاريس الرقمية في الجيولوجيا وأظهرت أن 2D-SSA هي أداة مفيدة لتحليل المستويات المختلفة من التفاصيل في البيانات السطحية. في وقت لاحق ، بناءً على النظرية الواردة في [17] ، تم تطبيق 2D-SSA على بيانات التعبير الجيني لفصل الضوضاء النووية عن اتجاه التعبير [21].

الأوراق [24 ، 25] تقدم امتدادات 2D-SSA التي تزيد من نطاق تطبيقات SSA. في هذه الورقة ، نوضح كيف يمكن تطبيق هذه الامتدادات لتحليل بيانات التعبير الجيني.

هذه الورقة نظمت كما يلي. يصف القسم 2 مجموعات البيانات التي تم تحليلها. يصف القسم 3 المنهجية الجديدة ، ويوضح القسمان 4 و 5 النهج في عدة أمثلة.

الأساليب الجديدة الموصوفة هنا ، الدائرية والشكل 2D-SSA ، تنطبق بشكل خاص على الأسطح الأسطوانية (كما هو مستخدم في ذبابة الفاكهة الأجنة) ، لتجنب آثار الحواف وأنماط الشكل غير المنتظم. على سبيل المثال ، يمكن أن تكون مساحة البيانات عالية الجودة في صورة ما (على سبيل المثال ، بدون تشبع زائد) غير مستطيلة وحتى بها فجوات. أيضًا ، منذ الإسقاط المستوي لـ ذبابة الفاكهة يكون الجنين بيضاوي الشكل تقريبًا ، ويمكن أن تكون القدرة على تحليل الأشكال غير المستطيلة مفيدة.

يتعامل القسم 4 مع مشكلة الكشف عن التصحيح الناقص والإفراط في التصوير متعدد القنوات وتحسينه ، بينما ينظر القسم 5 في مشكلة تحليل الأشكال الشريطية للجين المتخطي حتى. يحتوي القسم 6 على مناقشة قصيرة واستنتاجات.

2. المواد

تم الحصول على البيانات من مشروع شبكة نسخ بيركلي ذبابة الفاكهة (BDTNP) [4] ، والذي يحتوي على قياسات ثلاثية الأبعاد (3D) لتركيز mRNA النسبي لـ 95 جينًا في التطور المبكر (بما في ذلك حلزون (sna)) وأنماط التعبير البروتيني لأربعة جينات (bicoid ، عملاق ، حدب (هب) وكروبل (كر)) أثناء دورات الانقسام النووي 13 (C13) و 14 (C14A). يحتوي الإصدار 2 من BDTNP على مجموعات بيانات فردية (ملفات PointCloud) لـ 2830 أجنة (http://bdtnp.lbl.gov/Fly-Net/bioimaging.jsp). تم تسجيل هذه البيانات في إحداثيات 6078 نواة على قشرة الجنين وتم تقديمها كمجموعة بيانات متكاملة (ملف VirtualEmbryo ، مع أدوات للتصور والتحليل). تم إصلاح الأجنة وملطخة بالفلوريسنت لتسمية أنماط تعبير الرنا المرسال لجينين بالإضافة إلى الحمض النووي. تم تخطي أحد الجينات الملطخة (حواء) أو فوشي تارازو (FTZ) ، والتي تم استخدامها كعلامات ائتمانية للتسجيل المكاني اللاحق.

3. الطرق

3.1. تحليل الطيف الفردي ثنائي الأبعاد

سوف نتبع الهيكل المشترك لخوارزميات 2D-SSA الموصوفة في [24 ، 25]. يتكون هذا الهيكل المشترك من خطوات التضمين والتحليل والتجميع وإعادة البناء. يتكون مدخلات خوارزمية 2D-SSA من صورة

وشكل النافذة المتحركة (وهي معلمة الخوارزمية الرئيسية). ناتج خوارزمية 2D-SSA هو تحلل مكونات النموذج القابلة للتحديد

مخطط مشترك لخوارزميات تشبه SSA

(1) خطوة التضمين. بناء مصفوفة المسار

، أين مساحة المصفوفات المهيكلة الشبيهة بهانكل. يعتمد هيكل المصفوفة (والمساحة) على تعديل الخوارزمية وعلى النافذة المتحركة. بشكل عام ، تتكون أعمدة مصفوفة المسار من النوافذ المتحركة على طول الصورة ، وتحويلها إلى متجهات بترتيب ثابت لعناصر النافذة. بمعنى ما ، يعكس حجم النافذة دقة الطريقة ، أي أن النوافذ الأكبر حجمًا تؤدي إلى تحليلات أكثر تفصيلاً.

(2) خطوة التحلل. تحلل القيمة المفردة (SVD) لمصفوفة المسار

هي ما يسمى eigentriples (يتم اختصارها كـ ET) وتتكون من قيم مفردة وناقلات مفردة يمين ويسار. يمكن تحويل المتجهات الذاتية إلى شكل النافذة. هذا يعني أنه يمكننا اعتبار المتجهات الذاتية كصور وندعوها eigenimages.

(3) خطوة التجميع. تقسيم

وتجميع المجموعات في تحلل SVD للحصول على تحلل مصفوفة مجمعة

يسمى الابتدائية. الهدف من هذه الخطوة هو تجميع مكونات SVD للحصول على تحلل قابل للتفسير للكائن الأولي. يمكن القيام بذلك عن طريق تحليل المثلثات.

(4) خطوة إعادة الإعمار. تحلل الصورة الأولية ، أين

هو عامل الإسقاط على الفضاء (على سبيل المثال ، التنوير في الحالة 1D).

دعونا نشرح معنى عامل التضمين للحالة 1D ، لأنه أبسط ويوضح المنهجية العامة. لسلسلة أحادية البعد

، نأخذ نوافذ متحركة بطول 1D

وبناء أعمدة مصفوفة المسار في الأشكال

المتجهات المتأخرة نجمع مصفوفة هانكل بأعداد متساوية على أضداد تسمى مصفوفة المسار

من المعروف جيدًا أن مصفوفات هانكل مرتبطة بالسلسلة التي تتكون من مجموعات منتجات ذات حدود متعددة ، وموجات أسية ، وموجات جيبية ، والمشكلة هي فصل هذا المجموع إلى إضافات. إذا تمكنا من فصل التقريبات الأسية والمتعددة الحدود عن المتبقي ، فيمكننا عندئذٍ استخراج الاتجاهات والأنماط. If we are able to separate sine waves with different frequencies, then we can construct a decomposition on components with different frequency ranges.

The singular value decomposition (SVD) of the trajectory matrix constructs a sequence of elementary matrices, which provides the best approximations of the initial matrix and, in a sense, of the initial series: , , and so on. Thus, we obtain the optimal decomposition, which is adaptive to the initial series. Note that the maximal number of the decomposition elements is equal to

. SSA theory explains why we can group the elementary components in the SVD expansion to solve such problems as, for example, smooth approximation and extraction of regular oscillations.

After a proper grouping, we obtain a matrix , which is close to a Hankel matrix, but not exactly Hankel. We can find the Hankel matrix closest to

by hankelization, that is, by averaging values by antidiagonals. Thus, we obtain the series consisting of ,

, and so on. ال مth term is determined as

The role of is as follows. Small provides a decomposition to a small number of components, which mostly differ by frequency, and where the leading components present slowly varying series like the trend. Larger leads to more detailed decomposition. This gives more chance to extract a component however, some components can mix. Therefore, if the data series has a trend with a complex form or has periodicities with complex modulation, then window lengths should be moderate.

These generalities also hold for the case of 2D-SSA. In practice, the difference between 1D and 2D is in the construction of the trajectory matrices, which are quasi-Hankel, in particular Hankel-block-Hankel. The moving window is two-dimensional, for example, a rectangle. In this paper, we introduce circular SSA, for treating rectangles with periodic boundary conditions, for example, data sets on cylindrical geometries. Small window size corresponds to smoothing. We can take into consideration the structure of the image in different directions by choosing different sizes in different directions. The trajectory matrix is constructed from vectorized windows of arbitrary shape moving within the whole image (including circular domains, for periodic boundary conditions).

3.2 Particular Cases

For a rectangular image, with a rectangular window which moves within the image boundaries, we obtain the standard 2D-SSA method. If the image and the window are of arbitrary shape, the shaped version of 2D-SSA is applied [25]. If the window can cross the boundary of the image, we obtain a circular version of 2D-SSA.

For example, let us take an image (a matrix in the mathematical sense)

. Then we have a set of 4 windows in the ordinary version,

, and two additional windows, , , in the circular case. For the circular case, the trajectory matrix will have the form

One can see that the 2D trajectory matrix consists of trajectory matrices from each matrix’s row.

3.3 Choice of Parameters, Separability, and Component Identification

Approach to the choice of window size for one-dimensional time series is thoroughly described in [13, 26]. Recommendations for 2D objects are more complicated. For extraction of so-called objects of finite rank (sums of products of polynomials, exponentials, and sinusoids), which satisfy linear recurrence relations (LRRs), windows should be large, up to half of the object size. However, real-world patterns usually have complex form and satisfy LRRs only approximately and locally. The window needs to agree with this local character. In particular, sine waves are exactly governed by an LRR. However, if a 2D-sine wave has a slowly changing location, then only its local parts satisfy an LRR. The window sizes need to be in accordance with the scale of this locality. Choice of window size is always a balance between the local and the global scales of the data.

Generally, SSA can separate smooth patterns from noise for a wide variety of patterns. For regular patterns, 2D-SSA can be applied whether the pattern varies smoothly or sharply. However, if the pattern is not regular, variation needs to be smooth in order to use 2D-SSA for signal separation. Irregular pattern with sharp variation is poorly separated by 2D-SSA. If, however, the sharp change occurs in narrow area, this can be cut out, and the remaining data analyzed by shaped SSA, which is a version of 2D-SSA with a nonrectangular shape of the image or the window.

Elementary components are grouped based on their similarity to the data components being extracted. For regular components like sine waves, the number of elementary components can be calculated from theory. Also, patterns usually have a limited frequency range (usually lacking high frequencies). In general, therefore, leading elementary components with the appropriate frequency characteristics are ascribed to pattern.

In this paper we show how 2D-SSA can be used to remove noise, to separate regular oscillations from slowly varying patterns (for correcting erroneous unmixing procedures), and to extract stripes for their further analysis. Shaped SSA allows for the analysis of complex patterns by splitting images into several parts.

ذبابة الفاكهة early gene expression (before the midblastula transition) produces smooth and simple patterns suitable for 2D-SSA processing. A number of web resources have such datasets (BDTNP BID [4], Fly-FISH http://fly-fish.ccbr.utoronto.ca [27], FlyEx http://urchin.spbcas.ru/flyex [28] see also [29, 30]). Shaped SSA can also be useful for a common subset of this data, in which patterns fall sharply to zero. In these cases, subregions can be excised or analyzed separately from the whole image. الجين sna is a typical ذبابة الفاكهة example seen in the BDTNP BID such compact patterns are also seen in other experimental organisms, such as the nine zebrafish genes [31]. We expect 2D-SSA and shaped SSA to therefore have broad applicability to image processing in developmental biology.

The problem of unmixing expression patterns from two different genes in one image [32] requires additional conditions. Specifically, information is needed on the unmixed expression of each gene (i.e., data from one gene in the absence of the other gene). If the two genes have slowly varying patterns, they cannot readily be separated by SSA. In such cases, SSA cannot be used to detect or correct errors in mixed images. However, SSA is an effective unmixing method for cases in which one gene has an approximately regular structure, and this differs from the structure of the other gene. In this paper, we apply SSA to signal unmixing and image correction for such cases from ذبابة الفاكهة البيانات.

3.4. Data Preprocessing

Initially, the data for 2D-SSA analysis should be measured on a regular grid. Data for gene expression are measured at nuclei, which are not regularly located on a 3D surface of embryo (which is roughly ellipsoidal in shape). The first step of preprocessing is a cylindrical projection of the data (centred on the major axis of the ellipsoid the major axis of the embryo is found by principal component analysis). We then interpolate the data to a regular grid on this cylinder. We analyze a central region of the cylinder, in order to avoid corruptions near the poles from the ellipsoid to cylinder transformation. After 2D-SSA decomposition, we interpolated the data back onto the nuclear centers. This interpolation is performed for smooth components residuals are calculated as the difference between the initial data and interpolated smooth components.

Interpolation involves Delaunay triangulation followed by linear interpolation of nuclear centers to the triangulation.

3.5 تطبيق

The algorithms are implemented in the Rssa and BioSSA packages in ر. Rssa is a general-purpose package containing effective implementation of singular spectrum analysis and its 2D extensions. 2D-SSA algorithms are time- and memory-consuming and therefore it is very important to have an effective implementation. A description of Rssa with examples can be found in [24, 33]. ال ر-package BioSSA is an addition to Rssa for application to fly embryo gene expressions data and is briefly described at http://biossa.github.io/.

4. Periodic Patterns Produced by Unmixing Algorithms

Different emission spectra for fluorescent probes allows for the simultaneous staining for 3-4 gene products in embryonic tissues. Quantitative imaging projects [4, 30] use the same gene in one of these channels in all embryos, for reliable quantitative comparisons, registration, and so forth. The gene used for this marking in ذبابة الفاكهة embryos is commonly one of the pair-rule genes (such as eve أو ftz), which have a characteristic periodic 7-stripe expression pattern.

Multichannel imaging suffers from an inherent problem of overlapping emission spectra (when the fluorescent markers are simultaneously excited (e.g., [34])), where light from more than one fluorescent dye is collected by a given acquisition channel. To computationally reduce this “crosstalk,” an automated channel unmixing method was developed and applied to the BDTNP data [32].

The problem with this approach in large scale projects with automatic data processing is that the unmixing parameters can end up being too high or too low. If the parameters are overestimated, unmixing produces an overcorrection, which is manifest as a partial subtraction of the common, reference pattern from the pattern of the second gene (the gene under study for the embryo). With periodic reference patterns (eve, ftz), this produces periodic grooves in the “unmixed” pattern. Figure 1 shows the effects of such overcorrection in one of the BDTNP embryos.


مقدمة

In the presence of genetic or environmental perturbations, differential expression of genes, orchestrated by dedicated regulatory circuits, shapes the physiological responses of the cell. Common physiological responses to perturbations, e.g. in response to stress or during oncogenic transformation, often include changes in the cell growth rate and metabolism. In turn, both growth rate and metabolic parameters of the cell can exert global influences on gene expression, as demonstrated by landmark studies in بكتريا قولونية (1–4) and in yeast (5–8). Thus, the gene expression program following a perturbation reflects a joint effect of the specific regulatory circuits that are induced (or repressed) by the perturbation, as well as the global influence on gene expression by an altered physiological state (Fig 1A). Further complexities arise as gene expression and cell physiology operate in mutual feedback (4, 9), which can lead to the emergence of complex behaviours (10). Currently, a quantitative framework to understand the global effects of cell physiology on gene expression is lacking. Development of such a framework would allow perturbation-specific gene regulation mechanisms to be uncoupled from global gene expression control, and allow synthetic gene circuits with complex behaviours to be designed (9, 10).

A. Gene expression profiles of a cell depends on both specific gene expression programs induced by specific perturbations, as well as the global influence on gene expression by the physiological state of the cell.

B. Experimental design to orthogonally probe the effects of growth rate and amino acid metabolism on gene expression. Cells were grown in chemostats at controlled growth rates and media composition. GR, growth rate AA, amino acid XIA, Xia وآخرون (22,23). In AA experiments, carbon-limited conditions (blue rows), the “Gln” condition and the “Gln*” condition differ in the concentration of Gln and glucose in the chemostat feed media see Table S1 for full details.

C. Number of differentially expressed (DE FDR < 0.01) genes at mRNA and protein (prot) levels in the GR experiments, AA experiments, and XIA experiments, showing that a large number of genes are regulated by growth rate and metabolic parameter.

Seminal studies in the field (11–13) have previously examined the interaction between growth rate, metabolic parameters, and gene expression, using microarrays and relative-quantitative metabolomics, in the eukaryal model organism خميرة الخميرة. Herein we revisit these interactions using RNAseq-based absolute-quantitative transcriptomics, showing substantial changes in absolute quantities of mRNA between different growth conditions which cannot be captured with relative-quantitative data. We further provide absolute-quantitative proteomics and intracellular amino acid abundance, in a total of 22 steady-state yeast cultures in biological triplicates, as a high-quality resource to the community. The 22 steady-state conditions were designed to orthogonally probe the effects of growth rate and metabolic parameters related to amino acids on gene expression (Fig 1B). لقد وجدنا أن

90% of genes are globally influenced by the cell growth rate and/or metabolic parameters. The growth rate-induced gene expression changes were coordinated at the transcript and protein levels, and were associated with the availabilities of the transcription and translation machineries. In contrast, gene expression control by metabolic parameters were not associated with the availability of transcription and translation machineries, but were likely regulated by the availabilities of amino acids and nucleotides. We found that genes related to central carbon metabolism (CCM) were distinctly regulated, reflecting unique control mechanisms to ensure robust expression of this metabolic pathway. Finally, by re-analyzing gene expression profiles of a distantly related yeast, Schizosaccharomyces pombe ، and of the human Burkitt’s lymphoma cell line P493-6, we demonstrated that our findings can be broadly applied to uncouple global gene expression control from regulation by specific transcriptional and translational circuits, allowing novel biological insights in gene regulation to be uncovered.


Quantifying Gene Co-Expression Heterogeneity in Cancer Towards Efficient Network Biomarker Design

It is well known that cancer is a highly heterogeneous disease, and the predictive capability of targeted gene signature approach suffers from the inter-tumor heterogeneity. Here we propose a framework to quantify the molecular heterogeneity of tumors from gene-gene relational perspective using co-expression networks and interactome data. We believe that to understand individualized gene behavior across patients, relational status of genes needs to be considered because complex disease phenotype is often caused by failures of genetic interactions in cancer cells.

We quantified gene-gene relational heterogeneity from a benchmark data set using co-expression networks inferred from Microarray data, and showed that genes related to breast cancer metastasis can be stratified to different classes based on their relational status obtained from pair-wise comparisons of co-expression networks. Further we used the relational heterogeneity information to predict patient survival and found that relationally heterogeneous gene set is less predictive than relatively conserved cancer genes. We explored heterogeneity gene sets using interactome data and identified densely connected components that are causal to inter-tumor heterogeneity. We independently validated our approach with two patient cohorts. Our results demonstrated the efficiency of using heterogeneity information to design network markers.

Current Bioinformatics

عنوان:Quantifying Gene Co-Expression Heterogeneity in Cancer Towards Efficient Network Biomarker Design

الصوت: 10 مشكلة: 3

المؤلفون):Shang Gao, Abdullah Sarhan, Reda Alhajj, Jon Rokne, Doug Demetrick and Jia Zeng

الانتماء:College of Computer Science and Technology, Jilin University, Changchun, Jilin, China.

الملخص:It is well known that cancer is a highly heterogeneous disease, and the predictive capability of targeted gene signature approach suffers from the inter-tumor heterogeneity. Here we propose a framework to quantify the molecular heterogeneity of tumors from gene-gene relational perspective using co-expression networks and interactome data. We believe that to understand individualized gene behavior across patients, relational status of genes needs to be considered because complex disease phenotype is often caused by failures of genetic interactions in cancer cells.

We quantified gene-gene relational heterogeneity from a benchmark data set using co-expression networks inferred from Microarray data, and showed that genes related to breast cancer metastasis can be stratified to different classes based on their relational status obtained from pair-wise comparisons of co-expression networks. Further we used the relational heterogeneity information to predict patient survival and found that relationally heterogeneous gene set is less predictive than relatively conserved cancer genes. We explored heterogeneity gene sets using interactome data and identified densely connected components that are causal to inter-tumor heterogeneity. We independently validated our approach with two patient cohorts. Our results demonstrated the efficiency of using heterogeneity information to design network markers.


شاهد الفيديو: شرح ترددات السولفيجيو (قد 2022).