معلومة

توزيع أحجام Exon و Intron

توزيع أحجام Exon و Intron


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

هدف

أحاول الحصول على توزيع أحجام Exons و intron في Stickleback ثلاثي الأشواك (Gasterosteus aculeatus).

تم تنزيل البيانات

لقد قمت بتنزيل بعض البيانات من Ensembl. بتعبير أدق ، ذهبت إلى هناك ، واخترت "بنية" في "السمات" واخترتها

- معرف الجينات Ensembl - Exon Chr Start (BP) - Exon Chr End (BP)

توجد مشكلتان في هذه البيانات:

  1. تنتهي بعض exons قبل أن تبدأ
  2. تتداخل بعض exons

النقطة الأولى هي أنني افترضت بسبب الارتداد ، لذلك قمت بعكس موضع البداية والنهاية عندما كان هناك مثل هذا الانعكاس. النقطة الثانية أكثر إشكالية لأنني لا أعرف ما يمكن أن يعنيه هذا التداخل بشكل واقعي.

هل يمكنك المساعدة في إيجاد توزيع أحجام exon و intron في الشوكة ثلاثية الأشواك؟


ما فعلته بالبيانات أعلاه

تحضير

# قراءة البيانات د = read.table (file.choose ()، header = TRUE) الأسماء (d) = c ("ID"، "start"، "end") # عكس exons عند الحاجة إلى العكس = أي (d $ start > d $ end) s = d $ start [toReverse] d $ start [toReverse] = d $ end [toReverse] d $ end [toReverse] = s

مقاسات Exon -> تبدو جيدة

# أحجام ExonSizes = d $ end - d $ start Hist (ExonSizes) # رائع ، يبدو جيدًا!

مقاسات الإنترونات -> تبدو سيئة

# أحجام Intron # هذا بطيء بعض الشيء. قد يكون من الأفضل التبديل إلى C ++. # الفكرة هي النظر إلى المسافة بين نهاية exon وبداية exon التالي داخل كل جين. d $ ID = لصق (d $ ID) IntronSizes = c () uniquegenes = فريد (d $ ID) nbgenes = length (uniquegenes) i = 0 exon = 0 لـ (gene in uniquegenes) {i = i + 1 cat (لصق 0 (i، "/"، nbgenes، " n")) بينما (TRUE) {exon = exon + 1 if (d $ ID [exon] == gene) {IntronSizes = append (IntronSizes، d [exon + 1، ] $ start - d [exon،] $ end)} else {break}}} hist (IntronSizes) # هناك قيم سالبة. لا أعرف كيف أفسرها. اصمت (سجل (القيمة المطلقة (IntronSizes))) # هذا يبدو جيدًا ولكن أشك في أنه منطقي جدًا!

في سطر الأوامر:

wget ftp://ftp.ensembl.org/pub/release-84/gtf/gasterosteus_aculeatus/Gasterosteus_aculeatus.BROADS1.84.gtf.gz gunzip Gasterosteus_aculeatus.BROADS1.84.gtf.gz

ثم في R:

مكتبة (GenomicFeatures) txdb = makeTxDbFromGFF ("Gasterosteus_aculeatus.BROADS1.84.gtf") هيست (log10 (عرض (فريد (exons (txdb)))) # exons هيست (log10 (عرض (فريد (unlist (intronsByTranscript (txdb) ))))) # إنترونات

لاحظ أن بعض exons المشروح (والإنترونات بينها) من غير المرجح أن تكون صحيحة بشكل لا يصدق. على سبيل المثال ، هناك 1 قاعدة طويلة exons وإنترونات. لا أعتقد أن أي شخص يعتقد بالفعل أن هذه صحيحة ، ولكن التوزيع ربما يكون صحيحًا تقريبًا.

يحرر: لما يستحق ، لا توجد exons سالبة الحجم في ملف GTF. تخميني هو أن exons المتداخلة هي من نصوص مختلفة (أو جينات على خيوط متقابلة).

تحرير 2: إذا كنت ترغب في الحصول على الإنترونات الخاصة بك من "نموذج جيني متحد" ، فاستخدم شيئًا مثلتقليل (exonsBy (txdb ، بواسطة = "جين"))وثملابليثغرات()إلى ذلك. ستكون النتائج صحيحة وربما تستغرق العملية وقتًا أقل مما كنت تحاول.


تحيز التوزيع لمطابقة التسلسل بين exons و introns في مفصل exon ومنطقة ربط EJC في C. ايليجانس

نعطي نظرية مفادها أن علاقة مطابقة التسلسل بين متواليات الرنا المرسال والإنترونات المقابلة بعد التقسيم تلعب دورًا مهمًا في عملية التعبير الجيني والتنظيم.

يتوافق معدل الطول والمطابقة للأجزاء المتطابقة المثلى مع ميزات التسلسل لـ siRNA و miRNA.

يمكن الكشف عن منطقة ربط EJC ومفصل exon من خلال معلماتنا.

تتمتع EJC و introns بعلاقات تنافسية وتعاونية في عملية الدمج في متواليات تشفير البروتين.

تسلسلات Intron وتسلسلات ترميز البروتين لها علاقات تطور منسقة.


Sandwalk

كان هناك عدد غير قليل من الدراسات حول متوسط ​​حجم الإنترون في الأنواع المختلفة. لقد اخترت رقمًا لمتوسط ​​حجم الإنترونات من Hong et al. (2006). متوسط ​​حجم intron ، وفقًا لهم ، هو 3479 نقطة أساس في مناطق الترميز. هذه القيمة مخادعة بعض الشيء نظرًا لوجود عدد صغير من الإنترونات الضخمة التي تجعل المتوسط ​​كبيرًا جدًا. القيمة المتوسطة هي 1334 نقطة أساس أو أقل من نصف القيمة المتوسطة.

اقترحت أن الكثير من تسلسلات intron كانت غير مهمة. سؤال Martinc معقول تمامًا ولكن من أجل الحصول على إجابة ، نحتاج إلى النظر عن كثب في توزيع الإنترونات.

يوضح الشكل توزيع أحجام intron في أربعة أنواع: النبات المزهر نبات الأرابيدوبسيس thaliana ذبابة الفاكهة ذبابة الفاكهة سوداء البطن الإنسان والفأر. البيانات من Hong et al. (2006 ، الشكل 1).

لاحظ أن التوزيع في أرابيدوبسيس و ذبابة الفاكهة ضيق جدا. كلا النوعين لهما جينومات مضغوطة نسبيًا مقارنة بالثدييات. تشير البيانات بقوة إلى أن الحد الأدنى لحجم intron يبلغ حوالي 80 نقطة أساس.

التوزيعات في جينومات الإنسان والفأر مختلفة جدًا. هناك ذروة قوية عند 100 نقطة أساس و mdashthis مشابه للقمم في الأنواع الأخرى. ولكن على عكس الأنواع الأخرى ، يمكن أن تكون الإنترونات في الثدييات كبيرة للغاية ، مما يؤدي إلى ظهور ذيل طويل للتوزيع يمتد إلى 10000 نقطة أساس أو أكثر. السؤال الرئيسي هو ما إذا كان توزيع الإنترونات الطويلة هذا هو الضوضاء أو قطعة أثرية من خوارزميات التنبؤ الجيني ، أو ما إذا كان يمثل ظاهرة حقيقية.

العودة إلى سؤال مارتن. إذا نظرنا إلى الجينات المحفوظة جيدًا في الأنواع المختلفة ، فإن ما نجده هو بعض الاختلاف في طول الإنترون ولكن فقط حول متوسط ​​حوالي 100-400 زوج قاعدي. بعبارة أخرى ، في الجينات التي تم فحصها عن كثب ، حيث يُعرف منتج البروتين ، فإن توزيع أحجام الإنترون يشبه إلى حد كبير التوزيع في أرابيدوبسيس و ذبابة الفاكهة.

لنلقِ نظرة على ملف hsp90 جينًا. هذه هي الجينات التي ترمز إلى Hsp90 ، وهو البروتين الذي كان SciPhu يدون حوله [Hsp90 و Evolution].

لقد اخترت جين الزرد وأربعة جينات للثدييات لتوضيح الاختلاف في طول الإنترون. (exons الأزرق هو 5 & Prime و 3 & UTR's.) معظم الإنترونات يتراوح حجمها بين 80 و 400 نقطة أساس ولكن هناك استثناءات قليلة. في هذه الحالة ، يكون الجين البشري هو الاستثناء ، فهو يحتوي على اثنين من الإنترونات الضخمة في الطرف الخامس والأول من الجين.

ما نراه هو توزيع ضيق لأطوال intron في معظم الحالات وعدد قليل من إنترون ضخم. ليس من المستغرب أن يكون طول الإنترونات في الأنواع المختلفة متشابهة تمامًا.

دعونا نلقي نظرة على الجين المفضل لدي. HSPA8 هي النسخة السيتوبلازمية من عائلة تشابيرون HSP70 متعددة الجينات.

نرى نمطًا مشابهًا. معظم أطوال الإنترون متشابهة جدًا في الأنواع المختلفة مما يشير إلى اختيار الإنترونات في نطاق 100-400 زوج قاعدي. هناك استثناءات ، كما نرى في جينات الشمبانزي والقرد والكلب. كل الثلاثة لديهم إنترونات كبيرة إما 5 & رئيس أو 3 & نهايات أولية. إن القرود الكبيرة هي 10253 نقطة أساس و 1007 نقطة أساس. يبلغ طول إنترون الشمبانزي الكبير 13257 زوج قاعدي. هذا نموذجي. أعتقد أنه من المحتمل جدًا أن تكون الإنترونات الكبيرة في exons غير المشفرة من القطع الأثرية.

إذن ها هي الإجابة الكاملة على السؤال المطروح في أعلى الصفحة. أعتقد أن هناك اختيارًا للحفاظ على أحجام الإنترونات في نطاق ضيق إلى حد ما يتراوح بين 100-400 نقطة أساس. لهذا السبب ، نتوقع أن نرى أحجامًا متشابهة للإنترون في الأنواع المختلفة. في بعض الأحيان نكتشف intron ضخمًا خاصًا بنوع واحد. قد يكون هذا الإنترون توسعًا عابرًا لم يتم تقليصه بعد ، أو قد يكون قطعة أثرية.

بالمناسبة ، أثناء استرجاع هذه التسلسلات من Entrez Gene ، لاحظت أن المعلقين قد أزالوا جميع أنواع التوابل لجينات HSP90 و HSPA8 مع استثناءات قليلة.

تحتوي جميع سلاسل الكلاب على العديد من متغيرات لصق لكل جين وقد تم الاحتفاظ ببعض المتغيرات في إدخال Entrez Gene للكلب HSPA8. انظر بعناية إلى المتغيرين المتوقعين في السطر الأول والخط الثالث. من المفترض أن تنتج بدائل التوصيل البديلة هذه بروتينات Hsc70 التي تفتقد إلى العديد من المناطق المحفوظة بشدة والتي تم ترميزها بواسطة exons 7 و 8. تذكر أن هذا هو البروتين الأكثر حفظًا في علم الأحياء.

لا يمكن أن تكون هذه متغيرات بروتينية ذات صلة بيولوجيًا يتم إنتاجها فقط في الكلاب. المعلقون على حق في إزالة القطع الأثرية المماثلة من الجينومات الأخرى ويجب عليهم إزالتها أيضًا. متغيرات اللصق البديلة هي في الغالب قطع أثرية ، في رأيي ، لكن هذا قتال ليوم آخر.


توزيع أحجام Exon و Intron - علم الأحياء

طب اليانغتسى المجلد 01 رقم 01 (2017) ، معرف المقال: 7501715 صفحة
10.4236 / سنة 2017.11006

تحليل مقارن لبنية Exon-Intron في جينوم حقيقيات النوى

Yongfa Li 1،2 ، Yanhua Xu 1،3 ، Zhaowu Ma 1،2

1 المدرسة الثانية للطب السريري ، جامعة يانغتسي ، جينغتشو ، الصين

2 مختبر الأورام ، مركز الطب الجزيئي ، كلية الطب ، جامعة يانغتسي ، جينغتشو ، الصين

3 قسم الأورام ، مستشفى جينغتشو المركزي ، جينغتشو ، الصين

حقوق الطبع والنشر ونسخ 2017 من قبل المؤلفين وشركة Scientific Research Publishing Inc.

هذا العمل مُرخص بموجب رخصة المشاع الإبداعي نَسب المُصنَّف (CC BY 4.0).

/>

تم الاستلام: ٢٧ فبراير ٢٠١٧ القبول: ٢٧ مارس ٢٠١٧ تاريخ النشر: ٣٠ مارس ٢٠١٧

تختلف أعداد وأطوال exon باختلاف الأنواع حقيقية النواة. مع زيادة التسلسلات الجينومية المكتملة ، لا غنى عن إعادة تحليل تنظيم الجين في جينومات متنوعة حقيقية النواة. أجرينا تحليلًا مقارنًا واسع النطاق لبنية exon-intron في 72 كائنًا حقيقيًا للنواة ، بما في ذلك النباتات والفطريات والحيوانات. لقد أكدنا أن بنية exon-intron تختلف بشكل كبير بين جينومات حقيقية النواة وكشفنا عن بعض السمات الخاصة بالنسب للجينات حقيقية النواة. يتضمن ذلك نمط بنية exon-intron خاصًا عن بُعد ، وإنترونات صغيرة نسبيًا وإكسونات كبيرة في الفطريات والطحالب ، وتوسع تدريجي للإنترونات في الفقاريات. علاوة على ذلك ، يشير تحليل الحفظ لحدود exon-intron إلى أن العديد من القواعد بالقرب من تقاطعات موقع لصق مختلفة في الإنترونات ذات الطول المتغير بين الأنواع المختلفة. بعد المقارنة ، حددنا اتجاهًا يظهر زيادات في كثافة وأطوال intron في أنواع متنوعة من الفطريات والنباتات واللافقاريات إلى الفقاريات ، بينما كان العكس بالنسبة لأطوال exon. تشير الخصائص الإحصائية لمنظمة الجينوم حقيقية النواة إلى أن السمات الخاصة بالجينوم يتم الحفاظ عليها من خلال عمليات تطورية متنوعة ، مما يمهد الطريق لمزيد من البحث حول تنويع تطور حقيقيات النوى.

هيكل Exon-Intron ، جينوم حقيقيات النوى ، التطور

يتكون جين حقيقي النواة النموذجي من إكسونات متعددة تقاطعها الإنترونات وتتفاوت أعدادها بشكل كبير بين الأنواع حقيقية النواة [1]. تتم إزالة الإنترونات عن طريق ربط الحمض النووي الريبي (RNA) أثناء إنشاء منتج النسخ الناضج النهائي. التضفير البديل (AS) هو عملية ما بعد النسخ في الكائنات حقيقية النواة والتي يتم من خلالها إنتاج نسخ مميزة متعددة من جين واحد [2]. أفادت الدراسات السابقة التي تستخدم تقنية التسلسل عالي الإنتاجية أن ما يصل إلى 92٪ - 94٪ من الجينات البشرية متعددة exon تخضع لـ AS [3] [4] ، غالبًا بطريقة الأنسجة / مرحلة النمو المحددة [3] [5]. يتم التعرف على مواقع لصق عبر منطقة محمية للغاية من النيوكليوتيدات (nt) ويؤثر طول الإنترون بشكل كبير على كفاءة الربط السابق للـ mRNA واختيار موقع لصق بديل [6].

في الفقاريات ، توجد إنترونات طويلة نسبيًا وإكسونات قصيرة ، بينما تكون معكوسة في حقيقيات النوى السفلية [7]. اقترحت جينوم حقيقيات النوى المقارن أن تطور الإنترون هو عملية ديناميكية في حقيقيات النوى ، وقد تم اكتساب الإنترونات وفقدها في جينومات مختلفة استجابة لضغوط انتقائية قوية [8]. على الرغم من الحفاظ على القدرة الأساسية لحقيقيات النوى على لصق الإنترونات ، فإن إشارات التضفير تتطور وتشكل إلى آليات تضفير مختلفة في أنواع متنوعة [9] [10]. أشار تحليل مقارن لإشارات التضفير الأساسية إلى أن التعرف القصير على الإنترون كان عرضة للتغيرات التطورية في حقيقيات النوى ، لكن النمط العام للتعرف على الإنترون كان محفوظًا جيدًا في الثدييات [11]. يقترح أن هناك ارتباطًا خاصًا بالأنواع بين اختلاف طول exon و intron في الجينوم. روي وآخرون. وجد أن exons حديثة النشأة كانت أكثر شيوعًا في الإنترونات الأطول (& gt1000 nt) مقارنة بالإنترونات القصيرة (& lt400 nt) في جينومات الفقاريات [12]. يمكن أن تكون الإنترونات الكبيرة خزانًا للتنوع الجيني ، ويمكنها تعزيز AS عبر تخطي exon ودوران exon أثناء التطور [13]. إن توفر التسلسلات الجينية والشروح يجعل من الممكن دراسة العديد من الأسئلة التطورية الأساسية على مقياس الجينوم. تنوع هياكل exon-intron بين جينومات حقيقية النواة يجعلها جذابة للغاية لاستكشاف أسئلة تطور بنية exon-intron.

في هذه الدراسة ، أجرينا مسحًا شاملاً لبنية exon-intron في 72 كائنًا حقيقيًا للنواة ، بما في ذلك 17 نباتًا و 11 نوعًا من الفطريات و 12 لافقاريًا و 32 فقاريًا. تؤكد نتائجنا أن أطوال وأعداد الإنترونات تختلف باختلاف جينومات حقيقية النواة. تم العثور على كل من السمات العامة والخاصة بالجينوم لمنظمة exon-intron في جينات حقيقية النواة. كشف هذا التحليل الإحصائي لبنية exon-intron عن بعض الخصائص المتنوعة في جينومات حقيقيات النوى. قد توفر هذه النتائج أدلة لتوضيح الآليات المشاركة في تنظيم جينومات حقيقية النواة وكذلك تطور بنية الجينات.

2.1. مصادر البيانات والتحليل الإحصائي

تم تنزيل بيانات شرح الجينوم الكامل للحيوانات والفطريات من قاعدة بيانات Ensembl (الإصدار 67) (http://www.ensembl.org/). تم تنزيل البيانات الجينومية للنباتات من JGI (//www.jgi.doe.gov/). للراحة ، قمنا بتصنيف 72 نوعًا إلى أربع مجموعات: الفطريات والنباتات واللافقاريات والفقاريات. تم إجراء التحليلات الإحصائية باستخدام حزمة Perl. تم استخراج معلومات البنية الجينية بما في ذلك أرقام وأطوال exon / intron وتسلسلها من بيانات الجينوم المقابلة. للحصول على بيانات موثوقة فقط ، طبقنا المعايير الصارمة التالية لجودة المحاذاة. 1) يجب أن يكون intron أطول من 5 nt ، حيث يتطلب الربط بين intron "الحد الأدنى" من خمسة نيوكليوتيدات (GU-AG بالإضافة إلى A لنقطة الفرع) [14]. 2) بالنسبة للجينات التي تحتوي على العديد من الأشكال الإسوية للربط البديل ، فقد احتفظنا بالشكل الإسوي الذي ينتج أطول مرنا للتحليل الإحصائي.

2.2. مقارنة حدود Exon-Intron

بالإضافة إلى أرقام وأطوال exon / intron الإجمالية التي تم إنشاؤها من التسلسلات المتاحة ، حصلنا أيضًا على بيانات حدود exon / intron لـ 6 كائنات Homo sapiens و Danio rerio و Drosophila melanogaster و Caenorhabditis elegans و Saccharomyces cerevisiae و Arabidopsis thaliana. قمنا ببناء ملفات تعريف العزر في هذه الأنواع التمثيلية الستة ، باستخدام تسلسلات intron المستخرجة. تم تصوير نماذج التسلسل لموقع لصق 5 (5 سن) و 3 مواقع لصق (3 سنون) كشعارات متسلسلة بواسطة WebLogo http://weblogo.berkeley.edu/. لقد استخرجنا أيضًا النوكليوتيدات العشرة المجاورة (nt) من المنبع والمصب لكل موقع لصق ، وقمنا بتحليل حفظ إشارات موقع لصق 5 و 3.

3.1. تحليل مقارن للجينات حقيقية النواة مع Exons

أظهر مسح شامل لـ 72 كائنًا حقيقيًا النواة أن معظم الجينات حقيقية النواة تحتوي على أقل من 5 exons عبر مجموعات مختلفة. بشكل أساسي ، تنخفض نسبة أرقام الجينات مع زيادة عدد exon (الجدول 1). باختصار ، تتراوح نسبة الجينات التي تحتوي على إكسون واحد من 28٪ إلى 9٪ في أربع مجموعات. في الفطريات نسبة الجينات ذات 1 - 5 اكسونات هي 91.21٪ مما يدل على أن الجينات الفطرية أبسط من المجموعات الأخرى. تمثل النسب المئوية للجينات ذات 1-5 exons في النباتات واللافقاريات ما يقرب من الثلثين. على العكس من ذلك ، من بين تلك الجينات التي تحتوي على أكثر من خمسة إكسونات ، فإن نسبها تزايدي من الفطريات إلى الفقاريات. الحالة القصوى هي أن جميع الجينات تقريبًا في S. cerevisiae تحتوي على 1-5 إكسونات (99.97٪) ، مقارنة بـ 33.85٪ فقط في الميليجريس (meleagris gallopavo ، الفقاريات)

الجدول 1 . تحليل مقارن للجينات حقيقية النواة مع exons.

(الجدول S2). مجتمعة ، تشير هذه النتائج إلى أن الجينات لديها عدد من exons في الفقاريات أكثر من غيره.

3.2 تحليل توزيع طول إكسون

يوضح الجدول 2 التوزيعات المتنوعة لطول exon في المجموعات الأربع. من الواضح أن exons القصيرة (& lt250 nt) منتشرة عبر مختلف حقيقيات النوى. في الفطريات ، كانت النسبة المئوية للإكسونات القصيرة 42.740٪ فقط ومتوسط ​​طول الإكسونات الفطرية أكبر (589 نانومتر) من المجموعات الثلاث الأخرى (188 ، 257 و 386 ، على التوالي). في الفقاريات ، يكون طول معظم exons (87.737٪) أقل من 250 nt (الجدول 2 والجدول S1). كانت النسبة المئوية للإكسونات الطويلة (& gt500 nt) 36.575٪ في الفطريات ، بينما انخفضت النسب المقابلة من 21.685٪ ، 9.977٪ إلى 5.582٪ في النباتات واللافقاريات والفقاريات على التوالي. تشير هذه النتائج إلى أن أطوال exon تختلف عبر المملكة حقيقية النواة مع وجود عدد أكبر من exons القصير في الفقاريات.

3.3 تحليل خصائص Intron

وفقًا للبيانات التي استخدمناها (إصدار Ensembl 67) ، يحتوي الجينوم البشري على 20687 جينًا لترميز البروتين مع الإنترونات و 1713 (7 ٪) من جينات ترميز البروتين الخالية من الإنترون. إجمالاً ، هناك 200.220 إنترون في جينات ترميز البروتين البشري ، وبالتالي فإن متوسط ​​عدد الإنترونات لكل جين هو 8.94 في الجينوم البشري. يختلف عدد الإنترونات لكل جين بشكل كبير بين حقيقيات النوى المتنوعة ، بما في ذلك الفطريات (0.05 - 3.43 إنترون لكل جين) ، والنباتات (0.33 - 7.30 إنترون لكل جين) ، واللافقاريات (2.92 - 7.42 إنترون لكل جين) والفقاريات (7.35 - 10.09 إنترون لكل جين) الجين) (الجدول S1). أظهر هذا التحليل الإحصائي أن هناك مجموعة متنوعة من كثافات intron في جينومات حقيقية النواة المعقدة أكثر شيوعًا في حقيقيات النوى الأعلى من حقيقيات النوى الأدنى.

تمشيا مع الدراسات الأخرى [15] [16] ، تظهر نتائجنا أن الإنترونات الطويلة الوفير موجودة في الفقاريات. ما يقرب من 48.512 ٪ من الإنترونات في الفقاريات يبلغ طولها 1000 طن (الجدول 3). بشكل عام ، تعد الإنترونات الفطرية قصيرة نسبيًا ، 93.627٪ من الإنترونات في الفطريات أقصر من 250 نانومتر. في اللافقاريات والنباتات ، متوسط ​​النسب المئوية للإنترونات القصيرة (& lt250 nt) هي 48.320٪ و 59.847٪ على التوالي.بشكل استثنائي ، هناك توزيع محدد للإنترونات القصيرة في teleosts. كان متوسط ​​طول introns في أسماك teleost أصغر بكثير من متوسط ​​طول الفقاريات الأخرى. علاوة على ذلك ، فإن النسبة المئوية للإنترونات القصيرة (& lt250 nt) تتراوح بين 32.17٪ - 67.06٪ (بمتوسط ​​52.89٪) في أسماك teleost الخمسة ، ولكن فقط

18٪ في جميع الفقاريات الأخرى (الشكل 1 والجدول S1).

الجدول 2 . مقارنة طول exon بين الأنواع المختلفة.

الجدول 3 . مقارنة طول intron بين الأنواع المختلفة.

شكل 1 . توزيع الإنترونات القصيرة في teleosts وبعض الفقاريات التمثيلية. النسبة المئوية للإنترونات القصيرة (& lt250 nt) في أسماك teleost الخمسة هي حوالي ضعف النسبة في الفقاريات الأخرى. H. sapiens: Human G. gorilla: Gorilla M. musculus: Mouse O. anatinus: Platypus M. gallopavo: Turkey A. carolinensis: Anole lizard X. Tropis: Xenopus D. rerio: Zebrafish G. aculeatus: Stickleback O. latipes: Medaka T. rubripes: Fugu T. nigroviridis: Tetraodon P. marinus: لامبري.

في جميع الأنواع المرصودة ، كمثال متطرف ، أصغر نسبة من الإنترونات القصيرة هي 5٪ فقط في اللافقاريات (Strongylocentrotus purpuratus ، قنفذ البحر). ومع ذلك ، فإن عدد الإنترونات (157214) في قنفذ البحر كبير للغاية ، وهو حوالي ضعف عدد اللافقاريات الأخرى (82398). في المجموعة النباتية ، كان طول الإنترونات صغيرًا (183 نانومتر) في ثلاثة طحالب من Ostreococcus ، مع قيمة أقل بكثير من متوسط ​​قيمة النباتات الأخرى (329 نانومتر) ، بينما كانت exons أكبر بكثير (912 نانومتر) من النباتات الأخرى (386 نانومتر). ) (الجدول S1).

على الرغم من أن العدد الإجمالي للإنترونات متشابه بين teleosts ، فإن متوسط ​​طول intron يختلف اختلافًا كبيرًا في أسماك teleost الخمسة (الجدول 4 والجدول S1). معظم الإنترونات في teleosts صغيرة ومتشابهة في الطول ، ومع ذلك فإن إنترونات الزرد أطول بكثير (2820 nt) من teleosts الأخرى (480-1180 nt) و 49.911٪ من introns في الزرد هي أكثر من 1000 nt. بالإضافة إلى ذلك ، أشارت نتائجنا إلى أن ذروة توزيع طول الإنترون في حدود 50-110 nt في teleosts (الشكل S1) ومعظم حقيقيات النوى. تتوافق القمم مع التقارير السابقة ، والتي تظهر توزيعًا نموذجيًا ثنائي النسق في العديد من حقيقيات النوى [17] [18] [19].

الجدول 4. مقارنة طول intron بين أسماك teleost.

1 رقم: عدد الإنترونات 2 (٪): النسبة المئوية للإنترونات.

3.4. تحليل مقارن لحدود Exon-Intron في حقيقيات النوى

قمنا بتحليل نماذج إشارات الربط الكلاسيكية لكل كائن حي. تكشف نتائج ستة أنواع تمثيلية من أربع مجموعات (H. sapiens و D. rerio و D. melanogaster و C. elegans و S. cerevisiae و A. thaliana) عن ملامح نموذجية معروفة جيدًا للإنترونات ضمن النطاق 51-70 NT (الشكل 2) وأطول. على الرغم من تشابهها مع بعضها البعض ، تُظهر ملامح الشكل بعض الاختلافات والخصائص بين الأنواع المختلفة. النيوكليوتيدات المجاورة حول كل موقع لصق بعيدة كل البعد عن العشوائية. وهي تتألف من تسلسلين إجماعيين متميزين لموقع لصق 5 (5’ss) وموقع لصق 3 (3 ’s) على حدود exon-intron [20]. الحفاظ على 5’ss و 3’ss أقل في الزرد والإنسان مقارنة بالأنواع الأخرى (الشكل 2). بالنسبة للإنترونات التي يبلغ طولها من 6 إلى 50 نانومتر ، لا يتم حفظ مواقع اللصق في الخميرة وسمك الزرد والإنسان (الشكل S2). يتم تمييز العديد من البنى الجينومية حقيقية النواة من خلال exons الصغيرة والإنترونات المرافقة ذات الطول المتغير. يكون التعرف على موقع لصق أكثر كفاءة عندما تكون الإنترونات أو الإكسونات صغيرة ، مما يبدو أنه يفضل عوامل التضفير المتنوعة من أجل التضفير البديل [21].

يتضمن هذا العمل تحليلًا إحصائيًا لبنية exon-intron في عدد كبير من حقيقيات النوى. أجرينا مقارنات تفصيلية لهياكل exon-intron وكشفنا عن بعض الخصائص المعقدة لجينومات حقيقية النواة. تختلف هياكل exon-intron لجينات حقيقيات النوى عبر المملكة حقيقية النواة ، ويزيد تطور مثل هذه الهياكل في التعقيد من حقيقيات النوى الأدنى إلى حقيقيات النوى الأعلى. ملاحظاتنا متوافقة إلى حد كبير مع تلك التي تم الإبلاغ عنها سابقًا وتعززها فيما يتعلق بالإنترونات والإكسونات [9] [17] [22].

4.1 تعقيد متزايد لهياكل Exon-Intron في تطور حقيقيات النوى

يمكن أن توضح مقارنة هياكل exon-intron مدى تعقيد التنوع الجيني بين حقيقيات النوى. هناك اتجاه يظهر زيادة عامة في

الشكل 2 . مقارنة بين أشكال إشارة التضفير في ستة أنواع لـ 51-70 nt introns. يتم تصوير أشكال التسلسل لـ 5’ss و 3 ’s كشعارات تسلسل.

كثافات وأطوال intron في الأنواع من الفطريات والنباتات واللافقاريات إلى الفقاريات. الاتجاه معكوس بالنسبة لأطوال exon (الشكل 3).

تختلف أحجام Intron بشكل كبير داخل كل مجموعة (الفطريات والنباتات واللافقاريات والفقاريات). على عكس طول الإنترون ، فإن متوسط ​​أطوال الإكسونات أكثر تشابهًا في كل مجموعة. تشير مجموعة متزايدة من الأدلة إلى أن الإنترونات تلعب عددًا من الأدوار الوظيفية. تحتوي العديد من الإنترونات على رنا وظيفية غير مشفرة ، والتي تلعب أدوارًا حيوية في ضبط التعبير الجيني الدقيق [23]. يبدو أن طول الإنترون يرتبط ارتباطًا إيجابيًا بالتعبير في حقيقيات النوى أحادية الخلية ويرتبط سلبًا بالتعبير في حقيقيات النوى متعددة الخلايا [24]. علاوة على ذلك ، فهو ارتباط سلبي بين حجم intron ومستوى التعبير عن الجينات في الديدان الخيطية والبشر ، مما يشير إلى أن الانتقاء الطبيعي يفضل الإنترونات القصيرة في الجينات المعبر عنها بشكل كبير لتقليل تكلفة النسخ [25]. على عكس حجم الإنترون ، فإن كثافة الإنترونات في الجين لا تعتمد بشدة على مستوى التعبير الجيني [25]. جيفاريس وآخرون. وجد أن كثافة الإنترون ترتبط بلوغاريتم وقت التوليد. تميل الكائنات الحية التي تتكاثر بسرعة إلى الحصول على عدد أقل من الإنترونات من الكائنات الحية التي لها عمر أطول

الشكل 3. اتجاهات طول exon / intron والكثافة في حقيقيات النوى.

دورات [8]. قد يكون هذا نتيجة لاختيار الانقسام الخلوي السريع أو التعبير الجيني.

لقد ثبت أيضًا أن بنية exon-intron تؤثر على التعرف على موقع لصق. يكون التعرف على موقع لصق أكثر كفاءة عندما تكون الإنترونات أو الإكسونات صغيرة [21] [26]. تمتلك حقيقيات النوى السفلية بنية جينية تتميز بإنترونات صغيرة وإكسونات محاطة بأطوال متغيرة ، مما يشير إلى أن التعرف على موقع اللصق يحدث عبر الإنترون [27]. أظهر تحليلنا بعض الإنترونات الصغيرة والإكسونات الكبيرة في معظم الفطريات وبعض الطحالب ، وهو ما يتوافق مع تقرير سابق [21]. جيفاريس وآخرون. اقترح أن بعض الجينات على ما يبدو تحت ضغط انتقائي لتقليل الإنترونات [8]. على سبيل المثال ، يبلغ متوسط ​​حجم intron 124 نقطة أساس فقط في Ostreococcus tauri ، وهي أصغر حقيقيات نواة حرة في العالم معروفة حتى الآن [28]. إنها إستراتيجية معقولة أن الطحالب الخضراء يمكن أن تختار الإنترونات الصغيرة لاقتصاد تكلفة الطاقة من انخفاض طول النص ، وتكييف البيئة البحرية المتغيرة لتجاوز القيود التي يفرضها الضوء أو قيود المغذيات [29].

4.2 هيكل Exon-Intron الخاص بالنسب في Teleosts

عدد وطول الإنترونات يختلف اختلافا كبيرا بين الكائنات الحية المختلفة. تشكل سلاسل الإنترون 24٪ من جينومات الثدييات وأكثر من 95٪ من متواليات الجينات البشرية [30] [31]. تظهر دراستنا أن teleosts تحتوي على إنترونات أكثر وأصغر (& lt250 nt) من الفقاريات الأخرى (الشكل 1 والجدول S1). قد تكون بنية exon-intron المحددة هذه مرتبطة بحدث الازدواج الجيني المحدد في teleosts نظرًا لأن التعقيد الجينومي للتليوستات كان من المفترض أن يكون ناتجًا عن حدث ازدواج الجينوم الكامل الخاص بالأسماك (FSGD) [32]. من اللافت للنظر أن introns of zebrafish أكبر بكثير مقارنة مع teleosts الأخرى. يمكن أن تقدم الإنترونات الكبيرة العديد من المشاكل للكائنات ، بما في ذلك حساب النسخ وصعوبة تضفير الإنترونات الكبيرة [33]. كشف التحليل المقارن لتسلسلات جينوم teleost عن توسع قديم في حجم intron في سلالة الزرد [14]. قد يكون أحد التفسيرات المحتملة لحجم intron الصغير في teleosts الأخرى هو الضغط للحفاظ على حجم الجينوم المقيد في هذه الكائنات سريعة التكاثر. يمكن أن يرتبط أيضًا بحدث FSGD الذي أثار التنوع المذهل الذي لوحظ في أسماك teleost (

29000 نوع ، ما يقرب من نصف جميع الفقاريات) [32].

4.3 وفرة الإنترونات هي خزان أنماط AS في حقيقيات النوى

أظهر تحليلنا أن الإنترونات مرتبة بشكل غير عشوائي في حقيقيات النوى المتنوعة. عادة ما تنقسم جينات الفقاريات إلى العديد من exons الصغيرة التي يتم قطعها بواسطة إنترونات أكبر بكثير. في تحليلنا الإحصائي ، هناك إنترونات طويلة نسبيًا وإكسونات قصيرة في 32 نوعًا من الفقاريات. إنه اتجاه أن طول الإنترون قد توسع تدريجياً في الأسماك والبرمائيات والزواحف والأفاريز والثدييات (الجدول S1). يشير تحليلنا إلى أن الإنترونات الفقارية زادت في الطول أثناء تطور الفقاريات. أشارت الدراسات السابقة إلى أن طول الإنترون قد توسع تدريجيًا بين الثدييات ، بينما ظل طول الإكسونات ثابتًا نسبيًا [34]. أدت بعض النتائج إلى تكهنات بأن الجسيمات المتراكبة في الثدييات تتعرف بشكل أساسي على exons في عملية تسمى تعريف exon ، على عكس ذلك في الفطريات حيث يتم الاحتفاظ بالإنترونات قصيرة ويُعتقد أنها الوحدة المعترف بها في عملية تسمى تعريف intron [34] [35].

يمكن أن تعكس أطوال Intron و exon القيود المفروضة من خلال التعرف على الربط ، بناءً على ما إذا كان يتم تحديد exon من خلال آلية تعريف intron أو exon. يمكن أن يكون عدد كبير من الإنترونات الطويلة مستودعًا للتنوع الجيني في الفقاريات ، ويمكنها تسهيل اختيار عوامل التضفير المختلفة لـ AS أثناء التطور. ترتبط أطوال الإنترون المختلفة بأنواع مختلفة من AS [36]. يمكن أن تعيق الإنترونات الطويلة نشاط التضفير من خلال التداخل مع الموضع الصحيح للتقسيم عند تقاطعات exon-intron [36]. تميل الإنترونات القصيرة إلى أن تحاط بمواقع لصق ضعيفة وتميل الإنترونات الطويلة إلى إحاطة exons بمواقع لصق قوية [16] [37]. يكون AS أكثر وفرة في حقيقيات النوى الأعلى منه في حقيقيات النوى الأدنى ، ونسبة الجينات التي تخضع لـ AS أعلى في الفقاريات منها في اللافقاريات [7]. في الآونة الأخيرة ، اقترح تحقيق على مستوى الجينوم لمحات AS عبر الأعضاء والأنواع في أنواع الفقاريات ، أن تغيرات AS قد تكون قوة دافعة نحو زيادة التعقيد الخلوي أثناء انتواع الفقاريات [38]. ومع ذلك ، أكد بحث حديث أن التحولات الحدودية والانزلاق الكامل لل intron هي عرضية فقط في تطور جينوم حقيقيات النوى [39]. عدد الإنترونات في الفقاريات أكثر من السلالات الأخرى ، لذلك فمن المعقول أن نفترض أن انتشار AS في الفقاريات هو أمر محوري لتعقيدها المظهري العالي [40].

بشكل عام ، تُظهر نتائجنا كلاً من السمات العامة والخاصة بالجينوم لهياكل exon-intron للجينات حقيقية النواة. يزداد تطور هياكل exon-intron في التعقيد من حقيقيات النوى المنخفضة إلى حقيقيات النوى الأعلى. تم العثور على بعض خصائص الجينوم الخاصة بالأنواع في العديد من التليوستس وحقيقيات النوى السفلية. كشفت إعادة التحليل هذه للتنظيم الجينومي حقيقيات النوى عن بعض الخصائص الخاصة بالنسب للإكسونات والإنترونات ، والتي تمهد الطريق لمزيد من البحث حول حفظ وتنويع تطور حقيقيات النوى.

نود أن نشكر الدكتور يانغ وانغ وجون يان للحصول على المشورة بشأن هذه الدراسة. تم دعم هذا العمل من قبل الصندوق التالي: مؤسسة العلوم للصحة وتنظيم الأسرة في مقاطعة هوبى (WJ2016-Y-02).

Li ، Y.F. ، Xu ، Y.H. وما ، Z.W. (2017) تحليل مقارن لهيكل Exon-Intron في جينوم حقيقيات النوى. طب اليانغتسي ، 1 ، 50-64. https://doi.org/10.4236/ym.2017.11006

    روي ، س. and Gilbert، W. (2006) The Evolution of Spliceosomal Introns: Patterns، Puzzles and التقدم. مراجعات الطبيعة علم الوراثة، 7 ، 211-221.
    https://doi.org/10.1038/nrg1807
    غرافيلي ، ب. (2001) الربط البديل: زيادة التنوع في العالم البروتيني. الاتجاهات في علم الوراثة ، 17 ، 100-107.
    https://doi.org/10.1016/S0168-9525(00)02176-4
    وانغ ، إت ، ساندبرغ ، آر ، لو ، إس ، خريبتوكوفا ، آي ، زانغ ، إل ، ماير ، سي ، كينجزمور ، إس إف ، سكروث ، جي بي. and Burge ، CB (2008) التنظيم البديل Isoform في ترانسكريبتوم الأنسجة البشرية. الطبيعة ، 456 ، 470-476.
    https://doi.org/10.1038/nature07509
    Pan ، Q. ، Shai ، O. ، Lee ، L.J. ، Frey ، BJ and Blencowe ، BJ (2008) المسح العميق لتعقيد الربط البديل في النسخ البشري عن طريق التسلسل عالي الإنتاجية. علم الوراثة الطبيعي ، 40 ، 1413-1415.
    https://doi.org/10.1038/ng.259
    ستام ، إس ، بن آري ، إس ، رافالسكا ، آي ، تانغ ، واي ، زانغ ، زد ، تويبر ، دي ، ثانراج ، تي إيه. and Soreq، H. (2005) وظيفة الربط البديل. الجين ، 344 ، 1-20.
    هيرتل ، ك. (2008) التحكم الاندماجي في التعرف على Exon. مجلة الكيمياء البيولوجية ، 283 ، 1211-1215.
    https://doi.org/10.1074/jbc.R700035200
    Keren، H.، Lev-Maor، G. and Ast، G. (2010) Alternative Splicing and Evolution: Diversification، Exon Definition and Function. مراجعات الطبيعة علم الوراثة، 11، 345-355.
    https://doi.org/10.1038/nrg2776
    جيفاريس ، دي سي ، مورييه ، تي وبيني ، دي. (2006) بيولوجيا كسب وخسارة Intron. الاتجاهات في علم الوراثة ، 22 ، 16-22.
    https://doi.org/10.1016/j.tig.2005.10.006
    شوارتز ، S.H. ، Silva ، J. ، Burstein ، D. ، Pupko ، T. ، Eyras ، E. and Ast ، G. (2008) تحليل مقارن واسع النطاق لإشارات الربط وعوامل الربط المقابلة لها في حقيقيات النوى. أبحاث الجينوم، 18، 88-103.
    https://doi.org/10.1101/gr.6818908
    شيث ، إن ، روكا ، إكس ، هاستينغز ، إم إل ، رويدر ، تي ، كرينر ، إيه. and Sachidanandam، R. (2006) التحليل الشامل لموقع لصق باستخدام علم الجينوم المقارن. بحوث الأحماض النووية ، 34 ، 3955-3967.
    Iwata، H. and Gotoh، O. (2011) التحليل المقارن لمحتويات المعلومات ذات الصلة بالتعرف على الإنترونات في العديد من الأنواع. علم الجينوم BMC ، 12 ، 45.
    https://doi.org/10.1186/1471-2164-12-45
    Roy، M.، Kim، N.، Xing، Y. and Lee، C. (2008) The Effect of Intron Length on Exon Creation Ratios أثناء تطور جينومات الثدييات. RNA، 14، 2261-2273.
    https://doi.org/10.1261/rna.1024908
    كاندول ، ن. نور ، ماجستير (2009) الإنترونات الكبيرة فيما يتعلق بالربط البديل وتطور الجينات: دراسة حالة عن ذبابة الفاكهة برونو -3. علم الوراثة BMC، 10 ، 67.
    https://doi.org/10.1186/1471-2156-10-67
    موس ، س.ب. ، جويس ، د. ، همفريز ، س ، تندال ، ك.ج. and Lunt ، D.H. (2011) التحليل المقارن لتسلسل الجينوم Teleost يكشف عن توسع قديم في حجم Intron في سلالة الزرد. بيولوجيا الجينوم وتطوره ، 3 ، 1187-1196.
    https://doi.org/10.1093/gbe/evr090
    Gelfman، S.، Burstein، D.، Penn، O.، Savchenko، A.، Amit، M.، Schwartz، S.، Pupko، T. and Ast، G. (2012) التغييرات في بنية Exon-Intron أثناء الفقاريات التطور يؤثر على نمط الربط من Exons. أبحاث الجينوم ، 22 ، 35-50.
    https://doi.org/10.1101/gr.119834.110
    ديوي ، سي إن ، روجوزين ، آي بي. وكونين ، إي. (2006) العلاقة التعويضية بين مواقع لصق وإشارات الربط الخارجية اعتمادًا على طول الإنترونات الفقارية. علم الجينوم BMC، 7 ، 311.
    https://doi.org/10.1186/1471-2164-7-311
    Deutsch، M. and Long، M. (1999) هياكل Intron-Exon للكائنات النموذجية حقيقية النواة. بحوث الأحماض النووية ، 27 ، 3219-3228.
    https://doi.org/10.1093/nar/27.15.3219
    Bon، E.، Casaregola، S.، Blandin، G.، Llorente، B.، Neuveglise، C.، Munsterkotter، M.، Guldener، U.، Mewes، HW، Van Helden، J.، Dujon، B. and Gaillardin، C. (2003) التطور الجزيئي لمورثات حقيقيات النوى: الخميرة اللاصقة Hemiascomycetous Interons. بحوث الأحماض النووية ، 31 ، 1121-1135.
    https://doi.org/10.1093/nar/gkg213
    رودريغيز مدينا ، جيه آر وريموند ، كولومبيا البريطانية (1994) انتشار وتوزيع الإنترونات في جينات الخميرة البروتينية غير الريبوزومية. علم الوراثة الجزيئية والعامة MGG، 243، 532-539.
    https://doi.org/10.1007/BF00284201
    باتيل ، أ. وستيتز ، ج. (2003) Splicing Double: رؤى من Spliceosome الثاني. مراجعات الطبيعة بيولوجيا الخلية الجزيئية ، 4 ، 960-970.
    https://doi.org/10.1038/nrm1259
    ستيرنر ، دي إيه ، كارلو ، تي وبيرجيت ، إس إم. (1996) الحدود المعمارية على الجينات المنقسمة. وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية ، 93 ، 15081-15085.
    https://doi.org/10.1073/pnas.93.26.15081
    Lim، L.P. and Burge، CB (2001) تحليل حسابي لميزات التسلسل المتضمنة في التعرف على الإنترونات القصيرة. وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية ، 98 ، 11193-11198.
    https://doi.org/10.1073/pnas.201407298
    Rearick ، ​​D. ، Prakash ، A. ، McSweeny ، A. ، Shepard ، S.S. ، Fedorova ، L. and Fedorov ، A. (2011) Critical Association of ncRNA with Introns. بحوث الأحماض النووية ، 39 ، 2357-2366.
    https://doi.org/10.1093/nar/gkq1080
    فينوغرادوف ، إيه إي (2001) طول إنترون واستخدام كودون. مجلة التطور الجزيئي ، 52 ، 2-5. https://doi.org/10.1007/s002390010128
    Castillo-Davis ، C.I. ، Mekhedov ، S.L. ، Hartl ، DL ، Koonin ، E.V. and Kondrashov، FA (2002) اختيار الإنترونات القصيرة في الجينات عالية التعبير. Nature Genetics، 31، 415-418.
    https://doi.org/10.1038/ng940
    بيرجيت ، إس. (1995) التعرف على Exon في الربط الفقاري. مجلة الكيمياء البيولوجية ، 270 ، 2411-2414.
    https://doi.org/10.1074/jbc.270.6.2411
    روبي ، إس دبليو. and Abelson، J. (1991) Pre-mRNA Splicing in Yeast. الاتجاهات في علم الوراثة، 7 ، 79-85.
    Derelle، E.، Ferraz، C.، Rombauts، S.، Rouze، P.، Worden، AZ، ​​Robbens، S.، Partensky، F.، Degroeve، S.، Echeynie، S.، Cooke، R.، Saeys ، Y. ، Wuyts ، J. ، Jabbari ، K. ، Bowler ، C. ، Panaud ، O. ، Piegu ، B. ، et al. (2006) تحليل الجينوم لأصغر حقيقيات النوى الحية الحرة Ostreococcus tauri يكشف عن العديد من الميزات الفريدة. وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية ، 103 ، 11647-11652.
    https://doi.org/10.1073/pnas.0604795103
    Cardol ، P. ، Bailleul ، B. ، Rappaport ، F. ، Derelle ، E. ، Beal ، D. ، Breyton ، C. ، Bailey ، S. ، Wollman ، FA ، Grossman ، A. ، Moreau ، H. and Finazzi (2008) تكيف أصلي لعملية التمثيل الضوئي في الطحالب الخضراء البحرية. وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية ، 105 ، 7881-7886.
    https://doi.org/10.1073/pnas.0802762105
    لاندر ، إس ، لينتون ، إل إم ، بيرين ، بي ، نوسباوم ، سي ، زودي ، إم سي ، بالدوين ، جي ، ديفون ، كيه ، ديوار ، ك ، دويل ، إم ، فيتزهيو ، دبليو ، فونك ، آر . ، Gage ، D. ، Harris ، K. ، Heaford ، A. ، Howland ، J. ، Kann ، L. ، et al.(2001) التسلسل الأولي وتحليل الجينوم البشري. الطبيعة ، 409 ، 860-921.
    https://doi.org/10.1038/35057062
    Venter ، JC ، Adams ، MD ، Myers ، EW ، Li ، PW ، Mural ، RJ ، Sutton ، GG ، Smith ، HO ، Yandell ، M. ، Evans ، CA ، Holt ، RA ، Gocayne ، JD ، Amanatides ، P. ، Ballew ، RM ، Huson ، DH ، Wortman ، JR ، Zhang ، Q. ، وآخرون. (2001) تسلسل الجينوم البشري. علم، 291، 1304-1351.
    https://doi.org/10.1126/science.1058040
    Meyer، A. and Van de Peer، Y. (2005) From 2R to 3R: Evidence for a Fish-Specific Genome Duplication (FSGD). BioEssays ، 27 ، 937-945.
    https://doi.org/10.1002/bies.20293
    شيبرد ، إس ، ماكريري ، إم وفيدوروف ، أ. (2009) خصائص الربط الكبير للإنترون في الحيوانات. بلوس وان ، 4 ، e7853.
    https://doi.org/10.1371/journal.pone.0007853
    Schwartz، S. and Ast، G. (2010) كثافة الكروماتين ومصير الربط: في الحديث المتبادل بين بنية الكروماتين والربط. مجلة EMBO ، 29 ، 1629-1636.
    https://doi.org/10.1038/emboj.2010.71
    أست ، ج. (2004) كيف تطور الربط البديل؟ مراجعات الطبيعة علم الوراثة ، 5 ، 773-782.
    https://doi.org/10.1038/nrg1451
    Kim، E.، Magen، A. and Ast، G. (2007) مستويات مختلفة من التضفير البديل بين حقيقيات النوى. بحوث الأحماض النووية ، 35 ، 125-131.
    https://doi.org/10.1093/nar/gkl924
    Weir، M. and Rice، M. (2004) التقسيم المطلوب يكشف عن معلومات توافق موقع لصق ممتدة. أبحاث الجينوم، 14، 67-78.
    https://doi.org/10.1101/gr.1715204
    Barbosa-Morais، NL، Irimia، M.، Pan، Q.، Xiong، HY، Gueroussov، S.، Lee، LJ، Slobodeniuc، V.، Kutter، C.، Watt، S.، Colak، R.، Kim ، T. ، Misquitta-Ali ، CM ، Wilson ، MD ، Kim ، PM ، Odom ، DT ، Frey ، BJ ، et al. (2012) المشهد التطوري للربط البديل في أنواع الفقاريات. علم ، 338 ، 1587-1593.
    https://doi.org/10.1126/science.1230612
    Bocco، SS and Cs & uumlr & oumls، M. (2016) نادرًا ما تنزلق مواقع لصق: تطور Intron في Oomycetes. بيولوجيا الجينوم وتطوره ، 8 ، 2340-2350.
    https://doi.org/10.1093/gbe/evw157
    Kornblihtt، A.R.، Schor، I.E.، Allo، M.، Dujardin، G.، Petrillo، E. and Munoz، M.J. (2013) Alternative Splicing: A Pivotal Step between Eukaryotic Transcription and Translation. مراجعات الطبيعة بيولوجيا الخلية الجزيئية ، 14 ، 153-165.
    https://doi.org/10.1038/nrm3525

الشكل S1. توزيع طول intron في خمسة أنواع teleost.

الشكل S2. مقارنة بين أشكال إشارة التضفير في ستة أنواع ضمن 6 - 50 nt introns.


الخطوات الأولى لفرضية الاستنباط

نقترح أن قدرة الخلية على تصفية النصوص الشاذة ، بالتنسيق مع التعرف على موقع لصق غير كامل [34 ، 35] ، قد توفر آلية قوية لتوليد الإنترونات اللاصقة. على وجه التحديد ، إذا تم تقسيم منطقة exonic تحتوي على PTC عن طريق الخطأ أثناء نضج mRNA ، وتم الاحتفاظ بإطار القراءة المفتوح (ORF) للنص ، فلن يتم استنباط مسار NMD بواسطة هذا النص ، مما يوفر الخطوة الأولى الرئيسية في التأسيس من intron جديد.

في هذا النموذج ، نقترح أن تسلسل ترميز البروتين الذي يحتوي لحسن الحظ على الحد الأدنى من معلومات التسلسل المطلوبة للتعرّف بوساطة لصق الجسيمات (انظر إشارات الربط في الشكل 1) لديها إمكانية كامنة للخضوع لعملية الربط والتداخل بعد اكتساب طفرات PTC التي تقاطع ORF من الرسالة. على الرغم من أن الربط لإزالة PTC قد يكون غير فعال في البداية ، فإن تدهور مجموعة النصوص غير المقسمة المحتوية على PTC بواسطة NMD سينتج مجموعة نقية نسبيًا من mRNAs الناضجة الخالية من PTC [21] ، وبالتالي الحفاظ على الأليل المقسم في حالة ربما لا تزال نشطة . يمكن بعد ذلك أن يخضع هذا الأليل للاختيار الإيجابي للطفرات اللاحقة التي تعمل على تحسين التضفير في المنطقة المعدلة.

من المرجح أن تتأسس الأليلات الطافرة ذات التضفير التعويضي لـ PTC إذا كانت تولد بروتينات تحتفظ ببعض النشاط على الأقل. وبالتالي ، نتوقع أن تشارك الإنترونات الناتجة عن هذه العملية خصائص معينة: (1) طول قصير ، وبالتالي تقليل عدد الكودونات المفقودة و (2) طول تسلسل مضاعف لثلاثة ، وذلك للحفاظ على ORF. أيضًا ، نظرًا لأن ظهور الإنترونات في exons الصغيرة سيؤدي إلى إنشاء اثنين من exons الأصغر حجمًا ، والذي قد يتم اختراق الربط الصحيح له [36] ، فإننا نتوقع إما أن الإنترونات لا تظهر أبدًا (أو نادرًا) في exons القصيرة أو أن intronization تتضمن اكسون كله. في الحالة الأخيرة ، على وجه الخصوص ، إذا لم يكن exon الصغير طرفيًا ، فإن عملية intronization ستؤدي إلى دمج اثنين من introns والإكسون المتضمن وبالتالي إلى خسارة intron بدلاً من ربحه. ما لم يكن لاستئصال تسلسل الترميز المعتمد حديثًا عواقب ضارة كبيرة بما فيه الكفاية ، فإن تثبيت الإنترون الجديد قد يكون محايدًا بشكل انتقائي أو يتم تعزيزه عن طريق الانتقاء الطبيعي.


توزيع أحجام Exon و Intron - علم الأحياء

التنبؤ الجيني في حقيقيات النوى

التعبير الجيني هو العملية البيولوجية التي يولد بها تسلسل الحمض النووي منتجها ، البروتين. يتضمن خطوتين: النسخ والترجمة. يستخدم بوليميراز RNA خيطًا واحدًا من DNA كقالب وينتج mRNA (messenger RNA). يعد تسلسل mRNA الناتج مكملاً لخيط DNA الذي تم استخدامه كقالب. تقوم العملية اللاحقة ، الترجمة ، بتجميع البروتين وفقًا للمعلومات المشفرة في mRNA. يتم تنفيذ هذه العملية في العناصر الخلوية الفرعية التي تسمى الريبوسومات.

في الرنا المرسال الناضج ، تمثل ثلاثة قواعد تسمى الكودونات حمضًا أمينيًا. تشير ثلاثة أكواد (UAA و UAG و UGA) إلى نهاية الترجمة. كود واحد ، AUG ، يشير إلى بدء الترجمة بالإضافة إلى رمز للحمض الأميني (Met). يمكن تفسير أي تسلسل نوكليوتيد معين (خيط DNA مفرد أو مرنا) بثلاث طرق ممكنة. تسمى هذه الطرق الثلاث إطارات القراءة. إطار القراءة المفتوح (ORF) هو سلسلة من الكودونات بدون كودون توقف. مناطق التشفير هي السمات الرئيسية لاستكشاف تسلسل الحمض النووي المميز الطويل. تسلسل الإشارة (أي تردد الكودون) هو ميزة مهمة بالنسبة لنا لتحديد الجين الوظيفي. في الفصل الأخير ، ناقشنا أيضًا طرق نموذج ماركوف ومصفوفات الوزن وتردد الكودون وما إلى ذلك للعثور على مناطق الكودون في بدائيات النوى.

هيكل جين حقيقيات النوى:

اليوم ، نواصل مناقشتنا حول اكتشاف الجينات لحقيقيات النوى. سنحاول دمج أنواع متعددة من معلومات الإشارة من أجل التنبؤ بهياكل الجينات بأكملها في التسلسلات الجينية. سنركز على الورقة التي أعدها Burge & amp Karlin. كدراسة حالة ، ننظر إلى برنامج كمبيوتر يسمى GENSCAN والذي يستخدم نموذجًا احتماليًا عامًا لتحديد الجينات.

تعتبر بنية الجينات وآلية التعبير الجيني في حقيقيات النوى أكثر تعقيدًا بكثير مما هي عليه في بدائيات النوى. كما هو الحال في بدائيات النوى ، تمتلك حقيقيات النوى أيضًا تسلسلات إشارات مثل المروجين ، بدء / إيقاف النسخ وبدء / إيقاف الترجمة ، لكن التسلسل قد يكون أكثر تنوعًا. يمتلك التعبير الجيني في حقيقيات النوى ميزات جديدة. تتم معالجة نسخ DNA إلى pre-mRNAs بواسطة RNA polymerase II في نواة الخلية. بعد جزيئات RNA الوليدة التي تنتجها RNA polymerase II ، تتم إضافة 5 & # 8242-Cap (7-methylguanosine). ينتهي النسخ بواسطة RNA polymerase II في أي واحد من مواقع الإنهاء المتعددة في اتجاه المصب من موقع poly (A) ، والذي يقع في 3 & # 8242 نهاية exon النهائي. بعد شق النسخة الأولية في موقع poly (A) ، تتم إضافة سلسلة من بقايا الأدينين (A). أثناء الخطوة الأخيرة في تشكيل mRNA الناضج والوظيفي ، تتم إزالة الإنترونات ويتم تقطيع الإكسونات معًا. يجب نقل mRNAs الناضجة إلى السيتوبلازم لمعالجة الترجمة.

في حقيقيات النوى النموذجية ، عادةً ما تكون منطقة ترميز الحمض النووي للبروتين غير مستمرة. تتكون هذه المنطقة من امتدادات متناوبة من exons و introns. أثناء النسخ ، يتم نسخ كل من exons و introns إلى RNA ، بترتيبها الخطي. بعد ذلك ، تحدث عملية تسمى الربط ، حيث يتم استئصال متواليات intron والتخلص منها من تسلسل الحمض النووي الريبي. طريقة الخلية لتحديد الإنترونات هي وجود إشارات لصق GT و AG التي تحدث دائمًا كأول وآخر ثنائي نيوكليوتيد للإنترون. يتم ربط أجزاء الحمض النووي الريبي المتبقية ، تلك المقابلة للإكسونات ، لتشكيل حبلا الحمض النووي الريبي الناضج. يمتلك الجين النموذجي متعدد exon الهيكل التالي. يبدأ بمنطقة المروج ، التي تليها منطقة مكتوبة ولكنها غير مشفرة تسمى 5 'منطقة غير مترجمة (5' UTR). ثم يتبع exon الأولي الذي يحتوي على كود البداية. بعد exon الأولي ، هناك سلسلة متناوبة من introns و exons الداخلي ، تليها exon إنهاء ، الذي يحتوي على كودون الإيقاف. تليها منطقة أخرى غير مشفرة تسمى 3 'UTR. إنهاء الجين حقيقيات النوى ، هناك إشارة polyadenylation (polyA): النيوكليوتيد Adenine يتكرر عدة مرات. العملية المهمة هي أن المنطقة التي تبدأ من 10-30 نيوكليوتيد بعد إشارة عديد الأدينيل ، عادةً AATAAA ، يتم تقطيعها واستبدالها بسلسلة من عدة مئات من A ، تسمى ذيل poly-A. يتم الإشارة إلى حدود exon-intron (أي مواقع لصق) بواسطة تسلسلات قصيرة محددة (طويلة 2bp). تسمى نهاية 5 '(3') من intron (exon) موقع المانح (Splicing Signal: GT) ، ونهاية 3 '(5') من intron (exon) تسمى المتقبل (Splicing Signal: AG ). نقطة الفرع هي نقطة ربط تظهر بشكل متكرر في intron. خاصية إحصائية أخرى هي منطقة غنية بالبيريميدين (القواعد C ، T) التي تظهر بين نقطة التفرع والموقع المستقبلي. من المحتمل أن يكون هناك 35٪ من الجينات يتم تقطيعها بشكل بديل ، مما يعني أنه في ظل ظروف مختلفة ، يتم اختيار مجموعات مختلفة من exons.

بعض السمات الإحصائية:

مثال جينات الفقاريات:

في المتوسط ​​، يمتد حوالي 6 إكسونات على جين فقاري طويل يبلغ 30 كيلو بايت. يبلغ متوسط ​​منطقة التشفير حوالي 1 كيلو بايت فقط. يبلغ طول كل إكسون حوالي 150 نقطة أساس. يبلغ طول المروج حوالي 6 نقاط أساس ويظهر حوالي 30 نقطة أساس في بداية موقع بدء النسخ (TSS).

هناك انحرافات كبيرة عن متوسط ​​بنية جين حقيقيات النوى. على سبيل المثال ، يبلغ طول جين الديستروفين حوالي 2.4 ميغا بايت. يختلف حجم 26 إكسونات في عامل تخثر الدم من 69 نقطة أساس إلى 3106 نقطة أساس. يبلغ إجمالي منطقة الترميز حوالي 186 كيلو بايت. الإنترونات تصل إلى 32.4 كيلو بايت. ينتج رقم Intron 22 نسختين لا علاقة لهما بهذا الجين ، واحد لكل خيط.

يبلغ متوسط ​​UTR 5 درجات 750 نقطة أساس ، ولكن يمكن أن يكون أطول ويمتد لعدة exons (على سبيل المثال ، في عائلة MAGE). في المتوسط ​​، يبلغ طول UTR 3 درجات حوالي 450 نقطة أساس ، ولكن توجد أمثلة حيث يتجاوز طوله 4 كيلو بايت (على سبيل المثال ، جين متلازمة كالمان).

الاختلاف في الحجم الكلي للجين وحجم intron:

هناك تباين كبير في الحجم الكلي للجين وحجم الإنترون. كثير من الجينات يزيد طولها عن 100 كيلو بايت. المثال الأقصى المعروف هو جين ديستروفين (DMD) (2.4 ميجا بايت). التباين في توزيع حجم تسلسلات الترميز والإكسونات أقل تطرفًا ، على الرغم من وجود بعض القيم المتطرفة الرائعة. يمتلك جين titin أطول تسلسل تشفير معروف حاليًا عند 80780 نقطة أساس ، كما أنه يحتوي أيضًا على أكبر عدد من exons (178) وأطول exon منفردًا (17106 نقطة أساس).

مقارنة بين جينات الإنسان والديدان والذباب:

طول تسلسلات التشفير.

تقع معظم exons الداخلية ضمن ذروة مشتركة بين 50 و 200 زوج قاعدي

توزيعات حجم إنترون تختلف اختلافا كبيرا

س دودة ويطير كل منهما ضيق بشكل معقول

o البشر لديهم توزيع أوسع بكثير

يؤدي التباين في حجم الإنترون إلى تباين كبير في حجم الجين

GENSCAN ، برنامج كمبيوتر لتحديد الجينات. يستخدم البرنامج مجموعة تدريب من الجينات المتسلسلة بالكامل من GenBank كمجموعة اختبار.

تتضمن بيانات التدريبات الخاصة بـ GeneScan ما يلي:

تشمل الميزات المهمة لـ GENSCAN ما يلي:

يحدد GENSCAN هياكل exon / intron الكاملة للجينات في DNA الجينومي.

يمكنه التنبؤ بجينات متعددة في تسلسل ، للتعامل مع الجينات الجزئية وكذلك الكاملة.

القدرة على التنبؤ بمجموعات متسقة من الجينات تحدث على أي من خيوط الحمض النووي أو كليهما.

القدرة على التنبؤ بكل من التعليقات التوضيحية المثلى و exons دون المستوى الأمثل.

تبين أن GENSCAN لديها دقة أعلى بكثير من الطرق الحالية عند اختبارها على مجموعات معيارية من الجينات البشرية والفقاريات. البرنامج قادر أيضًا على الإشارة بدقة إلى حد ما إلى موثوقية كل exon المتوقع.

تستخدم GENSCAN نماذج إشارة مختلفة لنمذجة وحدات وظيفية مختلفة. أحد النماذج هو نموذج مصفوفة الوزن (WMM) حيث يكون لكل موقع توزيع مستقل خاص به. يتم استخدامه لنمذجة إشارات عديد الأدينيل وإشارة بدء الترجمة وإشارة إنهاء الترجمة والمروجين.

موديلات مصفوفة الوزن (WMMS)

تم تصميم إشارات Polyadenylation على شكل 6 bp WMM (الإجماع: AATAAA).

يستخدم نموذج WMM 12 bp ، يبدأ 6 bp قبل رمز البدء ، لإشارة بدء الترجمة.

بالنسبة لإشارة إنهاء الترجمة ، يتم إنشاء أحد أكواد الإيقاف الثلاثة وفقًا للتردد الملحوظ في مجموعة التعلم ويتم إنشاء النيوكليوتيدات الثلاثة التالية وفقًا لـ WMM.

المروج: نظرًا لأن حوالي 30 ٪ من مروجي حقيقيات النوى يفتقرون إلى إشارة TATA واضحة ، وبالتالي ، يستخدم GENSCAN نموذجًا منقسمًا يتم فيه إنشاء مروج يحتوي على TATA مع احتمال 0.7 ومروج أقل TATA مع احتمال 0.3. تم تصميم المروج المحتوي على TATA باستخدام 15 bp TATA-box WMM وإشارة WMM ذات غطاء 8 bp. يتم إنشاء الطول بين WMMs بشكل موحد من نطاق 14 إلى 20 نيوكليوتيدات ، بما يتوافق مع مسافة TATA -cap موقع من 30 إلى 36 نقطة أساس ، من أول T لمصفوفة صندوق TATA إلى موقع الغطاء (بداية النسخ) . يتم تصميم المروجين الأقل من TATA ببساطة كمناطق فارغة بين الجينات بطول 40 نقطة أساس.

تحلل الاعتماد الأقصى (MDD).

يتم نمذجة مواقع لصق المانحين من خلال تحلل الاعتماد الأقصى. هناك ملاحظة شائعة جدًا وهي وجود تبعيات قوية بين المواضع غير المجاورة وكذلك المواضع المجاورة في إشارة لصق المتبرع. تم تصميم تحلل الاعتماد الأقصى لالتقاط هذه الأنواع من التبعيات بالضبط. (يتبع ...)

1. توقع الهياكل الجينية الكاملة في الحمض النووي الجيني البشري ، كريسبرج ، صامويل كارلين. مجلة البيولوجيا الجزيئية ، المجلد. 268 ، رقم 1 ، أبريل 1997 ، ص 78-94

2. التسلسل الأولي وتحليل الجينوم البشري. لاندر إس ، وآخرون. طبيعة 2001 فبراير 15409 (6822): 860-921


حجم Intron و Exon Evolution في ذبابة الفاكهة

لقد وجدنا ارتباطًا سلبيًا بين معدل التطور على مستوى البروتين (كما تم قياسه بواسطة دن) وحجم intron في ذبابة الفاكهة. على الرغم من أن مثل هذه العلاقة متوقعة إذا قللت الإنترونات من تداخل هيل-روبرتسون داخل الجينات ، يبدو أنه من المرجح أن يتم تفسيرها من خلال الوفرة العالية لـ رابطة الدول المستقلة- العناصر التنظيمية في الإنترونات (خاصة الإنترونات الأولى) في الجينات تحت قيود انتقائية قوية.

يعد الحمض النووي غير المشفر مكونًا رئيسيًا لجينوم حقيقيات النوى ، لكننا لا نعرف سوى القليل عن القوى التي تؤثر على تطوره. على وجه الخصوص ، يختلف حجم intron داخل الجينوم وبين الجينوم ، لكن أسباب ذلك غير واضحة. يتأثر حجم الإنترون بعوامل مختلفة (C omeron 2001 D uret 2001): إدخال العناصر القابلة للنقل (B artolom é وآخرون. 2002 G.M arais ، بيانات غير منشورة) ، وجود عناصر تنظيمية تتحكم في التعبير الجيني (B ergman and K reitman 2001) ، وجود جينات RNA (M axwell و F ournier 1995) أو RNA تشارك في تنظيم الجينات (على سبيل المثال، ميرنا) (M attick 2001) ، تواتر وحجم أحداث الحذف (P etrov وآخرون. 2000 P etrov 2002) ، اختيار لتقليل التكلفة النشطة للنسخ (C arvalho و C lark 1999 C astillo -D avis وآخرون. 2002) ، اختيار للحفاظ على المجالات الكروموسومية النشطة صغيرة نسبيًا (P rachumwat وآخرون. 2004) ، والحد من تدخل Hill-Robertson بين exons (C omeron و K reitman 2000).

يحدث تداخل Hill-Robertson عندما تخضع عدة مواقع مرتبطة وراثيًا للاختيار في نفس الوقت (H ill and R obertson 1966 G ordo and C harlesworth 2001). عندما تظهر الأليلات المفيدة في البداية في السكان ، فإنها عادة لا ترتبط ببعضها البعض ، لأن الطفرات تظهر عشوائياً في أفراد منفصلين. في حالة عدم وجود إعادة التركيب ، فإن طفرة واحدة مفيدة سوف تميل إلى إزاحة كل الآخرين (F isher 1930 M uller 1932). في وجود إعادة التركيب ، يمكن دمج الأليلات المفيدة معًا لتوليد النمط الجيني الأمثل. يمكن تقديم حجة مماثلة لتأثير الطفرات الضارة المتكررة على انتشار الأليلات المفيدة (F isher 1930 C harlesworth 1994 P eck 1994 O rr 2000). وبالتالي ، من المتوقع أن يكون الاختيار أكثر كفاءة في وجود إعادة التركيب منه في غيابه. ومن ثم ، فإن الأحداث الانتقائية التي تحدث في منطقة واحدة من الجينوم يمكن تسهيلها إذا كان هناك محسن لإعادة التركيب في مكان قريب. يمكن أن تعمل الإنترونات كمحسِّن ، لأنها تزيد من فرصة حدوث تقاطع بين المواقع في اثنين من exons المختلفين عن طريق التباعد بينهما ، مما يسمح باختيار أكثر كفاءة للمتغيرات في مناطق الترميز المختلفة من نفس الجين (C omeron and K reitman 2000) .

إذا كان هذا التداخل مهمًا ، فإننا نتوقع أن تكون فعالية الانتقاء أكبر في الجينات ذات الإنترونات الأكبر ، وكل شيء آخر متساوٍ. صمم Comeron و Kreitman اختبارًا يعتمد على تأثير حجم intron على التحديد على استخدام الكودون في ذبابة الفاكهة سوداء البطن (C omeron and K reitman 2002). يُعتقد أن هذا النوع من الاختيار ضعيف جدًا (نهس ∼ 1 أين نه هو حجم السكان الفعال و س معامل الانتقاء ضد طفرة في كودون غير مثالي) ، وبالتالي فهو عرضة بشكل خاص لتوليد تأثيرات التداخل ، لأن فرصة عزل العديد من المواقع المترادفة في نفس الجين في نفس الوقت عالية (G ordo and C harlesworth 2001). وجدوا أن المستوى المتوسط ​​لتحيز الكودون بين الجينات المأخوذة من D. melanogaster لم يتأثر تسلسل الجينوم بوجود / عدم وجود الإنترونات. ثم قاموا بفحص الكودونات الموجودة في منتصف الجين (تسمى الكودونات "المركزية") ، والتي تكون أكثر عرضة للتداخل نظرًا لوجود عدد أكبر من الكودونات المجاورة لها.وجد C omeron و K reitman (2002) أن مستوى تحيز الكودون لهذه الكودونات المركزية قد زاد بشكل طفيف ولكن بشكل ملحوظ في الجينات ذات الإنترونات المركزية ، مقارنة بالجينات التي تفتقر إلى هذه الإنترونات ، بالاتفاق مع فرضية التداخل.

يمكن أن تقلل الإنترونات أيضًا من التداخل بين الطفرات المختارة بشكل ضعيف في مواقع الأحماض الأمينية داخل نفس الجين. هذا يعني أن معدل الاستبدالات غير المرادفة لكل موقع (دن) سيتأثر بحجم intron. ومع ذلك ، إلى أي مدى دن يتأثر بتنقية الاختيار ضد. الاختيار الإيجابي غير واضح (A kashi 1999 H urst 2002). إذا كان تطور تسلسل البروتين ناتجًا بشكل أساسي عن تثبيت الطفرات المفيدة والمختارة بشكل ضعيف (الاختيار الإيجابي) ، فإن الارتباط بين دن ويجب أن يكون حجم intron موجبًا. في المقابل ، إذا كان مدفوعًا بالتثبيت عن طريق الانجراف للطفرات الضارة المنتقاة بشكل ضعيف (الاختيار المنقي) ، يجب أن يكون الارتباط سالبًا (H urst 2002). للتمييز بين هذين البديلين واختبار تأثير حجم intron على دن، استخدمنا 630 زوجًا جينيًا متعامدًا من D. melanogaster و د. ياكوبا (من D omazet -L oso و T autz 2003) لتقدير دن باستخدام PAML مع المعلمات الافتراضية (G oldman and Y ang 1994). مزيد من التفاصيل موجودة في M arais وآخرون. (2004) (يمكن تنزيل مجموعة البيانات من http://biomserv.univ-lyon1.fr/

marais / dataIntronSize /). قمنا بفحص العلاقة بين دن القيم وحجم intron في D. melanogaster. استخدمنا فقط الجينات الـ 570 التي من المحتمل أن تكون موجودة في مناطق إعادة التركيب العالية في هذا النوع (M arais وآخرون. 2004) ، نظرًا لأن الجينات في مناطق إعادة التركيب المنخفضة (بالقرب من السنتروميرات أو التيلوميرات وعلى الكروموسوم 4) معروفة بتراكم العناصر القابلة للنقل في مناطقها غير المشفرة ، وقد يكون لأحجامها الداخلية ديناميات تطورية غير عادية (B artolom é وآخرون. 2002 آر إيزون وآخرون. 2002). لم تختلف النتائج بشكل كبير عند تضمين أزواج الجينات من مناطق إعادة التركيب المنخفض (البيانات غير معروضة).

نجد ذلك دن (1) أقل مرتين تقريبًا في الجينات ذات الإنترونات مقارنة بالجينات التي لا تحتوي على إنترونات (كان اختبار Kolmogorov اللامعلمي مهمًا مع ص = 0.02 ، انظر الشكل 1 أ) و (2) يرتبطان سلبًا بإجمالي حجم الإنترون (معامل الارتباط اللامعلمي سبيرمان صس = −0.19, ص & lt 10 4 ، انظر الشكل 1 ب). يوضح الشكل 1 ج أن هناك اختلافات واضحة في المتوسط دن القيم بين فئات حجم intron وأن الارتباط الملحوظ لا يرجع إلى تأثيرات القيم المتطرفة. تم العثور على علاقة مماثلة بين دن/دس وحجم intron (صس = −0.10, ص & lt 10 −4) ، أين دس هو معدل الاستبدال المرادف لكل موقع. هذا يلغي احتمال وجود علاقة بين معدلات طفرة النقطة (ينعكس في دس) ومعدلات الحذف (التي قد تؤثر على حجم الإنترون) توضح النتائج. إجمالي حجم intron يتأثر بكل من حجم intron الفردي وعدد الإنترونات. لقد حددنا أيضًا فهرسًا جديدًا (المسافة النسبية بين المواقع ، RDS) ، والذي يعطي مقياسًا أفضل لتأثير الإنترونات على المسافة بين الكودونات داخل الجين. إنه مجموع المسافات الزوجية (في القواعد) لجميع الكودونات داخل الجين ، مقسومًا على مجموع المسافات الزوجية لجميع الكودونات داخل تسلسل الترميز مع تقسم الإنترونات. الجين الذي لا يحتوي على إنترونات سيكون له RDS = 1 ، والجين الذي يحتوي على إنترونات سيكون له RDS & gt 1 ، مع قيمة تعتمد على عدد هذه الإنترونات وموضعها وحجمها. نجد ارتباطًا أقوى قليلاً لـ دن مع RDS من حجم إنترون (صس = −0.24, ص & lt 10 4).

العلاقة بين حجم intron ومعدل الاستبدالات غير المرادفة لكل موقع (دن) في D. melanogaster. (أ) دن هو 1.6 مرة أقل في الجينات ذات الإنترونات عنها في الجينات التي لا تحتوي على إنترونات (كولموجوروف غير معلمي ، ص = 0.02). كما في بقية المقال ، استخدمنا الإحصائيات اللامعلمية لأن معظم المتغيرات التي نتعامل معها لا تتبع التوزيع الطبيعي. أشرطة الخطأ هي 95٪ فترات ثقة. (ب) دن يرتبط سلبًا بالحجم الكلي للإنترون (معامل ارتباط سبيرمان اللامعلمي صس = −0.19, ص & lt 10 4). (ج) دن لفئات مختلفة من حجم intron (كل فئة تحتوي على 20٪ من الجينات). أشرطة الخطأ هي 95٪ فترات ثقة.

تتوافق جميع النتائج المذكورة أعلاه مع فرضية التداخل. للوهلة الأولى ، يقترحون أن (1) تنقية الاختيار هو المحدد الرئيسي دن و (2) تنقية الانتقاء أقوى في وجود الإنترونات. بعبارة أخرى ، يبدو أن الطفرات الضارة بشكل ضعيف في مواقع الأحماض الأمينية في نفس الجين يمكن القضاء عليها بشكل أكثر فاعلية عندما يمتلك الجين الإنترونات. لكننا نحتاج إلى التفكير في فرضيات بديلة. فرضيات الانتقاء مقابل التكلفة النشطة للإنترونات (C arvalho and C lark 1999 C astillo -D avis وآخرون. 2002) والانتخاب ضد الإنترونات الكبيرة في المجالات الكروموسومية النشطة (P rachumwat وآخرون. 2004) كلاهما يتوقع وجود علاقة سلبية على مستوى الجينوم بين حجم intron ومستوى التعبير ، والذي لوحظ بالفعل في أنواع معينة انيقة والبشر (C astillo -D avis وآخرون. 2002). باستخدام مجموعة بيانات منشورة مسبقًا حول حجم intron ومستوى التعبير الجيني [مقدرة من بيانات علامة التسلسل المعبر عنها (EST)] ، تم تجميعها للجينوم الكامل لـ D. melanogaster (M arais and P iganeau 2002) ، وجدنا أن حجم الإنترون مرتبط سلبًا بمستوى التعبير في هذا النوع أيضًا ، على الرغم من أن هذا الارتباط ضعيف جدًا (صس = −0.01, ص = 0.01). من ناحية أخرى ، من المعروف أن تطور البروتين مرتبط بالتعبير الجيني: تميل الجينات المعبر عنها بشدة إلى التطور بشكل أبطأ في الثدييات (D uret and M ouchiroud 2000) و Drosophila (M arais وآخرون. 2004). ومع ذلك ، إذا كان الارتباط بين دن وحجم intron الذي اكتشفناه هو منتج ثانوي للتعبير الجيني ، يجب أن نلاحظ وجود علاقة إيجابية بين دن وحجم intron ، بالنظر إلى الارتباطات بين هذه المعلمات ومستوى التعبير. لا يبدو أن اختيار حجم intron المصغر (بسبب تكاليف الطاقة أو حجم مجال الكروموسومات) يفسر نتائجنا.

يتضمن التفسير البديل وجود عناصر تنظيمية تتحكم في التعبير الجيني في الإنترونات. على وجه الخصوص ، إذا كانت الجينات الأكثر حفظًا تحتوي على المزيد من هذه العناصر (نظرًا لأن مستويات التعبير عن هذه الجينات قد تحتاج إلى التحكم بشكل أكثر دقة) ، فإننا نتوقع علاقة سلبية بين دن وحجم intron. العناصر التنظيمية أكثر شيوعًا في الإنترونات الأولى منها في الإنترونات الأخرى في الثدييات (M ajewski و O tt 2002 K eightley و G affney 2003 C hamary و H urst 2004) وربما أيضًا في ذبابة الفاكهة (D uret 2001). بالاتفاق مع هذا ، فإن الإنترونات الأولى أكبر مرتين تقريبًا من الإنترونات الأخرى في الفقاريات وذبابة الفاكهة (D uret 2001) ، وهذا ينطبق أيضًا على مجموعة بياناتنا (الإنترونات الأولى ، متوسط ​​518 نقطة أساس أخرى ، يعني 294 نقطة أساس ص & lt 10 −4 في اختبار Kolmogorov). ثانيًا ، وجدنا أن حجمها يرتبط ارتباطًا إيجابيًا بدرجة كبيرة بمستوى التعبير (صس = 0.22, ص & lt 10 4) ، بينما لا تظهر الإنترونات الأخرى ارتباطًا مهمًا (صس = 0.10 ، NS). تم تأكيد ذلك من خلال تحليل الجينوم بأكمله (الشكل 2). ثالثًا ، من خلال تحليل محاذاة تم نشرها مسبقًا لـ 163 introns من D. melanogaster و D. simulans (H alligan وآخرون. 2004) ، وجدنا أن اختلاف intron مرتبط بشكل سلبي مع حجم الإنترونات الأولى (صس = −0.29, ص = 0.03) على الرغم من وجود ارتباط سلبي للإنترونات الأخرى ، إلا أنه ليس مهمًا (صس = -0.14 ، NS).

العلاقة بين حجم intron ومستوى التعبير (المقدرة بحساب EST) للجينوم الكامل لـ D. melanogaster (مجموعة بيانات من M arais و P iganeau 2002). لأول إنترونات ، صس = 0.06, ص & lt 10 −4. بالنسبة للإنترونات الأخرى ، صس = −0.03 ، NS. تم تضمين الإنترونات الموجودة في مناطق إعادة التركيب العالية فقط (يتم عرض العدد الإجمالي لهذه الإنترونات). أشرطة الخطأ هي 95٪ فترات ثقة.

لاختبار هذه الفرضية بشكل أكبر ، قمنا بفحص العلاقة بين تطور البروتين وحجم الإنترون للإنترونات الأولى والإنترونات الأخرى بشكل منفصل. بالنسبة إلى الإنترونات الأولى ، نلاحظ ارتباطًا مشابهًا لجميع الإنترونات (صس = −0.20, ص & lt 10 −4 ، ن = 450) ، ولكن لا يوجد ارتباط كبير بين الإنترونات الأخرى (صس = -0.06 ، NS ، ن = 302). علاوة على ذلك ، لا يزال الاتجاه مرئيًا عندما يتم تضمين الجينات التي تحتوي على أكثر من intron (للإنترونات الأولى صس = −0.15, ص & lt 10 −4 ، ن = 302). هذه النتيجة مذهلة ، لأنها تشير إلى أن وجود العناصر التنظيمية داخل الإنترونات هو التفسير الأكثر ترجيحًا للارتباط بين تطور البروتين وحجم الإنترون في ذبابة الفاكهة ، نظرًا لأننا لا نتوقع مثل هذه النتيجة مع الفرضيات البديلة ، بما في ذلك هيل -تدخل روبرتسون. ومع ذلك ، قد يكون للإنترونات الأولى أثر جانبي يتمثل في زيادة إعادة التركيب داخل الجين. في الواقع ، يساهمون بنسبة 54٪ من التباين في إجمالي طول intron ، لذا فإن معظم التباين في حجم intron يرجع إلى introns الأول. لاختبار هذا ، قارنا دن وحجم intron بعد إزالة تأثيرات التعبير الجيني ، لكن لم يتم العثور على ارتباط كبير (صس = −0.08، NS) ، مما يشير إلى أن وجود عناصر تنظيمية داخل الإنترونات قد يكون كافياً لشرح نتائجنا.

لا يبدو أن ملاحظاتنا تدعم فرضية التداخل ، لكن لا تسمح لنا باستبعادها. لم يتم فهم مدى تداخل Hill-Robertson بين مواقع الأحماض الأمينية قيد الاختيار جيدًا ، سواء من الناحية النظرية أو التجريبية. تشير بعض الأعمال الحديثة إلى أن مثل هذا التداخل قد يفسر وجود علاقة واضحة بين معدل إعادة التركيب و دن بالمقارنة مع D. melanogaster و D. simulans (B etancourt and P resgraves 2002) ، ولكن تم مؤخرًا تحدي معنى هذه العلاقة (M arais and C harlesworth 2003 M arais وآخرون. 2004). إذا كان هناك تداخل ضئيل أو معدوم بين مواقع الأحماض الأمينية داخل نفس الجين ، فإن الإنترونات سيكون لها تأثير فقط على فعالية الانتقاء على المواقع المترادفة داخل الجين. ومع ذلك ، فإن هذا التأثير ضعيف للغاية. يُظهر العمل السابق أن الإنترونات مرتبطة بتغيير متوسط ​​تواتر الكودونات المثلى من 64 إلى 68٪ وفقط لمجموعة فرعية من الكودونات (المركزية ، انظر أعلاه). هذا يتفق مع الارتباط الضعيف للغاية بين حجم intron ومعدلات إعادة التركيب التي تم الإبلاغ عنها سابقًا (C arvalho و C lark 1999 C omeron and K reitman 2000) ويشير إلى أن التداخل لا يفسر سوى جزء صغير جدًا من التباين في حجم intron في الجينومات حقيقية النواة.

لقد وجدنا أن حجم الإنترون يرتبط ارتباطًا سلبيًا بمستوى التعبير في ذبابة الفاكهة ، كما ورد في حقيقيات النوى الأخرى (C astillo -D avis وآخرون. 2002). ومع ذلك ، عندما نقسم introns إلى introns الأول ضد. بالنسبة للآخرين ، وجدنا أن حجم الإنترون الأول يرتبط ارتباطًا إيجابيًا بمستوى التعبير. هذا لا يتعارض مع فرضيات الاختيار لتقليل تكلفة نسخ الإنترونات (C arvalho و C lark 1999 C astillo -D avis وآخرون. 2002) والانتخاب ضد الإنترونات الكبيرة في المجالات الكروموسومية النشطة (P rachumwat وآخرون. 2004) ، والتي تم اقتراحها لشرح العلاقة السلبية بين حجم intron ومستوى التعبير. هذا يعني ببساطة أن الإنترونات الأولى من ذبابة الفاكهة لا تتبع الاتجاه العام ، ربما لأن هذه الإنترونات غنية بالعناصر التنظيمية ، والتي يبدو أنها أكثر شيوعًا في الجينات المعبر عنها بشكل كبير. ومع ذلك ، لا يبدو أن هذا هو الحال في البشر ، حيث تكون الإنترونات الأولى أصغر في الجينات المعبر عنها في كل مكان منها في الجينات المعبر عنها بشكل ضيق ، على الرغم من أن الاختلاف أصغر بكثير من الإنترونات الأخرى (C omeron 2004). هناك حاجة إلى مزيد من التحقيق لفهم هذا الاختلاف بين ذبابة الفاكهة والبشر.

تشير نتائجنا إلى أن الجينات ذات تسلسل الأحماض الأمينية تتطور ببطء (منخفضة دن) قد تحتوي أيضًا على عناصر تنظيمية أكثر ، خاصة في الإنترونات الأولى ، وهذا يولد العلاقة المرصودة بين دن وحجم intron. لقد ثبت بالفعل أن الجينات المحفوظة للغاية لها أنماط تعبير خاصة. أظهر D uret و M ouchiroud (2000) أن هذه الجينات يتم التعبير عنها على نطاق أوسع بكثير من غيرها في الثدييات. اقترحوا أن هذا يرجع إلى أن الطفرات في جينات التدبير المنزلي تؤثر على أنسجة أكثر من الطفرات في الجينات الخاصة بالأنسجة ، وبالتالي سيكون لها تأثيرات أكبر على اللياقة. هذا من شأنه أن يجعلهم أكثر تقييدًا ، على الرغم من إمكانية وجود تفسيرات أخرى (A kashi 2001 ، 2003). في الآونة الأخيرة ، تم استخدام C astillo -D avis وآخرون. (2004) أن اختلاف تسلسل البروتين مرتبط بتباعد رابطة الدول المستقلة- العناصر التنظيمية. لقياس الأخير ، حددوا فهرسًا جديدًا ، دSM (جزء من كلتا التسلسلات غير المشفرة التي لا تحتوي على منطقة محاذاة كبيرة) ، وتم حسابها لمجموعة من المتواليات الجينومية المحاذاة من C. ايليجانس و C. briggsae. أظهروا أنه (1) يرتبط بشكل إيجابي مع اختلافات التعبير بين الديدان الخيطية ، (2) التسلسلات المشتركة تتوافق مع الدوافع المعروفة تجريبياً للتعبير الجيني ، و (3) دSM كبير في المناطق الجينية غير المحفزة. ثم لاحظوا ذلك دSM و دن ترتبط ارتباطًا إيجابيًا بالديدان الخيطية ، مما يشير إلى أن الضغوط الانتقائية على التعبير الجيني وتطور تسلسل البروتين مقترنة (C astillo -D avis وآخرون. 2004). تم التوصل إلى استنتاج مماثل لأسباب مختلفة عن ذبابة الفاكهة (N uzhdin وآخرون. 2004). هذا يتوافق تمامًا مع ملاحظاتنا ومع فكرة أن اختيار وجود العناصر التنظيمية يمكن أن يؤثر على تطور حجم الإنترون.


توفر مقارنة جينومات الميتوكوندريا رؤى حول ديناميات intron والتطور في Botryosphaeria dothidea و ب. كواتسوكاي

للمراسلات. البريد الإلكتروني [email protected] Tel. 86-29-87092075.

مختبر الولاية الرئيسي لبيولوجيا إجهاد المحاصيل في المناطق الجافة وكلية وقاية النبات ، جامعة نورث وست إيه أند إف ، يانغلينغ ، شنشي ، 712100 الصين

مختبر مفتاح MOE للشبكات الذكية وأمن الشبكات ، كلية الهندسة الإلكترونية والمعلوماتية ، جامعة Xi'an Jiaotong ، Xi'an ، 710049 الصين

مختبر الولاية الرئيسي لبيولوجيا إجهاد المحاصيل في المناطق الجافة وكلية وقاية النبات ، جامعة نورث وست إيه أند إف ، يانغلينغ ، شنشي ، 712100 الصين

مختبر الولاية الرئيسي لبيولوجيا إجهاد المحاصيل في المناطق الجافة وكلية وقاية النبات ، جامعة نورث وست إيه آند إف ، يانغلينغ ، شنشي ، 712100 الصين

مختبر الولاية الرئيسي لبيولوجيا إجهاد المحاصيل في المناطق الجافة وكلية وقاية النبات ، جامعة نورث وست إيه آند إف ، يانغلينغ ، شنشي ، 712100 الصين

كلية العلوم البيئية ، جامعة جيلف ، جيلف ، أونتاريو ، N1G 2W1 كندا

قسم علم أمراض النبات والأحياء الدقيقة ، جامعة ولاية أيوا ، أميس ، آي أي ، 50011 الولايات المتحدة الأمريكية

مختبر الولاية الرئيسي لبيولوجيا إجهاد المحاصيل في المناطق الجافة وكلية وقاية النبات ، جامعة نورث وست إيه أند إف ، يانغلينغ ، شنشي ، 712100 الصين

مختبر الولاية الرئيسي لبيولوجيا إجهاد المحاصيل في المناطق الجافة وكلية وقاية النبات ، جامعة نورث وست إيه آند إف ، يانغلينغ ، شنشي ، 712100 الصين

للمراسلات. البريد الإلكتروني [email protected] Tel. 86-29-87092075.

ملخص

Botryosphaeria dothidea هو أحد أكثر مسببات الأمراض الفطرية شيوعًا على عدد كبير من المضيفين في جميع أنحاء العالم. Botryosphaeria dothidea و ب. كواتسوكاي هي أيضًا العوامل المسببة الرئيسية لتعفن حلقة التفاح. في هذه الدراسة ، قمنا بتسلسل وتجميع وشرح الميوجينومات الدائرية لـ 12 مجموعة متنوعة ب. dothidea عزلات (105.7-114.8 كيلو بايت) تصيب نباتات مختلفة منها التفاح ، وخمسة عزلات متنوعة ب. كواتسوكاي عزلات (118.0–124.6 كيلو بايت) من التفاح. ب. dothidea كانت الميتوجينومات تؤوي مجموعة من 29-31 إنترون و 48-52 ORFs. فى المقابل، ب. كواتسوكاي احتوت الميتوجينومات على مزيد من الإنترونات (32-34) و ORFs (51-54). كان التباين في أحجام الانقسام الخيطي مرتبطًا بشكل أساسي بأعداد مختلفة من الإنترونات وإدخال العناصر الوراثية المتنقلة. ومن المثير للاهتمام، ب. dothidea و ب. كواتسوكاي عرض أنماط توزيع intron مميزة ، مع ثلاثة مواقع intron تُظهر ديناميكيات التواجد / الغياب في كل نوع. أعداد كبيرة من الإنترونات (57٪ في ب. dothidea و 49٪ في ب. كواتسوكاي) على الأرجح من خلال النقل الأفقي من non-Dothideomycetes. دعم نسالة الجينات الميتوكوندريا التمايز بين النوعين. بشكل عام ، تلقي هذه الدراسة الضوء على تطور الميتوكوندريا لمسببات الأمراض النباتية ب. dothidea و ب. كواتسوكاي، وأنماط توزيع intron يمكن أن تكون علامات مفيدة للدراسات حول التنوع السكاني.

الشكل S1. شجرة النشوء والتطور من الجنس بوتريوسفيريا (الجدول S1) تم إنشاؤه باستخدام اثنين من صانعي الجينوم المدمجين ITS و EF-1α. يشار إلى النسب المئوية التمهيدية المشتقة من 1000 مكررات في العقد. شريط = 0.01 استبدالات لكل موضع نيوكليوتيد. كانت الألوان وأحجام الخطوط المختلفة المستخدمة لتمييز المناطق المتداخلة (موقع bootstrap 87). Neofusicoccum luteum تم استخدامه كمجموعة خارجية.

الشكل S2. مقارنة أحجام الانقسام بين ب. dothidea و ب. كواتسوكاي يعزل. تم حساب فرق الدلالة من خلال اختبار t.

الشكل S3. نسبة بدائل النوكليوتيدات غير المترادفة / المترادفة (Ka / Ks). تم حساب النسب بين 12 جينًا لترميز البروتين في جينوم الميتوكوندريا ب. dothidea و ب. كواتسوكاي.

الشكل S4. شجرة النشوء والتطور ML بناءً على 12 بروتينًا متقدريًا متسلسلاً (cob-cox1-cox2-nad4L-nad5-atp6-nad1-nad4-nad6-cox3-nad2-nad3). كانت الشجرة الموضحة هنا هي أفضل هيكل منفرد تم استرداده من ML باستخدام برنامج RAxML. أعطيت قيم الدعم من تحليلات ML للعقد التي تتلقى دعما قويا. شريط = 0.02 بدائل لكل موضع نيوكليوتيد. Zymoseptoria tritici تم استخدامه كمجموعة خارجية.

الجدول S1. مدخلات GenBank لأربع علامات DNA نووية مكونة من 17 عزلة.

الجدول S2. الأحجام ومحتويات جينوم الميتوكوندريا بين الأنواع المختارة في فئة Dothideomycetes (أوامر Botryosphaeriales ، Capnodiales و Pleosporales).

الجدول S3. مقارنة بين الاختلافات النوكليوتيدية في المناطق الخارجية والداخلية بين مختلف ب. dothidea يعزل.

الجدول S4. التحويل المشترك لتسلسلات exon بسبب إدخالات intron.

الجدول S5. مقارنة بين الاختلافات النوكليوتيدية في المناطق الخارجية والداخلية بين مختلف ب. كواتسوكاي يعزل.

الجدول S6. نتائج المحاذاة الذاتية لتسلسل النيوكليوتيدات intron ب. dothidea TCPTT1 باستخدام بلاستن.

الجدول S7. نتائج المحاذاة لتسلسل النيوكليوتيدات intron ب. كواتسوكاي PGYT19 باستخدام BLASTN.

الجدول S8. نتائج بلاست عبر الإنترنت للإنترونات المحددة في ب. dothidea TCPTT1 الانقسام.

الجدول S9. نتائج بلاست عبر الإنترنت للإنترونات المحددة في ب. كواتسوكاي PGYT19 الانقسام.

الجدول S10. أنماط وجود / غياب الإنترون للأثني عشر ب. dothidea يعزل وخمسة ب. كواتسوكاي يعزل.

يرجى ملاحظة ما يلي: الناشر غير مسؤول عن محتوى أو وظيفة أي معلومات داعمة مقدمة من المؤلفين. يجب توجيه أي استفسارات (بخلاف المحتوى المفقود) إلى المؤلف المقابل للمقالة.


نتائج

يعدل CE4 تخطي exon 7B في الجسم الحي

سابقًا ، أبلغنا عن تحديد 150 عنصر نيوكليوتيد (CE1) الذي يعزز استخدام موقع لصق 5 البعيد في المختبر وتخطي exon 7B في الجسم الحي (شابوت وآخرون. ، 1997). يقع CE1 في المنبع intron البديل لـ exon 7B (الشكل 1) ، ويمكن لجزء صغير من CE1 (CE1a 17 نيوكليوتيدات) تنشيط تحديد موقع لصق 5 البعيد في المختبر (شابوت وآخرون. ، 1997). من المحتمل أن يتم التوسط في نشاط CE1a من خلال تفاعل مع بروتين hnRNP A1 نظرًا لأن الطفرة التي تقوض ارتباط A1 بـ CE1a تمنع تنشيط موقع لصق 5 البعيد في المختبر (شابوت وآخرون. ، 1997). كشف الفحص البصري لتسلسل الماوس في اتجاه المصب لـ exon 7B عن موقع ربط A1 مفترض مطابق للموقع الموجود في CE1a (UAGAGU). هذا التسلسل جزء من منطقة 24 نيوكليوتيد محفوظة أطلقنا عليها اسم CE4 (الشكل 1). يرتبط HnRNP A1 بـ CE4 في المختبر (S13 RNA في شابوت وآخرون. ، 1997). للتحقق مما إذا كان CE4 يعدل أيضًا الربط لـ A1 pre-mRNA في الجسم الحي، عبرنا بشكل عابر في خلايا هيلا عن جزء جينومي من وحدة الربط البديلة hnRNP A1 للماوس تحت سيطرة مروج الفيروس المضخم للخلايا (CMV) (الشكل 2 أ). أشار تحليل RT-PCR لمجموع الحمض النووي الريبي إلى أن التعبير عن minigene من النوع البري A1 أسفر بشكل تفضيلي عن نصوص تفتقر إلى exon 7B (الشكل 2B ، الممرات 4 و 12). يستنسخ ملف تعريف الربط هذا مستويات A1 ​​و A1 B mRNA الداخلية (البيانات غير معروضة). كما هو موضح سابقًا (Chabot وآخرون، 1997) ، أدى حذف CE1 إلى تحسين التردد النسبي لإدراج exon 7B (الشكل 2B ، الممر 5). أدت إعادة إدخال الحد الأدنى من 17 نيوكليوتيد CE1a إلى استعادة المظهر الجانبي البري لتخطي exon (الممر 8). وبالمثل ، فإن حذف 113 منطقة نيوكليوتيد تحتوي على CE4 عزز إدراج exon 7B (الشكل 2B A1ΔCE4 ، الممرات 6 و 13). بينما لم يكن لإعادة إدخال تسلسل غير ذي صلة أي تأثير (لم تظهر البيانات) ، فإن إدخال CE4 (24 نيوكليوتيد) أعاد تخطي exon 7B الفعال (A1RCE4 lane 14). والجدير بالذكر أن حذف CE4 كان فعالًا مثل حذف كل من CE1 و CE4 (الشكل 2B ، A1ΔΔ lane 7 ، انظر الشكل 2C للتقدير الكمي). تشير هذه النتائج إلى أن CE4 تحتوي على متواليات تعزز تخطي exon 7B.

يعزز CE4 اختيار موقع لصق 5 ′ البعيد في المختبر

نشاط CE4 على اختيار موقع لصق 5 في المختبر تم التحقيق باستخدام النصوص النموذجية التي تحتوي على مواقع لصق 5 من exon 7 و 7 B في المنافسة على موقع لصق 3 ′ لـ adenovirus L2 exon (الشكل 3A). يفتقر النموذج الأساسي pre-mRNA إلى CE1a و CE4 ويتم تقطيعه بشكل حصري تقريبًا إلى موقع لصق 5 القريب (C5 ′ - / - الشكل 3 ب ، الممر 1). أدى إدخال CE1a و CE4 في موضع المنبع والمصب ، على التوالي ، إلى تحفيز الربط إلى موقع لصق 5 ′ البعيد (C5 1a / 4 lane 6). تم تقسيم النصوص التي تحتوي على CE4 أو CE1a في كلا الموضعين إلى موقع لصق 5 البعيد بكفاءة مماثلة لـ C5 1a / 4 (C5 1a / 1a و C5 4/4 الممرات 7 و 8 ، على التوالي). تم تقطيع الركائز التي تحمل CE1a أو CE4 في موضع المنبع أو المصب فقط إلى موقع لصق 5 البعيد عند مستوى وسيط ولكن قابل للمقارنة (الشكل 3B ، C5 ′ 1a / - ، C5 4 / - ، C5 - / 4 و C5 ′ - / 1a الممرات 2-5 انظر الشكل 3 أ للتقدير الكمي). وبالتالي ، فإن CE1a و CE4 قابلة للتبديل وتعرض قدرة مماثلة على تعزيز استخدام موقع لصق 5 البعيد في المختبر. تشير هذه النتائج إلى أن CE1a و CE4 يعدلان اختيار موقع لصق 5 من خلال آلية مشتركة.

يتم توسط تأثير CE4 على اختيار موقع لصق 5 بواسطة hnRNP A1

لقد أظهرنا أن طفرة في تسلسل UAGAGU لـ CE1a تقلل من ارتباط A1 وتمنع تنشيط موقع لصق 5 ′ البعيد (Chabot وآخرون. ، 1997). إذا كان ارتباط A1 مسؤولاً أيضًا عن تأثير CE4 على اختيار موقع لصق 5 ، فيجب أن تكون جزيئات ما قبل mRNA التي تحمل CE4 أكثر استجابة للزيادات في تركيز A1 من قبل mRNA التي تفتقر إلى مواقع ربط A1 عالية التقارب . عندما تمت إضافة كميات متزايدة من بروتين GST – A1 المؤتلف (rA1) إلى خليط الربط الذي يحتوي على C5 4/4 RNA ، انخفض اختيار موقع لصق 5 القريب تدريجيًا حتى أصبح موقع لصق 5 البعيد هو الخيار الحصري (الشكل 4 أ ، الممرات 5-8). في المقابل ، عززت أكبر كمية من rA1 انخفاضًا متواضعًا في استخدام موقع لصق 5 القريب على ما قبل mRNA تفتقر إلى مواقع ربط قوية A1 (الممرات 1-4). شوهد تأثير وسيط مع ما قبل mRNAs التي تحتوي على نسخة واحدة فقط من CE1a أو CE4 (البيانات غير معروضة). وبالتالي ، فإن ما قبل mRNAs التي تحمل مواقع ربط A1 عالية التقارب تكون أكثر حساسية لزيادة تركيز A1 في المختبر.

لاختبار تأثير انخفاض تركيز A1 على اختيار موقع لصق 5 درجات في المختبر، أضفنا كميات متزايدة من قليل النوكليوتيد الذي يحمل نسخة الحمض النووي لثلاثة مواقع متجاورة مرتبطة بـ A1. يرتبط A1 بهذا قليل النوكليوتيد مباشرة وبخصوصية (نتائج غير منشورة F.Dallaire و B.Chabot). تحولت مخاليط الربط قبل الحضانة مع قليل النوكليوتيد التحديد نحو موقع لصق 5 ′ القريب من C5 4/4 RNA (الشكل 4 ب ، الممرات 8-11). إضافة الخليط المحتوي على أعلى تركيز من قليل النوكليوتيد مع rA1 استعاد استخدام موقع لصق تفضيلي 5 (الممرات 12-14). كما هو متوقع بالنسبة لـ pre-mRNA الذي يفتقر إلى مواقع ربط A1 عالية التقارب (C5 ′ - / - RNA) ، لم يتم تحسين الربط الفعال بالفعل لموقع لصق 5 القريب من خلال إضافة كميات متزايدة من قليل النوكليوتيد ، و إضافة rA1 لم تحفز اختيار موقع لصق 5 البعيد (الممرات 1-7). زاد قليل النوكليوتيد أيضًا من اختيار موقع لصق 5 القريب في مخاليط تحتوي على C5 4 / - RNA (البيانات غير معروضة). ومع ذلك ، كانت هناك حاجة إلى تركيزات أقل من قليل النوكليوتيد للحصول على تحول مماثل لتلك التي تم الحصول عليها باستخدام C5 4/4 RNA. وبالتالي ، فإن ما قبل mRNA الذي يحمل موقعين عالي التقارب للربط A1 يكون أكثر مقاومة لتخفيض التركيز الفعال لـ A1 من موقع pre-mRNA الذي يحتوي على موقع ربط A1 مثالي واحد فقط. بشكل عام ، توضح هذه النتائج أن تأثير CE4 على اختيار موقع لصق 5 يتم توسطه من خلال التفاعل مع بروتين hnRNP A1.

أهمية المجال الغني بالجليسين

يحتوي الجزء N-terminal من A1 (يسمى UP1) على مجالين لربط الحمض النووي الريبي (RNA) ولكنه يفتقر إلى المجال الغني بالجليسين C- الطرفي (الشكل 5). يرتبط UP1 بشكل غير فعال بما قبل mRNA بشري β-globin ، وعلى عكس A1 ، لا يؤثر على اختيار موقع لصق 5 ′ عند إضافته إلى مستخلص S100 مكمل بـ ASF / SF2 (Mayeda وآخرون. ، 1994). لتحديد ما إذا كان UP1 قد عرض سلوكًا مشابهًا على النصوص التي تحمل مواقع ربط A1 عالية التقارب ، قمنا أولاً بمراقبة ارتباط البروتينات المؤتلفة A1 و UP1 بـ CE4. rUP1 مرتبط بـ CE4 RNA العاري على الأقل بكفاءة مثل rA1 ، وكلا البروتينين مرتبط بشكل غير فعال بالتسلسل التكميلي لـ CE4 (الشكل 5 أ). وبالتالي ، فإن غياب المجال الغني بالجليسين لـ A1 لا يلغي قدرته على التفاعل مع CE4. عندما تمت إضافة كميات متزايدة من rUP1 في المستخلصات النووية المحتضنة باستخدام C5 4/4 pre-mRNA ، تحول اختيار موقع لصق 5 من البعيدة في الغالب إلى القريبة في المقام الأول (الشكل 5 ب). لذلك سمح وجود مواقع ربط عالية التقارب A1 وبروتينات A1 ​​الداخلية لـ UP1 بعرض تأثير سلبي مهيمن على اختيار موقع لصق 5. وبالتالي ، على الرغم من أنه ليس ضروريًا للربط بـ CE4 ، يلعب المجال الغني بالجليسين دورًا مهمًا في تعزيز اختيار موقع لصق 5 البعيد.

نشاط التجسير لبروتينات A1

لقد أظهرنا سابقًا أن تأثير CE1 على اختيار موقع لصق 5 لا يرتبط بالاختلافات في ربط U1 snRNP بمواقع لصق 5 منافسة (Chabot وآخرون. ، 1997). تم الحصول على نتائج متطابقة مع CE4 (البيانات غير معروضة). علاوة على ذلك ، فإن التحولات المهمة في اختيار موقع لصق 5 الذي تم الحصول عليه عن طريق إضافة rA1 أو عن طريق احتضان مخاليط الربط المسبق مع أليغنوكليوتيد الحمض النووي التي تحمل مواقع ربط A1 لم تؤثر على ربط U1 snRNP بمواقع لصق 5 متنافسة (البيانات غير معروضة) . لشرح تأثير CE1a و CE4 على اختيار موقع لصق 5 ، نقترح أن يتبع ربط A1 بـ CE1a و CE4 اتصالات بروتينية بين جزيئات A1 ​​المرتبطة بهذه العناصر (الشكل 6 أ). سيؤدي هذا التفاعل إلى تقريب الزوج الأبعد من مواقع لصق ، وبالتالي تحسين معدل التزامهم. يشير هذا النموذج إلى أن A1 يؤثر على اختيار موقع لصق 5 ليس عن طريق تغيير التعرف على موقع لصق 5 ولكن بدلاً من ذلك عن طريق تغيير شكل ما قبل mRNA.

لمعالجة ما إذا كانت جزيئات A1 ​​يمكن أن تتفاعل في وقت واحد مع عنصري ربط RNA ، قمنا أولاً باحتضان rA1 أو rUP1 مع 32 P المسمى CE1a RNA والتحكم K + RNA. تم تحضين الخليط بعد ذلك باستخدام CE1a RNA بارد مقترن تساهميًا مع عمود هيدرازيد حمض الأديبيك. تم غسل كل عمود عند زيادة تركيز الملح إلى المجمعات المرتبطة. كما هو مبين في الشكل 6 ب ، تم الاحتفاظ بمركب rA1- [32 P] CE1a على وجه التحديد بواسطة العمود ، المسمى CE1a RNA بالاشتراك مع rA1 (الشكل 6B ، الألواح الوسطى). في المقابل ، لم يتم الاحتفاظ بمركب rUP1- [32 P] CE1a بواسطة العمود وتم التخلّص من UP1 فقط بتركيز ملح أعلى (الشكل 6 ب ، الألواح اليمنى). يتم توضيح خصوصية الفحص من خلال حقيقة أن عنصر التحكم K + RNA لم يتم التصفية التتابعية له مع rA1 ، وأن عمود RNA لم يحتفظ بـ [32 P] CE1a RNA في غياب rA1 (اللوحة اليسرى). تشير هذه النتائج إلى أن جزيئات A1 ​​المرتبطة بموقع واحد يمكن أن تتفاعل على وجه التحديد مع موقع ارتباط آخر عالي التقارب ، وأن المجال الغني بالجليسين لـ A1 ضروري للربط المتزامن. نظرًا لأن المجال الغني بالجليسين غير مطلوب للربط الفعال والمحدد بـ RNA (الشكل 6 أ) ، تشير نتائجنا إلى أن المجال الغني بالجليسين يتوسط تفاعلًا بين جزيئات A1 ​​المرتبطة بشكل مستقل بالمواقع عالية التقارب.

يؤثر CE4 أيضًا على اختيار موقع لصق ثلاثي الأبعاد

بينما كانت تأثيرات CE4 و CE1a على اختيار موقع لصق 5 قابلة للمقارنة في المختبر، كان لإزالة CE4 تأثير أكبر على تضمين exon 7B في الجسم الحي من حذف CE1 (الشكل 2). تشير هذه النتيجة إلى أن CE4 تعدل حدثًا إضافيًا في اختيار موقع لصق. لاختبار ما إذا كان CE4 يمكن أن يؤثر على اختيار موقع لصق 3 ، استخدمنا نموذجًا قبل mRNA يحتوي على موقع لصق 5 من exon 7 وموقعين متنافسين 3 لصق (C3 ′ - / - الشكل 7 أ). بينما تم تقطيع C3 ′ - / - RNA في الغالب إلى موقع لصق 3 البعيد ، تم أيضًا استخدام موقع لصق 3 القريب (الشكل 7 أ ، الممر 1 وانظر الشكل 8). والجدير بالذكر أن إدخال CE4 بين موقعي لصق 3 أزال اختيار موقع لصق 3 القريب وزيادة الربط البعيدة (C3 - / 4 الشكل 7A ، الممر 3). في المقابل ، لم يكن لإدخال CE1a في نفس الموضع ، أو إدخال CE4 في اتجاه المنبع من موقع لصق 3 القريب ، أي تأثير (C3 ′ - / 1a و C3 4 / - الممرات 4 و 2 ، على التوالي). لمعالجة ما إذا كان CE4 يقمع موقع لصق 3 القريب ، قمنا باختبار مشتق من C3 - / 4 الذي يفتقر إلى موقع لصق 3 البعيد (S774 الشكل 7 ب). بالمقارنة مع عنصر تحكم pre-mRNA يحمل التسلسل التكميلي لـ CE4 في نفس الموضع (S774α) ، ارتبط وجود CE4 بتثبيط قوي للربط (الشكل 7 ب ، الممرات 1-8). لم يمنع وجود CE4 في intron التضفير (S747 الشكل 7B ، الممرات 9-12). نظرًا لأن تضفير S747 لم يكن مضطربًا عندما تم تضمين S774 RNA في خليط التضفير (الممرات 13-16) ، فإن التضفير غير الفعال لـ S774 RNA لم يكن ناتجًا عن مثبط عام في تحضير RNA S774. وهكذا ، في حين أن كلا من CE4 و CE1a يعدلان اختيار موقع لصق 5 ، فإن CE4 فقط يمكنها كبت موقع لصق 3 لـ exon 7B بطريقة تعتمد على الموضع. من المحتمل أن تفسر قدرة CE4 على التأثير في اختيار موقع لصق 5 و 3 لماذا أدى حذف CE4 إلى تعزيز إدراج exon 7B بشكل أكثر كفاءة من حذف CE1 (الشكل 2).

يتم التوسط في تأثير CE4 على اختيار موقع لصق 3 بواسطة عامل عبر المفعول متميز عن A1

نظرًا لأن CE1a لا يؤثر على تحديد موقع لصق 3 ، فلا يمكن للربط A1 مع CE4 أن يفسر بحد ذاته تأثير CE4 على استخدام موقع لصق 3. ومع ذلك ، يمكن أن يلعب A1 دورًا في قمع موقع لصق 3 المنبع. لمعالجة هذه المشكلة ، قمنا باختبار مشتق CE4 يفتقر إلى موقع الربط A1 (CE4m) (الشكل 8 أ). بينما كان CE4m أقل كفاءة بكثير من CE4 بواسطة A1 (الشكل 8B) ، كان CE4m فعالًا مثل CE4 في تحسين اختيار موقع لصق 3 ′ البعيد (C3 ′ - / 4 و C3 - / 4 م الشكل 8A ، الممرات 3 و 4 ، على التوالي). لم يكن لإدراج التسلسل التكميلي لـ CE4m أي تأثير (C3 ′ - / 4mα ، حارة 2). في التركيزات التي تؤثر على اختيار موقع لصق 5 ، لم تؤثر إضافة rA1 على الربط بين C3 ′ - / - أو C3 ′ - / 4 (البيانات غير معروضة). تشير هذه النتائج إلى أن الربط A1 يمكن الاستغناء عنه لتأثير CE4 على اختيار موقع لصق 3. لتحديد ما إذا كان نشاط CE4m في تحديد موقع لصق ثلاثي الأبعاد يتطلب أ عبر- عامل التأثير ، أجرينا فحوصات الربط في وجود التجاوزات المولية من الحمض النووي الريبي المنافس. قام أعلى تركيز لـ CE4m RNA بتحويل اختيار موقع لصق 3 على C3 - / 4m pre-mRNA من البعيد حصريًا إلى القريب في الغالب (الشكل 8C ، الممرات 13-16). يشير الانخفاض في كفاءة الربط إلى أن الزيادة في CE4m RNA تقوم بمعايرة عامل التضفير التأسيسي. في حين أن تركيزًا مشابهًا لـ CE4m RNA أدى أيضًا إلى تحسين تواتر اختيار موقع لصق 3 القريب على C3 ′ - / - pre-mRNA (الشكل 8B ، الممرات 5-8) ، كان اتساع التحول أقل أهمية من C3 ′ - / 4 م RNA. جزء RNA يحتوي على متواليات البلازميد (K + RNA) ، على الرغم من تحسين اختيار موقع لصق 3 البعيد بتركيزات منخفضة ، لم يؤثر بشكل كبير على نسبة استخدام موقع لصق 3 بأعلى تركيز (الشكل 8C ، الممرات 1-4 و 9– 12). تشير نتائجنا إلى أن تأثير CE4 على اختيار موقع لصق 3 يتم توسطه بواسطة عامل متميز عن hnRNP A1 وأن ​​الربط القريب لـ A1 غير مطلوب لهذا النشاط.


المواد التكميلية الإلكترونية

الجدول S2.

ملف إضافي 1: الجدول S1: بيانات البنية الجينية لأخصائيي تقويم العظام Picea glauca و صنوبر تايدا. الجدول S2. قائمة الجينات المرتبطة بتكوين جدار الخلية الثانوي أو استقلاب النيتروجين في P. glauca تستهدف عزل BAC. الجدول S3. معلومات التمهيدي والتسلسلات المستخدمة في فحص BAC والتحقق من التسلسل. الجدول S4. أعداد الانضمام P. تايدا المتعاملين وتسلسل التشابه ل P. glauca. الجدول S5. أرقام الانضمام لأقرب تسلسلات متجانسة بين P. glauca, نبات الأرابيدوبسيس thaliana, Populus trichocarpa و زيا ميس. الجدول S6. ملخص نتائج التسلسل P. glauca عزلت استنساخ BAC كل منها يحتوي على جين نسخة واحدة مختلفة مرتبطة بتكوين جدار الخلية الثانوي أو استقلاب النيتروجين. الجدول S7. تستخدم مداخلات GenBank من [كدنا] كاملة لتعريف بنية الجينات عندما يكون [كدنا] في Picea glauca كان كتالوج الجينات غير مكتمل. الجدول S8. تم اكتشاف العناصر المتكررة داخل البنية الجينية لـ 35 P. glauca الجينات. (ملف PDF 296 كيلوبايت)

12870_2013_1527_MOESM2_ESM.pdf

ملف إضافي 2: الشكل S2: تحليل مقارن لطول intron الفردي في P. glauca, A. thaliana ، P. trichocarpa و ز. ميس. أ. متوسط ​​ومتوسط ​​طول الإنترونات الفردية في جميع الجينات. ب متوسط ​​ومتوسط ​​طول الإنترونات الفردية في الجينات المعبر عنها بشدة والجينات المرتبطة بتكوين جدار الخلية الثانوي واستقلاب النيتروجين في أربعة أنواع. تمت مقارنة أطوال Intron بين الأنواع الأربعة بواسطة اختبار Kruskal-Wallis مع تحليل ما بعد الاختبار من خلال مقارنات Dunn المتعددة: NS ، غير مهم (P & gt 0.06) * P & lt 0.06 ** P & lt 0.01 *** P & lt 0.001. (ملف PDF بحجم 103 كيلوبايت)

الملف الإضافي 3: الشكل S3: Boxplot لـ 35 جينًا متماثلًا في P. glauca, A. thaliana, P. تريشوكاربا و ز. ميس.(ملف PDF 165 كيلوبايت)

12870_2013_1527_MOESM4_ESM.pdf

الملف الإضافي 4: الشكل S1: محتوى العناصر المتكررة في 21 نسخة مختلفة من BAC. استخدم التحليل برنامج RepeatMasker و P. glauca مكتبة التسلسل المتكرر (انظر الطرق). تم تصنيف العناصر المتكررة على أنها LTR (تكرار نهائي طويل) وغير مصنفة (لم يتم الوصول إليها في RepBase). (ملف PDF بحجم 61 كيلوبايت)

12870_2013_1527_MOESM5_ESM.pdf

ملف إضافي 5: ملف إضافي. إجراءات تجريبية إضافية لعزل BAC والتقاط التسلسل. (ملف PDF بحجم 153 كيلوبايت)


شاهد الفيديو: 19 s Exons and Introns (قد 2022).


تعليقات:

  1. Vik

    انت مخطئ. أنا متأكد. أقترح مناقشته. اكتب لي في رئيس الوزراء ، تحدث.

  2. Tlazopilli

    يا لها من عبارة مسلية

  3. Herlebeorht

    أنا آسف ، لكن في رأيي ، أنت مخطئ. أنا متأكد. دعونا نحاول مناقشة هذا. اكتب لي في PM.

  4. Kalevi

    هذه الجملة الرائعة على وشك

  5. Gordan

    يا لها من كلمات رائعة

  6. Jennalyn

    في رأيي ، أنت تعترف بالخطأ. أقدم لمناقشته.



اكتب رسالة