معلومة

تكرار تسلسل الجينوم

تكرار تسلسل الجينوم


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

كيف يمكننا تقدير أي جزء من الجينوم يكرر التسلسل دون تسلسله؟

شكرا لك


نعم ، من الممكن تقدير كمية الحمض النووي المتكرر في الجينوم بدون تسلسل. كانت هذه تقنية مهمة في الستينيات ، يشار إليها باسم تحليل C₀t وكان رائدها روي بريتن.

النهج المتبع هو دراسة حركية إعادة التشبع بالحمض النووي الجينومي المحوَّل بالحرارة (في شكل مجزأ). كما ترون في هذا الشكل المثالي المأخوذ من مقالة ويكيبيديا حول التقنية ، هناك مكونات تتجدد بسرعة بينما تتجدد المكونات الأخرى بشكل أبطأ:

تفسير ذلك هو أن التسلسلات المتكررة تتكرر بسرعة لأنها بتركيز أعلى من التسلسلات أحادية النسخة.

كما هو مذكور في مقالة ويكيبيديا المرتبطة:

... من خلال تحليل C₀t تم اكتشاف الطبيعة الزائدة عن الحاجة (المتكررة) لجينوم حقيقيات النوى لأول مرة.

وأخيرًا ، هنا اقتباس من مقالة Britten and Kohne لعام 1968 في العلوم:

يتناسب معدل إعادة ارتباط الخيوط التكميلية للدنا ذات الأصل الفيروسي والبكتيري عكسياً مع محتوى الحمض النووي (أحادي الصيغة الصبغية) لكل خلية. ومع ذلك ، فإن جزءًا كبيرًا من الحمض النووي للكائنات الحية الأعلى يعيد الارتباط بسرعة أكبر بكثير مما يمكن توقعه من محتوى الحمض النووي لكل خلية. يبدو أن جزء آخر يعيد الارتباط بالمعدل المتوقع. نستنتج أن أجزاء معينة من الحمض النووي تتكرر مئات الآلاف من المرات. يشير مسح لعدد من الأنواع إلى أن التسلسلات المتكررة تحدث على نطاق واسع وربما عالميًا في الحمض النووي للكائنات الحية الأعلى.


بالاتفاق معNicolai ، لا أعتقد أنه يمكنك ذلك!

بالطبع ، إذا افترضت أن لديك معرفة مسبقة عن جزء العناصر المتكررة في الكائنات الحية ذات الصلة ، فيمكنك محاولة تقديرها. عادةً ، إذا كنت تفكر في كاسيات البذور ، فأنت تعلم أنه سيكون لديك عناصر متكررة أكثر بكثير مما لو كنت تفكر في بكتيريا. كما أن حجم الخلايا وحجم النواة مرتبطان بحجم الجينوم (Gregory 2001) وحجم الجينوم نفسه مرتبط بعدد التسلسلات المتكررة (Flavell et al. 1974، Bennetzen et al.2005). ومع ذلك ، فإن هذه الارتباطات خاسرة جدًا ولن يكون من الممكن أن تكون دقيقًا بهذه الطرق.


تكرار تسلسل الجينوم - علم الأحياء

RepeatMasker هو برنامج يقوم بفحص تسلسلات الحمض النووي بحثًا عن التكرارات المتقطعة وتسلسلات الحمض النووي منخفضة التعقيد. ناتج البرنامج عبارة عن تعليق توضيحي مفصل للتكرارات الموجودة في تسلسل الاستعلام بالإضافة إلى نسخة معدلة من تسلسل الاستعلام حيث تم إخفاء جميع التكرارات المشروحة (افتراضي: تم استبدالها بـ Ns). حاليًا يتم تحديد أكثر من 56٪ من التسلسل الجيني البشري وإخفائه بواسطة البرنامج. يتم إجراء مقارنات التسلسل في RepeatMasker بواسطة أحد محركات البحث العديدة الشائعة بما في ذلك nhmmer و cross_match و ABBlast / WUBlast و RMBlast و Decypher. يستخدم RepeatMasker المكتبات المنسقة من التكرارات ويدعم حاليًا Dfam (مكتبة ملف التعريف HMM المستمدة من تسلسلات Repbase) و Repbase ، وهي خدمة تابعة لمعهد أبحاث المعلومات الجينية.

إذا كنت ترغب في متابعة الأخبار والإعلانات المتعلقة بـ RepeatMasker ، فيمكنك إما متابعتنا على Twitter: FollowRepeatMasker

تم إصدار RepeatModeler 2.0.2
الاثنين 3 مايو 2021
يتوفر إصدار جديد من RepeatModeler. يتضمن هذا الإصدار مجموعة من أدوات المعالجة اليدوية للاستخدام مع مكتبات TE التي تم إنشاؤها من قبل de-novo ، بالإضافة إلى إصلاحات الأخطاء المتنوعة والتحسينات.
تم إصدار RepeatMasker 4.1.2-p1
الخميس 1 أبريل 2021
يتوفر إصدار تصحيح جديد من RepeatMasker للتنزيل. يعمل هذا الإصدار على إصلاح خطأ في 4.1.1 / 4.1.2 مع معالجة تسلسل Alu في الرئيسيات. في هذه الإصدارات السابقة ، تم إخفاء تسلسلات Alu بشكل صحيح ، ومع ذلك لم يتم مقارنتها تلقائيًا بمكتبة Alu الفرعية الأكبر ولم تتلق شرحًا تفصيليًا للعائلة الفرعية. راجع صفحة RepeatMasker للحصول على تفاصيل التثبيت.
تم إصدار RepeatMasker 4.1.2
الجمعة 19 مارس 2021
إصدار جديد من RepeatMasker متاح للتنزيل. يعمل هذا الإصدار على إصلاح بعض المشكلات البسيطة في RepeatMasker والأدوات المساعدة الخاصة به. والأهم من ذلك ، أن هذا الإصدار يعالج مشكلة استخدامه بواسطة RepeatModeler والتي يمكن أن تسبب أداء تصنيف ضعيفًا في مكتبات denovo الخاصة بـ RepeatModeler. راجع صفحة RepeatMasker للحصول على تفاصيل التثبيت.
RMBlast 2.11.0
الخميس 11 مارس 2021
تم تحديث RMBlast إلى أحدث إصدار من أدوات NCBI BLAST + (2.11.0) ، بما في ذلك الثنائيات لنظام التشغيل Mac و Linux 64 بت. قدم هذا الإصدار تقارير استخدام إلغاء الاشتراك ، والتي قمنا بتعديلها في توزيعات RMBlast الخاصة بنا. راجع صفحة RMBlast لمزيد من التفاصيل.
تم إصدار RepeatMasker 4.1.1
الخميس 3 سبتمبر 2020
إصدار جديد من RepeatMasker متاح للتنزيل. في هذا الإصدار ، أضفنا دعمًا لملفات مكتبة Dfam 3.2 و FamDB (https://github.com/Dfam-consortium/FamDB). FamDB هو تنسيق مستند إلى HDF5 يخزن نماذج الأسرة (HMM وتسلسل الإجماع) ، والبيانات الوصفية للعائلة ، ومجموعة فرعية من قاعدة بيانات تصنيف NCBI ذات الصلة بالعائلات المخزنة داخلها. بالإضافة إلى ذلك ، يتضمن RepeatMasker الأداة المساعدة famdb.py التي تدعم نطاقًا واسعًا من قدرات الاستعلام والتصدير على البيانات المخزنة بهذا التنسيق. راجع صفحة RepeatMasker للحصول على تفاصيل التثبيت.
RMBlast 2.10.0
الأربعاء 8 يناير 2020
تم تحديث RMBlast إلى أحدث إصدار من أدوات NCBI Blast + (2.10.0) ، بما في ذلك الثنائيات لنظام التشغيل Mac و Linux 64 بت. راجع صفحة RMBlast للحصول على تفاصيل التثبيت.
تم إصدار RepeatModeler 2.0
الأربعاء 27 نوفمبر 2019
يتوفر إصدار جديد من RepeatModeler مع دعم لاكتشاف LTR القائم على الهيكل باستخدام LtrHarvest و Ltr_retriever. يعمل سير العمل الجديد الذي تم تطويره بالتعاون مع Jullien Flynn و Andrew Clark و Cedric Feschotte على تحسين جودة عائلات LTR التي تنتجها RepeatModeler. بالإضافة إلى إصلاحات الأخطاء ، قمنا بتحسين سرعة مرحلة التقنيع ، وأعدنا بناء نظام التكوين ليكون أكثر مرونة لمديري الحزم ، وقمنا بإنشاء حاويات Docker و Singularity للتثبيت المبسط. تم تقديم مخطوطة أولية إلى bioRxiv [856591].
تم إصدار RepeatMasker 4.1.0
الأربعاء ، 30 أكتوبر 2019
إصدار جديد من RepeatMasker متاح للتنزيل. في هذا الإصدار ، تمت إعادة هيكلة نظام التكوين لتسهيل توزيع RepeatMasker عبر مديري الحزم و / أو الحزم في حاويات Docker / Singularity. بالإضافة إلى ذلك ، قمنا بتضمين أداة python مفيدة (RM2Bed.py) تم تطويرها بواسطة مختبر David Ray لمعالجة / تصفية ملفات التعليقات التوضيحية RM (* .out) وحفظ الإخراج إلى تنسيق ملف BED. راجع صفحة RepeatMasker للحصول على تفاصيل التثبيت.
RMBlast 2.9.0-p1 bugfix
الأربعاء 7 أغسطس 2019
لقد حددنا خطأ في NCBI BLAST + يمكن أن يتسبب في بعض الأحيان في تعطل أو محاذاة مشوشة عند تشغيل rmblastn. لقد أصدرنا تصحيحًا جديدًا وأبلغنا النتائج التي توصلنا إليها إلى NCBI حتى يمكن إصلاحه في المرحلة الأولية. راجع صفحة RMBlast للحصول على تفاصيل التثبيت.
تغييرات خدمة اخفاء RepeatMasker
الاثنين 20 مايو 2019
اعتبارًا من 20 مايو 2019 ، ألغت GIRI اتفاقية العمل الخاصة بنا التي تسمح بـ www.repeatmasker.org لتقديم خدمة تكرار القناع باستخدام مكتبة RepBase RepeatMasker Edition. في هذا الوقت ، لا يمكننا تقديم إخفاء إلا باستخدام قاعدة البيانات المفتوحة Dfam ، والتي تبدأ في 3.0 تتضمن تسلسلات إجماع بالإضافة إلى نماذج ماركوف المخفية للملف الشخصي للعديد من عائلات العناصر القابلة للنقل. سيحتاج المستخدمون الذين يحتاجون إلى RepBase إلى شراء ترخيص تجاري أو أكاديمي من GIRI وتشغيل RepeatMasker localy. نحن نعمل على توسيع قاعدة بيانات Dfam وندعوك لزيارة Dfam (http://www.dfam.org) لمزيد من المعلومات.
RepeatMasker 4.0.9.0 تحديث
الثلاثاء 9 أبريل 2019
إصدار جديد من حزمة RepeatMasker متاح الآن. ستعمل RepeatMasker الآن مع قاعدة بيانات HMM Dfam المُجمَّعة الجديدة (Dfam 3.0) و / أو المكتبات المخصصة الجاهزة التي يوفرها المستخدم. Dfam هي قاعدة بيانات مفتوحة لنماذج HMM لملف تعريف العنصر القابل للنقل (TE) وتسلسلات الإجماع. يحتوي الإصدار الحالي (Dfam 3.0) على 6235 عائلة TE تغطي خمسة كائنات حية: الإنسان ، والفأر ، وأسماك الزرد ، وذبابة الفاكهة ، والديدان الخيطية ، وعدد متزايد من الأنواع الجديدة. راجع صفحة RepeatMasker للحصول على تفاصيل التثبيت.
RMBlast 2.9.0
الجمعة 5 أبريل 2019
تم تحديث RMBlast إلى أحدث إصدار من أدوات NCBI Blast + (2.9.0). يتم إصدار هذا الإصدار كتصحيح لمصدر NCBI Blast + وكثنائيات مجمعة لنظامي التشغيل Mac و Linux 64 بت. شكرًا مرة أخرى لـ NCBI على مساعدتهم في هذه الجهود. راجع صفحة RMBlast للحصول على تفاصيل التثبيت.
إدخال Dfam 3.0
الأربعاء 6 مارس 2019
يسر كونسورتيوم Dfam الإعلان عن إصدار Dfam 3.0. يمثل هذا الإصدار انتقالًا رئيسيًا لـ Dfam من قاعدة بيانات إثبات المفهوم إلى مورد مجتمع مفتوح ممول. من الأمور المركزية في هذا الانتقال هو تحديث البنية التحتية والتقنية الرئيسية ، مما يمكّن Dfam من التعامل مع الوتيرة المتزايدة لتسلسل الجينوم وإنشاء مكتبة TE. بنفس القدر من الأهمية ، قمنا بدمج Dfam_consensus مع Dfam لإنتاج مورد واحد لنمذجة عائلة العناصر القابلة للنقل والتعليق التوضيحي. عند القيام بذلك ، يخدم Dfam احتياجات مجتمع بحثي أوسع مع الحفاظ على مستوى عالٍ لتوصيف الأسرة (بناءً على محاذاة البذور) ، وحساسية التعليقات التوضيحية TE. أخيرًا ، والأهم من ذلك ، نحن نعمل على جعل Dfam موردًا يحركه المجتمع من خلال تطوير أدوات التنظيم عبر الإنترنت ومشاركة المستخدم المباشرة. [ اقرأ أكثر ].
للوصول إلى قاعدة البيانات ، انتقل إلى https://dfam.org.
RepeatMasker 4.0.8 وإصدار المكتبات
الأربعاء 21 نوفمبر 2018
تم إصدار حزمة RepeatMasker جديدة وقاعدة بيانات Repeat Protein وإصدار RepBase RepeatMasker. نمت قاعدة بيانات تكرار البروتين بأكثر من 7400 إدخالاً وتتضمن 16.1 مليون حمض أميني تغطي 133 فئة فرعية من العناصر القابلة للنقل. لمزيد من المعلومات حول هذه المكتبة ، راجع الوثائق المصاحبة للمكتبة. بالإضافة إلى ذلك ، قمنا بتحديث مكتبات RepeatMasker لـ RepBase (إصدار Repbase RepeatMasker 20180826 ، إصدار RepBase 23.08). يشمل التحديث أكثر من 4500 عائلة جديدة من: الأرز (1652) ، السلحفاة الغربية المرسومة (472) ، الضفدع الأفريقي المخالب (215) ، التبغ الخشبي (210) ، الذبابة البيضاء للبطاطا الحلوة (182) وغيرها. يمكن تنزيل حزمة RepeatMasker الجديدة من هنا. إصدار RepBase RepeatMasker الجديد متاح للتنزيل من: http://www.girinst.org.
  • Dfam_consensus - أصدرنا اليوم نسخة جديدة من قاعدة البيانات التي تحتوي على عدة عائلات جديدة لـ African Golden Mole ومكتبة لـ Collared Flycatcher التي قدمها ألكسندر سوه.
  • تتوفر الآن مستودعات تطوير برامج RepeatMasker و RepeatModeler و Coseg على GitHub. يمكن الآن تقديم طلبات المساعدة من خلال موقع GitHub بالإضافة إلى موقع replaymasker.org.
  • RepeatModeler - لقد عملنا بجد للقضاء على العديد من الأخطاء وتحسين أداة استيراد Dfam_consensus استنادًا إلى التعليقات التي تلقيناها. الإصدار الأحدث هو 10.0.11 ويمكن تنزيله من: GitHub أو Repeatmasker.org
- يستخدم RepeatMasker قاعدة بيانات Dfam لتكرار نماذج markov المخفية للملف الشخصي وتسلسلات الإجماع لإجراء عمليات البحث.
- يمكن لـ RepeatMasker أيضًا الاستفادة من Repbase وهي خدمة يقدمها معهد أبحاث المعلومات الجينية. Repbase هي قاعدة بيانات لتسلسلات إجماع العناصر المتكررة.
- البيانات والموارد الحسابية لصفحة الجينوم المقنع مسبقًا مقدمة من مجموعة المعلوماتية الحيوية لجينوم UCSC.

تسلسل الجينوم البشري: المناهج والتطبيقات

فيما يلي قائمة بالطرق المختلفة المستخدمة لرسم خرائط الجينوم البشري. هذه التقنيات مفيدة أيضًا في الكشف عن الجينات الطبيعية والمرضية لدى البشر.

1. تسلسل الحمض النووي: يمكن تحديد الخريطة الفيزيائية للحمض النووي بأعلى دقة.

2. استخدام المجسات: لتحديد RFLPs و STS و SNPs.

3. رسم الخرائط الهجينة الإشعاعية: تجزئة الجينوم إلى قطع كبيرة وتحديد مكان العلامات والجينات. يتطلب خلايا هجينة جسدية.

4. التهجين الفلوري في الموقع (FISH): لتوطين الجين على الكروموسوم.

5. رسم خرائط الموقع الموسوم بالتسلسل (STS): قابل للتطبيق على أي جزء من تسلسل الحمض النووي في حالة توفر بعض معلومات التسلسل.

6. تعيين علامة التسلسل المُعبَّر عنها (EST): يتم بالفعل تعيين وتحديد موقع متغير من الجينات المعبر عنها لرسم خرائط STS.

7. الرحلان الكهربائي للهلام النبضي (PFGE): لفصل وعزل شظايا الحمض النووي الكبيرة.

8. الاستنساخ في النواقل (البلازميدات ، العاثيات ، الأطوال المتغيرة ، الكوسميدات ، YACs ، BACs): لعزل أجزاء الحمض النووي ذات الأطوال المتغيرة.

9. تفاعل البلمرة المتسلسل (PCR): لتضخيم شظايا الجينات.

10. المشي الكروموسومي: مفيد في استنساخ شظايا الحمض النووي المتداخلة (مقيدة بحوالي 200 كيلو بايت).

11. قفز الكروموسوم: يمكن تقطيع الحمض النووي إلى أجزاء كبيرة وتحويله إلى شكل دائري لاستخدامه في المشي الكروموسومي.

12. الكشف عن التشوهات الوراثية الخلوية: يمكن التعرف على أمراض وراثية معينة عن طريق استنساخ الجينات المصابة مثل الحثل العضلي الدوشيني.

13. قواعد البيانات: قواعد البيانات الموجودة تسهل تحديد الجينات عن طريق مقارنة تسلسل الحمض النووي والبروتين.

لتوضيح الجينوم البشري ، تم استخدام طرق مختلفة من قبل مجموعتي HGP. تستخدم IHCSC في الغالب الخريطة الأولى ونهج التسلسل اللاحق. كانت الطريقة الرئيسية هي التسلسل الهرمي للبندقية. تتضمن هذه التقنية تجزئة الجينوم إلى أجزاء صغيرة (100-200 كيلو بايت) ، وإدخالها في نواقل (معظمها كروموسومات صناعية بكتيرية ، BACs) والاستنساخ. يمكن تسلسل الأجزاء المستنسخة.

استخدمت شركة Celera Genomics نهج بندقية الجينوم الكامل. هذا يتجاوز خطوة رسم الخرائط ويوفر الوقت. علاوة على ذلك ، كانت مجموعة Celera محظوظة لامتلاكها أجهزة تسلسل عالية الإنتاجية وبرامج كمبيوتر قوية ساعدت في الإكمال المبكر لتسلسل الجينوم البشري.

لمن تم تسلسل الجينوم؟

أحد الأسئلة المثيرة للاهتمام في مشروع الجينوم البشري هو الذي يتم تسلسل الجينوم الخاص به وكيف سيرتبط بـ 6 مليارات أو نحو ذلك من السكان مع وجود اختلافات في العالم؟ لا توجد إجابة بسيطة على هذا السؤال.

ومع ذلك ، بالنظر إلى الجانب الإيجابي ، لا يهم من يتم تسلسل الجينوم ، لأن الاختلافات المظهرية بين الأفراد ترجع إلى اختلافات في 0.1 ٪ فقط من إجمالي تسلسل الجينوم. لذلك يمكن استخدام العديد من الجينومات الفردية كمواد مصدر للتسلسل.

تم إجراء الكثير من أعمال الجينوم البشري على المواد التي قدمها مركز تعدد الأشكال البشرية في باريس ، فرنسا. كان هذا المعهد قد جمع سلالات خلوية من ستين عائلة فرنسية مختلفة ، كل منها يمتد لثلاثة أجيال. تم استخدام المواد الموردة من باريس لتسلسل الجينوم البشري.

تسلسل الجينوم البشري - تلخيص النتائج:

المعلومات حول مشاريع الجينوم البشري ضخمة للغاية ، ويمكن إعطاء بعض النقاط البارزة فقط أدناه. بعضها موصوف بإيجاز.

الملامح الرئيسية للجينوم البشري:

1. تمثل المسودة حوالي 90٪ من الجينوم البشري بأكمله. يُعتقد أنه تم تحديد معظم الأجزاء المهمة.

2. 10٪ المتبقية من سلاسل الجينوم تقع في نهايات الكروموسومات (أي التيلوميرات) وحول السنتروميرات.

3. يتكون الجينوم البشري من 3200 ميجا بايت (أو 3.2 جيجا بايت) أي 3.2 مليار زوج أساسي (3،200،000،000).

4. حوالي 1.1 إلى 1.5٪ من أكواد الجينوم للبروتينات.

5. ما يقرب من 24٪ من إجمالي الجينوم يتكون من إنترونات تقسم مناطق الترميز (exons) ، وتظهر كتسلسلات متكررة بدون وظائف محددة.

6. عدد جينات ترميز البروتين في حدود 30،000-40،000.

7. يتكون الجين المتوسط ​​من 3000 قاعدة ، إلا أن الأحجام تختلف اختلافًا كبيرًا. جين ديستروفين هو أكبر جين بشري معروف مع 2.4 مليون قاعدة.

8. يحتوي الكروموسوم 1 (الكروموسوم البشري المستهدف) على أكبر عدد من الجينات (2968) ، بينما يحتوي الكروموسوم Y على أقل عدد من الجينات. تختلف الكروموسومات أيضًا في محتوى GC وعدد العناصر القابلة للنقل.

9. تم تحديد تسلسل الجينات والحمض النووي المصاحب للعديد من الأمراض مثل سرطان الثدي وأمراض العضلات والصمم والعمى.

10. يبدو أن حوالي 100 منطقة ترميز قد تم نسخها ونقلها عن طريق التحويل المعتمد على الحمض النووي الريبي (الينقولات الرجعية).

11. تشكل التسلسلات المتكررة حوالي 50٪ من الجينوم البشري.

12. الغالبية العظمى من الجينوم (

97٪) ليس له وظائف معروفة.

13. يختلف الحمض النووي بين البشر بنسبة 0.2٪ فقط أو واحد من كل 500 قاعدة.

14- تم تحديد أكثر من 3 ملايين تعدد أشكال النوكليوتيدات المفردة (SNPs).

15. الحمض النووي البشري مطابق بنسبة 98٪ للحمض النووي للشمبانزي.

16. حوالي 200 جين قريبة من تلك الموجودة في البكتيريا.

تم تحديد معظم تسلسل الجينوم:

تم تسلسل حوالي 90٪ من الجينوم البشري. وهي تتألف من 3.2 مليار زوج أساسي (3200 ميجا بايت أو 3.2 جيجا بايت). إذا تمت كتابته بتنسيق دفتر هاتف ، فإن التسلسل الأساسي للجينوم البشري سيملأ حوالي 200 كتاب هاتف من 1000 صفحة لكل منها. يتم إعطاء بعض النظائر / الأضواء الجانبية الأخرى المثيرة للاهتمام للجينوم في الجدول 12.3.

الفروق الفردية في الجينوم:

يجب أن نتذكر أن كل فرد ، باستثناء التوائم المتطابقة ، له نسخه الخاصة من تسلسل الجينوم. ترجع الاختلافات بين الأفراد إلى حد كبير إلى تعدد أشكال النوكليوتيدات المفردة (SNPs). تمثل SNPs مواقع في الجينوم حيث يكون لدى بعض الأفراد نوكليوتيد واحد (أي A) ، والبعض الآخر لديهم نيوكليوتيد مختلف (أي G). يُقدر تكرار حدوث النيوكلوتايد بواحد لكل 1000 زوج أساسي. يُعتقد أن هناك حوالي 3 ملايين من النيوكلوتايد SNPs وتم تحديد نصفها على الأقل.

فوائد / تطبيقات تسلسل الجينوم البشري:

من المتوقع أن يؤدي تسلسل الجينوم البشري وجينومات الكائنات الحية الأخرى إلى تغيير كبير في فهمنا وتصوراتنا للبيولوجيا والطب. يتم إعطاء بعض فوائد مشروع الجينوم البشري.

تحديد الجينات البشرية ووظائفها:

ساعد تحليل الجينوم في تحديد الجينات ووظائف بعض الجينات. تحتاج وظائف الجينات الأخرى والتفاعل بين المنتجات الجينية إلى مزيد من التوضيح.

فهم الاضطرابات متعددة الجينات:

تم توضيح الكيمياء الحيوية وعلم الوراثة للعديد من الاضطرابات أحادية الجين ، على سبيل المثال. فقر الدم المنجلي ، والتليف الكيسي ، والورم الأرومي الشبكي. ومع ذلك ، فإن غالبية الأمراض الشائعة في البشر متعددة الجينات بطبيعتها ، على سبيل المثال. السرطان وارتفاع ضغط الدم والسكري. في الوقت الحاضر ، لدينا القليل جدًا من المعرفة حول أسباب هذه الأمراض. من المؤكد أن المعلومات المتعلقة بتسلسل الجينوم ستساعد في كشف الألغاز المحيطة بالأمراض متعددة الجينات.

تحسينات في العلاج الجيني:

في الوقت الحاضر ، العلاج الجيني البشري في مهده لأسباب مختلفة. ستساعد معرفة تسلسل الجينوم بالتأكيد في علاج أكثر فعالية للأمراض الوراثية عن طريق العلاج الجيني.

تحسين تشخيص الأمراض:

في المستقبل القريب ، ستتوفر تحقيقات للعديد من الأمراض الوراثية لتحديد محدد ومعالجة مناسبة.

تطوير علم الصيدلة الجيني:

قد تكون الأدوية مصممة لعلاج المرضى الفرديين. سيصبح هذا ممكنًا بالنظر إلى الاختلافات في الإنزيمات والبروتينات الأخرى المشاركة في عمل الدواء ، والتمثيل الغذائي للأفراد.

الأساس الجيني للاضطرابات النفسية:

من خلال دراسة الجينات المرتبطة بالأنماط السلوكية ، يمكن فهم سبب الأمراض النفسية. سيساعد هذا في علاج هذه الاضطرابات بشكل أفضل.

فهم السمات الاجتماعية المعقدة:

مع تسلسل الجينوم الآن في متناول اليد ، يمكن فهم السمات الاجتماعية المعقدة بشكل أفضل. على سبيل المثال ، تم تحديد الجينات التي تتحكم في الكلام مؤخرًا.

معرفة الطفرات:

يمكن الكشف عن العديد من الأحداث التي أدت إلى الطفرات بمعرفة الجينوم.

فهم أفضل لعلم الأحياء النمائي:

من خلال تحديد بيولوجيا الجينوم البشري والتحكم التنظيمي به ، سيكون من الممكن فهم كيفية تطور البشر من البويضات المخصبة إلى البالغين.

علم الجينوم المقارن:

تم ترتيب الجينومات من العديد من الكائنات الحية ، وسيزداد العدد في السنوات القادمة. ستلقي المعلومات حول جينومات الأنواع المختلفة الضوء على المراحل الرئيسية في التطور.

تطوير التكنولوجيا الحيوية:

ستحفز البيانات المتعلقة بتسلسل الجينوم البشري تطوير التكنولوجيا الحيوية في مختلف المجالات.


المواد والأساليب

المواد النباتية

خمسة ممثلين من الجنس لينوم تم اختيارهم لتسلسل الجينوم. تم الحصول على ثلاثة منهم من بنك الجينات التابع لمعهد لايبنيز لعلم الوراثة النباتية وبحوث المحاصيل النباتية (IPK) (جاترسليبن ، ألمانيا): L. hirsutum subsp. كثرة الشعر L. (رقم الانضمام LIN 1649، (hir))، ناربونينس L. (رقم الانضمام LIN 2002، (nar1)) و L. usitatissimum L. ، فار. Stormont cirrus (رقم الانضمام LIN 2016 ، (الولايات المتحدة الأمريكية)). عينة من بيرين تم جمع L. (per1) من السكان الطبيعيين (قرية Nesvetai ، منطقة Rostov ، الاتحاد الروسي) بواسطة Dr. A.A. سفيتلوفا ، معهد نباتات كوماروف RAS (سانت بطرسبرغ ، الاتحاد الروسي). عينة من الستيرويد تم تقديم Planchon (ste) من قبل الدكتور L.N. ميرونوفا ، معهد الحدائق النباتية التابع لفرع الشرق الأقصى لأكاديمية العلوم الروسية (فلاديفوستوك ، الاتحاد الروسي).

لتقدير حجم الجينوم ، بالإضافة إلى العينات المذكورة أعلاه ، خمسة أنواع من بنك الجينات IPK: L. leonii FW Schultz (رقم الانضمام LIN 1672 (leo)) ، L. لويسي Pursh (رقم الانضمام LIN 1648، (lew)) ، جرانيفلوروم ديسف. (رقم الانضمام LIN 974 (غرا)) ، L.decumbens ديسف. (رقم الانضمام LIN 1754 (ديسمبر)) و أنجستيفوليوم هودس. (رقم الدخول LIN 1642 (ang)) تم استخدامه.

تقدير حجم الجينوم

تم تحديد محتوى الحمض النووي لأنواع الكتان من خلال القياس الضوئي المقارن لـ Feulgen وفقًا لـ Boyko et al. ، [55]. باختصار ، يتضمن تعديل هذه الطريقة مزامنة خلايا خلايا الجذر بالمعالجة الباردة عند 0-4 درجة مئوية ليلاً ، والتثبيت في الإيثانول: مثبت حمض الأسيتيك (3: 1) عند 2-4 درجة مئوية ، والتحلل المائي عند 50 درجة مئوية في 1 N حمض الهيدروكلوريك لمدة 40 دقيقة ، النقع مع السليوليزين (Calbiochem ، الولايات المتحدة الأمريكية) ونصائح الجذر سحق على الشرائح المجهرية. تم قياس حوالي 50 نواة طور لكل عينة كتان باستخدام مقياس ضوئي للمسح الضوئي Opton. تم إجراء القياسات فيما يتعلق بخلايا كبد الفئران ثنائية الصبغيات التي تحتوي على 7.8 بيكوغرام من الحمض النووي لكل نواة 2 درجة مئوية [56] و Hordeum vulgare فار. Odesski 31 يحتوي على 22.6 بيكوغرام من الحمض النووي لكل نواة 4 درجة مئوية [57].

استخراج الحمض النووي وبناء المكتبة والتسلسل

تم استخدام شتلات الكتان لاستخراج الحمض النووي كما هو موضح سابقًا [50]. تم استخدام الحمض النووي عالي الجودة لإعداد مكتبة الحمض النووي باستخدام TruSeq DNA Sample Prep Kit (Illumina ، الولايات المتحدة الأمريكية): تم تجزئة 1000 نانوغرام من كل عينة عن طريق الإرذاذ ، ثم تم إجراء الإصلاح النهائي ، والغدة ثلاثية الأطراف ، وربط المحول بعد بروتوكول الشركة المصنعة. تم استئصال شظايا الحمض النووي التي تبلغ حوالي 500-700 زوج قاعدي من هلام الاغاروز وتنقيتها باستخدام MinElute Gel Extraction Kit (Qiagen ، الولايات المتحدة الأمريكية). تم إجراء تخصيب شظايا الحمض النووي باستخدام PCR Master Mix و Primer Cocktail (Illumina ، الولايات المتحدة الأمريكية). تم تقييم جودة وتركيز المكتبات التي تم الحصول عليها باستخدام Agilent 2100 Bioanalyzer (Agilent Technologies ، الولايات المتحدة الأمريكية) ومقياس التألق Qubit 2.0 (تقنيات الحياة ، الولايات المتحدة الأمريكية). تم تسلسل المكتبات على جهاز التسلسل MiSeq (Illumina ، الولايات المتحدة الأمريكية) ، وتم الحصول على قراءات مقترنة بنهاية (300 + 300 نيوكليوتيد).

تحديد وتحليل الكسر الجينومي المتكرر

لتحليل التكرارات ، تم الحصول على قراءات نهائية خام خام تم الحصول عليها نتيجة WGS لأنواع الكتان الخمسة التي تم إجراؤها في إطار هذه الدراسة وكذلك قراءات نهائية أولية من WGS لأنواع الكتان البرية المتوفرة في النيوكليوتيد الأوروبي الأرشيف (ENA) [58]: L. leonii (رقم المدخل SRR1592650، (ليو))، L. lewissii (رقم الانضمام SRR1592654، (lew))، بيرين (رقم الانضمام SRR1592548، (لكل 2))، ناربونينس (رقم المدخل SRR1592545، (nar2)) جرانديفلوروم (رقم المدخل SRR1592647، (gra))، L. ديكومبينس (رقم الانضمام SRR1592610، (ديسمبر)) و أنجستيفوليوم (رقم المدخل SRR1592607، (ang)).

لتحديد وتصنيف التسلسلات المتكررة في جينومات الكتان ، تم تحليل قراءات WGS الأولية المزدوجة النهاية باستخدام مجموعة أدوات RepeatExplorer [17]. لكل جينوم تمت دراسته ، تمت تصفية قراءات WGS حسب الجودة ، ثم تم أخذ عينات عشوائيًا إلى تغطية الجينوم النهائية حوالي 0.1X ، وتقليمها إلى طول 100 نقطة أساس وتجميعها باستخدام خوارزمية التجميع القائمة على الرسم البياني. تم استخدام قطع تشابه القراءة بنسبة 90٪ للتجميع. تم تجميع القراءات التي تنتمي إلى نفس المجموعات في contigs. تم استخدام حد أدنى لطول تداخل التسلسل بنسبة 55 ٪ للتجميع. تم تحديد مجموعات التسلسل التي تم الحصول عليها بناءً على بحث تشابه مقابل قاعدة بيانات مكررة تم تنفيذها في Repeat Explorer. تم إجراء تحديد وتوصيف تسلسل التكرار الترادفي بواسطة أداة TAREAN الخاصة بـ Repeat Explorer. تم تحديد المجموعات التي تحتوي على تكرارات القمر الصناعي بناءً على شكل كروي أو يشبه الحلقة من الرسوم البيانية العنقودية. تم إنشاء إعادة بناء المونومرات لتكرار القمر الصناعي باستخدام تحليل k-mer. لقد أخذنا في الاعتبار فقط تسلسلات الأقمار الصناعية المفترضة التي لديها احتمال أن يكون DNA ساتليًا لا يقل عن 0.1 وتشكل ما لا يقل عن 0.01 ٪ من الجينوم. تمت مقارنة التكرارات المفترضة للقمر الصناعي التي تم الحصول عليها مع التسلسلات المعروفة من NCBI بواسطة BLASTN.

تصميم المواد الأولية وتضخيم تفاعل البوليميراز المتسلسل (PCR) للأقمار الصناعية المفترضة

لجميع عينات الكتان ماعدا L. usitatissimum و L. bienne، تم أيضًا فحص التنظيم الترادفي لعائلات satDNAs المفترضة التي تم العثور عليها عن طريق تضخيم PCR. لهذا الغرض ، تم تصميم الاشعال في اتجاه معاكس لمعظم المناطق المحفوظة من تسلسل توافق الآراء المونومرات (الجدول 1).

تم فحص نمط السلم المميز للتكرارات الترادفية بعد الرحلان الكهربائي في هلام الاغاروز 2٪. تم تأكيد موثوقية منتج PCR من خلال تسلسل Sanger. ل L. usitatissimum و أنجستيفوليوم ، تم التحقق من موثوقية عائلات satDNA المفترضة من خلال مقارنة BLASTN مع خريطة بصرية لجينوم BioNano (BNG) L. usitatissimum السيرة الذاتية. CDC Bethune [59] متوفر في GenBank (NCBI) ضمن GenomeProject ID # 68161 (أرقام الانضمام CP027619 - CP027633).

التحليل الوراثي والتقييم الإحصائي

لبناء شجرة النشوء والتطور على أساس التراكيب المتكررة ، تم استخدام النهج المنشور سابقا [60]. تم تصفية المجموعات المقابلة لتسلسل الحمض النووي البلاستيد والميتوكوندريا قبل الاستدلال النشوء والتطور. تم تقسيم كل وفرة بواسطة عامل التصحيح (أكبر وفرة / 65) لجعل جميع الأرقام في المصفوفات 65 كما هو مطلوب لعمليات بحث شجرة TNT [61 ، 62]. مصفوفة البيانات التي تحتوي على نسبة نسبية لأعلى 200 مجموعة تم تحويلها إلى تنسيق TNT (معدل Hennig86). تم إجراء إعادة التشكيل باستخدام 100 مكررات. تم تصور الشجرة بواسطة أداة iTOL [63].


لماذا يعد الحمض النووي المتكرر ضروريًا لوظيفة الجينوم

هناك أسباب نظرية واضحة والعديد من الأمثلة الموثقة جيدًا والتي تُظهر أن الحمض النووي المتكرر ضروري لوظيفة الجينوم. تعد الإشارات العامة المتكررة في الحمض النووي ضرورية لتنسيق التعبير عن ملفات تسلسل الترميز الفريدة ولتنظيم الوظائف الإضافية الضرورية لتكرار الجينوم والانتقال الدقيق إلى خلايا النسل. تعد عناصر تسلسل الحمض النووي المتكررة أيضًا أساسية للتفاعلات الجزيئية التعاونية التي تشكل مجمعات البروتين النووي. هنا ، نراجع الوفرة المذهلة للحمض النووي المتكرر في العديد من الجينومات ، ونصف تنوعها الهيكلي ، ونناقش العشرات من الحالات التي تمت فيها دراسة الأهمية الوظيفية للعناصر المتكررة بالتفصيل الجزيئي. على وجه الخصوص ، حقيقة أن العناصر المتكررة تعمل إما كمبادرين أو حدود لمجالات الكروماتين المتغاير وتوفر جزءًا كبيرًا من مناطق ربط السقالات / المصفوفة (S / MARs) تشير إلى أن المكون المتكرر للجينوم يلعب دورًا معماريًا رئيسيًا في المستوى المادي الأعلى. الهيكلة. باستخدام نموذج علم المعلومات ، يؤدي المنظور "الوظيفي" حول الحمض النووي المتكرر إلى طرق جديدة للتفكير في التنظيم الجهازي للجينومات الخلوية ويوفر العديد من الاحتمالات الجديدة التي تتضمن عناصر متكررة في إعادة تنظيم الجينوم التطوري. قد تسهل هذه الأفكار تفسير المقارنات بين الجينومات المتسلسلة ، حيث غالبًا ما يكون مكون الحمض النووي المتكرر أكبر من مكون تسلسل الترميز.


مناقشة

إعادة التركيب Xer التيروزين محفوظة وقديمة

في هذه الدراسة ، قمنا بابتكار نظام تصنيف لمعدلات YR البكتيرية المرتبطة بـ Xer recombinases. بناءً على إعادة البناء الوراثي ، قمنا بتقسيم جميع بروتينات YR إلى مجموعتين وعشرين مجموعة فرعية. من بين هؤلاء ، فإن المجموعة الفرعية Xer من YRs البسيطة هي الأكثر وفرة والأكثر انتشارًا ، والتي تتضمن متماثلات قريبة لبروتينات دقة الكروموسوم ثنائية الأبعاد XerC / D من 16 شعبة بكتيرية (الشكل 1 والملحق الشكل S1). والجدير بالذكر أن التقارير الأخيرة وصفت توزيعًا تصنيفيًا متطابقًا للحمضيات المحفوظة ديف تسلسل الحمض النووي (كونو وآخرون، 2011) ، والتي تعمل كمواقع إعادة تركيب Xer على الكروموسومات البكتيرية ، مما يشير إلى دور وظيفي محفوظ على نطاق واسع لهذه البروتينات. تم العثور على نسالة تأليف XerC / D في البكتيريا البروتينية أيضًا مرتبطة بتصنيف مضيفها ، مما يشير إلى أن تطورها يتبع مسارًا رأسيًا صارمًا (Carnoy & Roten ، 2009). هذا التوزيع الواسع والميراث الرأسي لـ Xer-ديف تشير أنظمة Xer إلى أن بروتينات Xer هي أقدم أنواع YRs البكتيرية ، والتي ربما كانت بمثابة المصدر التطوري لـ YRs الأخرى الأكثر تعقيدًا.

يمكن أن تقود إعادة تركيب التيروزين البسيطة حركة العناصر الوراثية المتنقلة

إلى جانب بروتينات الكروموسومات Xer ، حددنا العديد من YRs البسيطة المشفرة على MGEs ، مثل العاثيات أو ICEs. تنتمي معظم هذه السنوات إلى مجموعتين فرعيتين ، هما Intبروجيتا المجموعة الفرعية الموجودة في الفطريات و IntKX مجموعة فرعية من ICEs للجراثيم البكتيرية غاما سقطت بعض الأمثلة المعزولة في المجموعات الفرعية Xer و RitB (Datasets EV1 و EV3). والجدير بالذكر أن العديد من هذه البروتينات قد ثبت أنها مطلوبة لتعبئة عناصرها الخاصة (Qiu وآخرون، 2006 فيشر وآخرون، 2010 فلانري وآخرون، 2011 لونت وهاتفول ، 2016). على سبيل المثال ، يدفع معدل YR البسيط لعاثية Brujita بفاعلية عملية الاستئصال والتكامل (Lunt & Hatfull ، 2016) ، وهناك حاجة إلى XerT من جزر هيليكوباكتر الممرضة لنقلها الأفقي (Fischer وآخرون، 2010). تشير العلاقة الوثيقة بين YRs المنقولة بواسطة MGE مع مجموعة Xer الفرعية وأهميتها لوظيفة MGE إلى أن العاثيات و ICE قد عزلت جينات Xer مرارًا وتكرارًا من جينومات مضيفها وأعدت توظيفها وظيفيًا لدفع عملية نقلها. بدلاً من ذلك ، ربما تم تدجين جمل MGE من قبل المضيف لوظائف الدقة الباهتة ، كما تم اقتراحه مؤخرًا (Koonin وآخرون، 2020). ومع ذلك ، فإن هذا يتعارض مع التطور الرأسي الملحوظ والتوزيع التصنيفي الواسع لجينات Xer.

أدى الحصول على مجال ربط الذراع إلى تطور جمل العناصر الجينية المتنقلة

بينما تحمل بعض العاثيات و ICEs YRs بسيطًا ، فإن معظمها يمتلك YRs أكثر تعقيدًا يحتوي على مجال AB. في الواقع ، اكتشف تحليلنا 27 فجوة مع YRs بسيط مقابل 410 مع YRs الحاملة لمجال AB (Dataset EV1). Similarly, we found 12 ICEs that carry only simple YRs, whereas 211 had AB domain-containing YRs (Dataset EV3). These complex YRs cluster into a monophyletic group with six distinct subgroups, where all subgroups contain an N-terminal AB domain with similar secondary structure (Fig 3), suggesting a common evolutionary origin. Although the AB domain is less conserved than the CAT domain, sequence similarity can be detected between different YR subgroups. Pfam AB domains from all subgroups belong to the same clan (CL0081), and sequence logos show significant conservation within and across subgroups (Fig 3). In agreement, previous structural studies also revealed a similar AB fold in the lambda phage integrase and in IntTn916 and IntSXT family YRs (Clubb وآخرون، 1999 Wojciak وآخرون، 2002 Szwagierczak وآخرون، 2009 ).

The functional role of the AB domain may be inferred from its function in the lambda phage integrase, one of the best-characterized members of this YR group. Here, the AB domain binds to internal arm DNA sequences within the phage genome and plays an essential role in guiding DNA recombination toward excision or integration in different stages of the phage lifecycle (Tirumalai وآخرون، 1996 Biswas وآخرون، 2005 Radman-Livaja وآخرون، 2006). The presence of an AB domain in the vast majority of ICE and phage integrases indicates that these elements generally benefit from the function of this domain in regulating their integration and excision. MGEs that carry simple YRs may represent an earlier step in evolution with less intricate regulatory features (Lunt & Hatfull, 2016 ). Interestingly, large serine recombinases that perform integration and excision of discrete phages also require a separate DNA-binding domain for precise regulation (Rutherford & Van Duyne, 2014 ), indicating that acquisition of accessory DNA-binding domains may be a common strategy in MGE evolution.

Tyrosine recombinase classification aids the annotation of mobile genetic elements in bacterial genomes

The recent increase in bacterial genome sequence data highlighted the impact of MGEs and motivated the development of automated sequence-based MGE mining tools. For insertion sequences, the simplest MGEs that typically contain an RNaseH-like DDE transposase flanked by short inverted repeats, existing pipelines provide confident annotation through homology-based prediction (Xie & Tang, 2017 ). The recently communicated TIGER pipeline also maps various integrative genomic elements by using Pfam-based annotations (Mageeney وآخرون، 2020 ). However, for YR-carrying elements the close relationship of YR family transposases/integrases to essential bacterial genes has greatly hampered functional annotation. In particular, the TIGER software tackles this by discarding Xer and Integron-related sequences, assuming that all other YRs are MGE integrases, which results in false-positive hits (Mageeney وآخرون، 2020 ). Through comprehensive YR classification, we found that the presence of an AB domain in a YR is a strong predictor of its function in phage or ICE mobility. In fact, acquisition of this AB domain by YRs and their cooperation with Xis proteins may have driven evolutionary adaptation of YRs to a “mobile lifestyle”, helping to promote and regulate MGE movement in and between bacterial cells. Sequence features in all YR domains further support functional annotation of MGE-borne proteins and can even enable identification of simple YRs with a specific mobility function. These direct sequence-to-function relationships open up new opportunities for functional annotation and provide clear rules for predicting the mobile nature of YRs and the genomic regions they reside in.

By using our classification system, we identified new ICEs in diverse genomes with mobile YRs as markers. We found 59 previously unannotated ICEs, substantially expanding the repertoire of known elements and illustrating the power of our approach for automated MGE detection. Going forward, application of our pipeline will help explore the abundance and diversity of MGEs in bacterial genomes in diverse environments. Comprehensive studies of MGE content, distribution, and dynamics are necessary to track MGE transfer and to assess their impact on genetic exchange and bacterial adaptation. These studies are important to better understand the dynamics of microbial communities and to follow the spread of genetic traits, such as antibiotic resistance. Our work prepares the stage for analyzing the full repertoire of MGEs and their cargo in bacterial genomes, thus offering new opportunities to characterize gene flow in bacterial communities.


محتويات

A transposition in which the transposed material is copied to the transposition site, rather than excised from the original site. [ بحاجة لمصدر ]

Long strands of repetitive DNA can be found at each end of a LTR retrotransposon. These are termed long terminal repeats (LTRs) that are each a few hundred base pairs long, hence retrotransposons with LTRs have the name long terminal repeat (LTR) retrotransposon. LTR retrotransposons are over 5 kilobases long. Between the long terminal repeats there are genes that can be transcribed equivalent to retrovirus genes gag and pol. These genes overlap so they encode a protease that processes the resulting transcript into functional gene products. Gag gene products associate with other retrotransposon transcripts to form virus-like particles. Pol gene products include enzymes reverse transcriptase, integrase and ribonuclease H domains. Reverse transcriptase carries out reverse transcription of retrotransposon DNA. Integrase 'integrates' retrotransposon DNA into eukaryotic genome DNA. Ribonuclease cleaves phosphodiester bonds between RNA nucleotides.

LTR retrotransposons encode transcripts with tRNA binding sites so that they can undergo reverse transcription. The tRNA-bound RNA transcript binds to a genomic RNA sequence. Template strand of retrotransposon DNA can hence be synthesised. Ribonuclease H domains degrade eukaryotic genomic RNA to give adenine- and guanine-rich DNA sequences that flag where the complementary noncoding strand has to be synthesised. Integrase then 'integrates' the retrotransposon into eukaryotic DNA using the hydroxyl group at the start of retrotransposon DNA. This results in a retrotransposon flagged by long terminal repeats at its ends. Because the retrotransposon contains eukaryotic genome information it can insert copies of itself into other genomic locations within a eukaryotic cell.

An endogenous retrovirus is a retrovirus without virus pathogenic effects that has been integrated into the host genome by inserting their inheritable genetic information into cells that can be passed onto the next generation like a retrotransposon. [8] Because of this, they share features with retroviruses and retrotransposons. When the retroviral DNA is integrated into the host genome they evolve into endogenous retroviruses that influence eukaryotic genomes. So many endogenous retroviruses have inserted themselves into eukaryotic genomes that they allow insight into biology between viral-host interactions and the role of retrotransposons in evolution and disease. Many retrotransposons share features with endogenous retroviruses, the property of recognising and fusing with the host genome. However, there is a key difference between retroviruses and retrotransposons, which is indicated by the env gene. Although similar to the gene carrying out the same function in retroviruses, the env gene is used to determine whether the gene is retroviral or retrotransposon. If the gene is retroviral it can evolve from a retrotransposon into a retrovirus. They differ by the order of sequences in pol genes. Env genes are found in LTR retrotransposon types Ty1-copia (Pseudoviridae), Ty3-gypsy (Metaviridae) and BEL/Pao. [9] [8] They encode glycoproteins on the retrovirus envelope needed for entry into the host cell. Retroviruses can move between cells whereas LTR retrotransposons can only move themselves into the genome of the same cell. [10] Many vertebrate genes were formed from retroviruses and LTR retrotransposons. One endogenous retrovirus or LTR retrotransposon has the same function and genomic locations in different species, suggesting their role in evolution. [11]

Like LTR retrotransposons, non-LTR retrotransposons contain genes for reverse transcriptase, RNA-binding protein, nuclease, and sometimes ribonuclease H domain [12] but they lack the long terminal repeats. RNA-binding proteins bind the RNA-transposition intermediate and nucleases are enzymes that break phosphodiester bonds between nucleotides in nucleic acids. Instead of LTRs, non-LTR retrotransposons have short repeats that can have an inverted order of bases next to each other aside from direct repeats found in LTR retrotransposons that is just one sequence of bases repeating itself.

Although they are retrotransposons, they cannot carry out reverse transcription using an RNA transposition intermediate in the same way as LTR retrotransposons. Those two key components of the retrotransposon are still necessary but the way they are incorporated into the chemical reactions is different. This is because unlike LTR retrotransposons, non-LTR retrotransposons do not contain sequences that bind tRNA.

They mostly fall into two types – LINEs and SINEs. SVA elements are the exception between the two as they share similarities with both LINEs and SINEs, containing Alu elements and different numbers of the same repeat. SVAs are shorter than LINEs but longer than SINEs.

While historically viewed as "junk DNA", research suggests in some cases, both LINEs and SINEs were incorporated into novel genes to form new functions. [13]

LINEs Edit

When a LINE is transcribed, the transcript contains an RNA polymerase II promoter that ensures LINEs can be copied into whichever location it inserts itself into. RNA polymerase II is the enzyme that transcribes genes into mRNA transcripts. The ends of LINE transcripts are rich in multiple adenines, [14] the bases that are added at the end of transcription so that LINE transcripts would not be degraded. This transcript is the RNA transposition intermediate.

The RNA transposition intermediate moves from the nucleus into the cytoplasm for translation. This gives the two coding regions of a LINE that in turn binds back to the RNA it is transcribed from. The LINE RNA then moves back into the nucleus to insert into the eukaryotic genome.

LINEs insert themselves into regions of the eukaryotic genome that are rich in bases AT. At AT regions LINE uses its nuclease to cut one strand of the eukaryotic double-stranded DNA. The adenine-rich sequence in LINE transcript base pairs with the cut strand to flag where the LINE will be inserted with hydroxyl groups. Reverse transcriptase recognises these hydroxyl groups to synthesise LINE retrotransposon where the DNA is cut. Like with LTR retrotransposons, this new inserted LINE contains eukaryotic genome information so it can be copied and pasted into other genomic regions easily. The information sequences are longer and more variable than those in LTR retrotransposons.

Most LINE copies have variable length at the start because reverse transcription usually stops before DNA synthesis is complete. In some cases this causes RNA polymerase II promoter to be lost so LINEs cannot transpose further. [15]

Human L1 Edit

LINE-1 (L1) retrotransposons make up a significant portion of the human genome, with an estimated 500,000 copies per genome. Genes encoding for human LINE1 usually have their transcription inhibited by methyl groups binding to its DNA carried out by PIWI proteins and enzymes DNA methyltransferases. L1 retrotransposition can disrupt the nature of genes transcribed by pasting themselves inside or near genes which could in turn lead to human disease. LINE1s can only retrotranspose in some cases to form different chromosome structures contributing to differences in genetics between individuals. [17] There is an estimate of 80–100 active L1s in the reference genome of the Human Genome Project, and an even smaller number of L1s within those active L1s retrotranspose often. L1 insertions have been associated with tumorigenesis by activating cancer-related genes oncogenes and diminishing tumor suppressor genes.

Each human LINE1 contains two regions from which gene products can be encoded. The first coding region contains a leucine zipper protein involved in protein-protein interactions and a protein that binds to the terminus of nucleic acids. The second coding region has a purine/pyrimidine nuclease, reverse transcriptase and protein rich in amino acids cysteines and histidines. The end of the human LINE1, as with other retrotransposons is adenine-rich. [18] [19] [20]

SINEs Edit

SINEs are much shorter (300bp) than LINEs. [21] They share similarity with genes transcribed by RNA polymerase II, the enzyme that transcribes genes into mRNA transcripts, and the initiation sequence of RNA polymerase III, the enzyme that transcribes genes into ribosomal RNA, tRNA and other small RNA molecules. [22] SINEs such as mammalian MIR elements have tRNA gene at the start and adenine-rich at the end like in LINEs.

SINEs do not encode a functional reverse transcriptase protein and rely on other mobile transposons, especially LINEs. [23] SINEs exploit LINE transposition components despite LINE-binding proteins prefer binding to LINE RNA. SINEs cannot transpose by themselves because they cannot encode SINE transcripts. They usually consist of parts derived from tRNA and LINEs. The tRNA portion contains an RNA polymerase III promoter which the same kind of enzyme as RNA polymerase II. This makes sure the LINE copies would be transcribed into RNA for further transposition. The LINE component remains so LINE-binding proteins can recognise the LINE part of the SINE.

Alu elements Edit

ألوs are the most common SINE in primates. They are approximately 350 base pairs long, do not encode proteins and can be recognized by the restriction enzyme AluI (hence the name). Their distribution may be important in some genetic diseases and cancers. Copy and pasting Alu RNA requires the Alu's adenine-rich end and the rest of the sequence bound to a signal. The signal-bound Alu can then associate with ribosomes. LINE RNA associates on the same ribosomes as the Alu. Binding to the same ribosome allows Alus of SINEs to interact with LINE. This simultaneous translation of Alu element and LINE allows SINE copy and pasting.

SVA elements are present at lower levels than SINES and LINEs in humans. The starts of SVA and Alu elements are similar, followed by repeats and an end similar to endogenous retrovirus. LINEs bind to sites flanking SVA elements to transpose them. SVA are one of the youngest transposons in great apes genome and among the most active and polymorphic in the human population.

A recent study developed a network method that reveals SVA retroelement (RE) proliferation dynamics in hominid genomes. [24] The method enable to track the course of SVA proliferation, identify yet unknown active communities, and detect tentative "master REs" that play key roles in SVA propagation. Thus, providing support for the fundamental "master gene" model of RE proliferation.

Retrotransposons ensure they are not lost by chance by occurring only in cell genetics that can be passed on from one generation to the next from parent gametes. However, LINEs can transpose into the human embryo cells that eventually develop into the nervous system, raising the question whether this LINE retrotransposition affects brain function. LINE retrotransposition is also a feature of several cancers, but it is unclear whether retrotransposition itself causes cancer instead of just a symptom. Uncontrolled retrotransposition is bad for both the host organism and retrotransposons themselves so they have to be regulated. Retrotransposons are regulated by RNA interference. RNA interference is carried out by a bunch of short non-coding RNAs. The short non-coding RNA interacts with protein Argonaute to degrade retrotransposon transcripts and change their DNA histone structure to reduce their transcription.

LTR retrotransposons came about later than non-LTR retrotransposons, possibly from an ancestral non-LTR retrotransposon acquiring an integrase from a DNA transposon. Retroviruses gained additional properties to their virus envelopes by taking the relevant genes from other viruses using the power of LTR retrotransposon.

Due to their retrotransposition mechanism, retrotransposons amplify in number quickly, composing 40% of the human genome. The insertion rates for LINE1, Alu and SVA elements are 1/200 – 1/20, 1/20 and 1/900 respectively. The LINE1 insertion rates have varied a lot over the past 35 million years, so they indicate points in genome evolution.

Notably a large number of 100 kilobases in the maize genome show variety due to the presence or absence of retrotransposons. However since maize is unusually genetically compared to other plants it cannot be used to predict retrotransposition in other plants.


ملاحظة الناشر تظل Springer Nature محايدة فيما يتعلق بالمطالبات القضائية في الخرائط المنشورة والانتماءات المؤسسية.

Extended Data Fig. 1 Distribution of genome sizes (GS).

Distribution of genome sizes (GS) in (أ) 10,770 angiosperms (out of ج. 350,000 known species) (ب) 506 gymnosperms (out of ج. 1,000 known species).

Extended Data Fig. 2 Genome proportion of the different classes of repeats.

Genome proportion of the different classes of repeats based on copy number fitted against ln-transformed genome size. The grey regression lines show estimated trends for all 101 species fitted with a beta regression (see also Supplementary Table 4). Orange lines show the estimated slope from phylogenetic least squares (PGLS) using a phylogeny with proportional branch lengths (phy P) fitted with an Ornstein–Uhlenbeck process. We also tested a phylogeny with branch lengths transformed to a cladogram (phy C), and results were similar to this PGLS (not shown).

Extended Data Fig. 3 Transposable element analysis of 77 seed plant species.

Analysis of 77 seed plant species (69 angiosperms (1 early-diverging angiosperm, 53 eudicots, 15 monocots) and eight gymnosperms) showing how the proportion of the genome occupied by transposable element-related protein coding domains varies with ln-transformed genome size. The regression lines show the slopes estimated from a beta regression, and from a PGLS with an Ornstein–Uhlenbeck process. The regression line of the graph is similar to that seen for the whole repetitive fraction (see Extended Data Fig. 2a).

Extended Data Fig. 4 Genome proportion of repeats in eudicots, monocots and gymnosperms.

Genome proportion of repeats in four categories (sequences ≤ 20 copies, low (21–500), middle (501–10,000) and high (>10,000) copy sequences fitted against ln-transformed genome size, separately for eudicots, monocots and gymnosperms. See also Supplementary Table 4, which shows significant relationships in these datasets.


الخرائط المادية

توفر الخريطة المادية تفاصيل المسافة المادية الفعلية بين العلامات الجينية ، بالإضافة إلى عدد النيوكليوتيدات. There are three methods used to create a physical map: cytogenetic mapping, radiation hybrid mapping, and sequence mapping. Cytogenetic mapping uses information obtained by microscopic analysis of stained sections of the chromosome (Figure 2). من الممكن تحديد المسافة التقريبية بين العلامات الجينية باستخدام الخرائط الوراثية الخلوية ، ولكن ليس المسافة الدقيقة (عدد الأزواج الأساسية). تستخدم الخرائط الهجينة الإشعاعية الإشعاع ، مثل الأشعة السينية ، لتقسيم الحمض النووي إلى أجزاء. The amount of radiation can be adjusted to create smaller or larger fragments. This technique overcomes the limitation of genetic mapping and is not affected by increased or decreased recombination frequency. Sequence mapping resulted from DNA sequencing technology that allowed for the creation of detailed physical maps with distances measured in terms of the number of base pairs. The creation of genomic libraries and complementary DNA (cDNA) libraries (collections of cloned sequences or all DNA from a genome) has sped up the process of physical mapping. A genetic site used to generate a physical map with sequencing technology (a sequence-tagged site, or STS) is a unique sequence in the genome with a known exact chromosomal location. تعد علامة التسلسل المعبر عنها (EST) وتعدد الأشكال لطول التسلسل الفردي (SSLP) من STS الشائعة. An EST is a short STS that is identified with cDNA libraries, while SSLPs are obtained from known genetic markers and provide a link between genetic maps and physical maps.

/>Figure 1: This is a physical map of the human X chromosome. (credit: modification of work by NCBI, NIH)


Analysis of Simple Sequence Repeats in Genomes of Rhizobia

Simple sequence repeats (SSRs) or microsatellites, as genetic markers, are ubiquitous in genomes of various organisms. The analysis of SSR in rhizobia genome provides useful information for a variety of applications in population genetics of rhizobia. We analyzed the occurrences, relative abundance, and relative density of SSRs, the most common in Bradyrhizobium japonicum, Mesorhizobium loti، و Sinorhizobium meliloti genomes sequenced in the microorganisms tandem repeats database, and SSRs in the three species genomes were compared with each other. The result showed that there were 1 410, 859, and 638 SSRs in B. japonicum, M. loti، و S. meliloti genomes, respectively. In the genomes of B. japonicum, M. loti، و S. meliloti, tetranucleotide, pentanucleotide, and hexanucleotide repeats were more abundant and indicated higher mutation rates in these species. The least abundance was mononucleotide repeat. The SSRs type and distribution were similar among these species.


شاهد الفيديو: تسلسل تلقائي ل رقم الفاتورة مع منع تكرار رقم فاتورة (قد 2022).


تعليقات:

  1. Yossel

    هذه الإجابة لا مثيل لها

  2. Khnum

    بالنظر إلى طبيعة الوظيفة

  3. Terrence

    هم مخطئون. اكتب لي في رئيس الوزراء ، تحدث.



اكتب رسالة