معلومة

26: التطور الجزيئي وعلم الوراثة - علم الأحياء

26: التطور الجزيئي وعلم الوراثة - علم الأحياء


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

26: التطور الجزيئي وعلم الوراثة

26: التطور الجزيئي وعلم الوراثة - علم الأحياء

علم الوراثة هو علم تقدير وتحليل العلاقات التطورية. من الصعب تحديد العلاقات التطورية بين الكائنات الحية الدقيقة. غالبًا ما تساعد البيولوجيا الجزيئية في تحديد العلاقات الجينية بين الكائنات الحية المختلفة. الأحماض النووية (DNA و RNA) والبروتينات هي "جزيئات معلومات" من حيث أنها تحتفظ بسجل للتاريخ التطوري للكائن الحي. يتمثل النهج في مقارنة تسلسلات الحمض النووي أو البروتين من كائنات مختلفة باستخدام برامج الكمبيوتر وتقدير العلاقات التطورية بناءً على درجة التماثل بين المتواليات. الأحماض النووية والبروتينات عبارة عن جزيئات خطية مكونة من وحدات أصغر تسمى النيوكليوتيدات والأحماض الأمينية ، على التوالي. تعكس الاختلافات في النيوكليوتيدات أو الأحماض الأمينية داخل الجين المسافة التطورية بين كائنين. بعبارة أخرى ، ستظهر الكائنات الحية ذات الصلة الوثيقة اختلافات أقل في التسلسل مقارنة بالكائنات ذات الصلة البعيدة. على وجه الخصوص ، يتم استخدام تسلسل الحمض النووي الريبي الريبوزومي صغير الوحدة (rRNA) على نطاق واسع في السلالات الجزيئية.

تتمثل إحدى ميزات النهج الجزيئي في تحديد علاقات النشوء والتطور على الأساليب الأكثر كلاسيكية ، مثل تلك القائمة على التشكل أو سمات دورة الحياة ، في أن الاختلافات قابلة للقياس الكمي بسهولة. يمكن مقارنة التسلسلات من الكائنات الحية المختلفة ويمكن تحديد عدد الاختلافات. غالبًا ما يتم التعبير عن هذه البيانات في شكل "أشجار" حيث توضح مواضع "الفروع" وأطوالها العلاقة بين الكائنات الحية. الموضح أدناه هو شجرة حياة ثلاثية المجالات تعتمد على تسلسلات الرنا الريباسي الصغيرة للوحدات الفرعية (معدلة من N.R. Pace، ASM News 62: 464، 1996).

تصور هذه الشجرة ثلاثة فروع رئيسية: البكتيريا ، والبكتيريا الأثرية ، وحقيقيات النوى. الكائنات الحية الموجودة في الفروع المبكرة على فرع حقيقيات النوى كلها أواليات أولية أو غيرها من الطلائعيات (خضراء داكنة). المسافة النسبية التي تشغلها هذه الكائنات ، بالمقارنة مع الكائنات الحية الأعلى المزعومة (الضوء الأخضر) ، ملحوظة تمامًا. تتوافق هذه البيانات مع تاريخ تطوري طويل للغاية والتنوع الشديد بين الكائنات الأولية. ومع ذلك ، فإن الشجرة أعلاه لا تتوافق تمامًا مع المعايير الأخرى المستخدمة لتحديد العلاقات بين الأوليات. علاوة على ذلك ، ستنتج أشجار النشوء والتطور الناتجة عن تسلسلات جينية أخرى طوبولوجيا مختلفة. الأسباب المحتملة لهذه التناقضات هي:

  • التفاوتات في معدلات التطور بين الأنساب
  • أخذ العينات التصنيفية غير المتكافئة
  • الإشعاع المتفجر الفردي لأصناف حقيقية النواة الرئيسية
  • أفقي (أو جانبي) نقل الحمض النووي بين الأنواع
  • شواهد الجينات (أي الازدواجية) وتحويل الجينات

تؤدي الظاهرة الأولى والثانية إلى عنصر جذب طويل الفروع حيث يتجمع العديد من المتواليات التي تتطور ببطء لاستبعاد عدد قليل من المتواليات سريعة التطور. بمعنى آخر ، قد تكون الفروع الطويلة المتباعدة في الجزء السفلي من فرع حقيقيات النواة نتيجة للإجراء التجريبي. من ناحية أخرى ، تم اقتراح أن حدثًا إشعاعيًا سريعًا نسبيًا (يمتد من 10 إلى 100 مليون سنة) ، أو "الانفجار الكبير" ، ربما حدث مبكرًا في تطور حقيقيات النوى مما أدى إلى ظهور أصناف رئيسية. سيؤدي هذا أيضًا إلى طوبولوجيا شجرية مماثلة. بالإضافة إلى ذلك ، فإن أحداثًا مثل النقل الأفقي للحمض النووي وازدواجية الجينات ستؤدي إلى تعقيد تحليل بيانات النشوء والتطور الجزيئي.


علم الوراثة الجزيئي والتطور

علم الوراثة الجزيئي والتطور مكرس لجلب حلم داروين في متناول اليد - إلى & quot؛ أن يكون لديك أشجار أنساب حقيقية إلى حد ما لكل مملكة طبيعية عظيمة. & quot. توفر المجلة منتدى للدراسات الجزيئية التي تعزز فهمنا علم تطور السلالات و تطور، مزيد من التطوير.

علم الوراثة الجزيئي والتطور مكرس لجلب حلم داروين في متناول اليد - إلى & quot؛ أن يكون لديك أشجار أنساب حقيقية إلى حد ما لكل مملكة طبيعية عظيمة. & quot. توفر المجلة منتدى للدراسات الجزيئية التي تعزز فهمنا علم تطور السلالات و تطور، مزيد من تطوير تطور نسبي أكثر دقة التصنيفات التصنيفية، وفي النهاية جلب ملف تصنيف موحد لجميع خطوط الحياة المتشعبة. سيتم النظر في دراسات علم الجغرافيا للنشر إذا كانت تقدم تطورات نظرية أو تجريبية استثنائية.

تشجع المجلة المقالات متعددة التخصصات ، لا سيما في مجالات مثل المعلوماتية الحيوية ، وعلم الأحياء الحسابي ، والبيولوجيا الجزيئية ، وعلم الأحياء العضوي ، والتي تهم مجتمع علماء الأحياء النظامية والتطورية. بالإضافة إلى ذلك ، نرحب بالعروض التقديمية للنتائج الجديدة أو الرؤى المتعلقة بالعمليات والآليات التطورية كما تم التعبير عنها على المستوى الجزيئي ، وكذلك العروض التي تتعامل مع منهجية إعادة بناء التاريخ التطوري من البيانات الجزيئية (مثل أوصاف خوارزميات الكمبيوتر الجديدة أو الأكثر قوة لبناء أشجار النشوء والتطور من النيوكليوتيدات المتعامدة أو تسلسل الأحماض الأمينية). يجب أن يؤدي الفهم الأعمق لآليات وعمليات التطور الجزيئي إلى نماذج أكثر دقة للتطور الجزيئي ، والتي بدورها ينبغي أن تسهل تطوير خوارزميات أفضل لإعادة بناء التاريخ التطوري من بيانات التسلسل.

لن يتم قبول الأوراق التي تستند إلى عدد قليل من الأصناف ، أو الواسمات الجزيئية المفردة ، أو التي تستخدم طرقًا قائمة على الكودون لاختبار الاختيار الدارويني الإيجابي ، ولكن في حالة عدم وجود دليل تجريبي يُزعم أن تغييرات الأحماض الأمينية المختارة تسبب تأثيرًا ظاهريًا تكيفيًا.

فوائد للمؤلفين
نقدم أيضًا العديد من مزايا المؤلفين ، مثل ملفات PDF المجانية وسياسة حقوق النشر الليبرالية والخصومات الخاصة على منشورات Elsevier وغير ذلك الكثير. الرجاء النقر هنا لمزيد من المعلومات حول خدمات المؤلف لدينا.

يرجى الاطلاع على دليل المؤلفين للحصول على معلومات حول إرسال المقالة. إذا كنت بحاجة إلى مزيد من المعلومات أو المساعدة ، فيرجى زيارة مركز الدعم الخاص بنا


علم الوراثة الجزيئي والتطور 26 (2003) 3645

إن حشرات البلوط عبارة عن حشرات تتكاثر بشكل دوري وتتسبب في تنوع واسع من الأنواع شديدة التعقيد - وتكاثر جيل معين على أشجار البلوط وغيرها من الفطريات. لا تزال العلاقات التطورية داخل عوارض البلوط قيد الإنشاء ، بينما تظل الأجيال الجنسية وشبه التولد من العديد من الأنواع غير متزاوجة. لقد كشف العمل السابق على مراوح البلوط عن تباين كبير داخل النوع ، لا سيما بين المناطق المعروفة بأنها تمثل ملاجئ منفصلة من العصر الجليدي البليستوسيني. هنا نستخدم طرق الاستدلال الوراثي الإحصائي على بيانات التسلسل لجزء من سيتوكرومبجين الميتوكوندريا لإعادة بناء العلاقات بين 62 نوعًا من أنواع البلوط. بالنسبة لـ 16 من هذه ، فإننا ندرج أيضًا 23 تسلسلًا إضافيًا لنمط السيتوكرومبابلوتيلي من مناطق ملجأ مختلفة من العصر البليستوسيني لاختبار تأثير التباين داخل النوع على إعادة بناء السلالات بين الأنواع. تُظهر السلالات المعاد بناؤها دقة جيدة داخل العامة وتحدد العديد من الفروع المحفوظة ، لكنها تفشل في إعادة بناء الاختلافات الحديثة جدًا أو القديمة جدًا. تسعة من أصل 16 نوعًا ممثلة بأنماط فردانية متعددة ليست أحادية النمط. يمكن تفسير الخلاف الظاهر بين شجرة الجينات المستردة والتصنيف التصنيفي الحالي من خلال: (أ) انهيار بعض الأنواع المعروفة حاليًا فقط إما من جيل جنسي أو من التوالد العذري إلى كيان وحيد التوالد دوريًا (ب) فرز تعدد الأشكال السلفية في الأنساب المتباينة ، و (ج) النقل الأفقي للأنماط الفردانية ، ربما بسبب التهجين داخل الملاجئ الجليدية. تؤكد استنتاجاتنا على الحاجة إلى أخذ عينات محددة بدقة عند إعادة بناء السلالات لإشعاعات من الأنواع وثيقة الصلة وتعني أنه بالنسبة لبعض المجموعات التصنيفية ، قد لا يكون من الممكن تحقيق الدقة الكاملة للتطور (باستخدام الواسمات الجزيئية).

Ó2002 إلسفير ساينس (الولايات المتحدة الأمريكية). كل الحقوق محفوظة.

الكلمات الرئيسية: Gallwasp Cynipidae Cynipini دورة حياة فرز النسب ، الاحتمالية ، الاستدلال البايزي ، السيتوكروم ب ، التهجين ، نظاميات الحشرات

Gallwasps (Hymenoptera: Cynipidae) هي أعضاء في Cynipoidea ، وهي سلالة رئيسية في الغالب

الدبابير الطفيلية داخل غشاء البكارة (رونكويست ، 1999). Gallwasps هي طفيليات ملزمة للنباتات ، وإما تحفز العفث الخاص بها في أنسجة النبات أو تتطور على شكل inquilines داخل العفص التي يسببها Gallwasps الأخرى (Askew ، 1984 Stone et al. ، 2002). كل نوع من الأنواع يسبب مرارة مميزة للغاية وغالبًا ما تكون معقدة ، مما يؤدي إلى تنوع مذهل في الهياكل المرارية داخل

علم الوراثة الجزيئي والتطور 26 (2003) 36-45

المؤلف المراسل. فاكس: 1-608-262-9343.

عنوان البريد الإلكتروني: arokas @ facsta وما يليها wisc.edu (A روكاس.).

1055-7903 / 02 / $ - انظر المادة الأمامية 2002 Elsevier Science (الولايات المتحدة الأمريكية). كل الحقوق محفوظة. معلومات التعريف الشخصية: S 1 0 5 5-7 9 0 3 (0 2) 0 0 3 2 9-9

المجموعة الكاملة (Stone and Cook ، 1998). تحتوي Cynipidae على حوالي 1360 نوعًا موصوفًا مقسمة إلى ست قبائل (Liljeblad and Ronquist ، 1998 Nieves-Aldrey ، 2001). تشير الأدلة البيوجغرافية والأحفورية إلى أن Cynipidae نشأت منذ فترة طويلة على الأقل مثل منتصف العصر الطباشيري (83 م.س) (رونكويست ، 1999).

تتألف قبيلة البلوط (قبيلة Cynipini) من أكثر قبائل الغولاب ثراءً بالأنواع ، مع حوالي 1000 نوع معروف في 40 جنسًا في جميع أنحاء العالم ، في الغالب في نصف الكرة الشمالي (Nieves-Aldrey ، 2001 Ronquist ، 1999). يُعتقد أن السلالات الرئيسية لجران البلوط قد تباعدت في أمريكا الوسطى (كينزي ، 1936) جنبًا إلى جنب مع مضيفيها من خشب البلوط (مانوس وآخرون ، 1999) ، وتم العثور على أعظم ثراء من البلوط في القطب الشمالي مع ما يقدر بنحو 700 الأنواع في 29 جنسًا (ويلد ، 1957 ، 1959 ، 1960). تعتبر حيوانات Palaearctic أقل ثراءً بالأنواع (حوالي 163 نوعًا في 10 أجناس) (Askew، 1984 Nieves-Aldrey، 1987 Nieves-Nieves-Aldrey، 2001 Stone et al.

محتواة في أربعة أجناس فقط - Andricus (116 نوعًا) ،

Pla-giotrochus (14) و Neuroterus (13) و Cynips (7) (Askew، 1984 Nieves-Aldrey، 2001 Stone et al.، 2002).

على الرغم من التطورات الحديثة في علم الوراثة Cynipini (Cook et al.، 2002 Liljeblad and Ronquist، 1998 Rokas، 2001 Rokas et al.، 2002 Ronquist، 1994 Stone and Cook، 1998) لا يُعرف سوى القليل عن العلاقات داخل القبيلة. إن Cynipini هي التوالد الفطري دوريًا ، مع دورة حياة تتضمن تناوبًا إلزاميًا بين جيل جنسي في الربيع والجيل شبه التولد في الصيف / الخريف (Stone et al. ، 2002). يختلف الجيلين من جميع نباتات البلوط المزعجة من حيث الحجم ، وفي بعض الحالات في السمات المورفولوجية المستخدمة في الماضي لتحديد الأجناس. عادةً ما تكون دبابير التكاثر الجنسي أصغر بكثير (كتلة 1-2 مجم) وأقصر عمراً (أسبوع أو أقل) من دبابير التوالد التكاثرية (الكتلة حوالي 10 مجم ، وعمرها يصل إلى شهر واحد). استند تصنيف المرارة المبكر أيضًا إلى حد كبير على بنية المرارة ، وأعاقت الاختلافات الهائلة في سمات المرارة بين الجيلين من جميع أنواع نباتات البلوط تقريبًا ربط الأجيال. ونتيجة لذلك ، تم تخصيص جيلين من نوع واحد تاريخيًا لأجناس مختلفة مما تسبب في ارتباك تصنيفي كبير. المشكلة شديدة بشكل خاص في منطقة Nearctic (على سبيل المثال ، Drown and Brown ، 1998 Lyon ، 1996 Melika and Abrahamson ، 2000) ، في حين أن تصنيف الأجناس والأنواع الغربية Palaearctic أقل إشكالية (على سبيل المثال ، Melika وآخرون ، 2000 Nieves-Al. -دري ، 2001).

في السابق (Rokas et al. ، 2002) قمنا بتقييم فائدة ثمانية علامات تسلسل DNA في إعادة بناء العلاقات phy-logenetic على مستويات مختلفة من الاختلاف داخل Cynipidae. اثنان من مواقع الميتوكوندريا

(cyto-chromeband أوكسيديز السيتوكروم I) تم عرضه

سريع التطور ويحتمل أن يكون مفيدًا لعلم الوراثة ذي المستوى المنخفض من أصناف نبات المرارة. لقد أظهرنا أيضًا أنه ، بالنسبة لعدد من الأنواع ، مناطق الجنوب

تمتلك Eu-Rope و Asia Minor المقابلة لملاجئ Pleis-tocene الجليدية المنفصلة أنماطًا فردية خاصة بالملاذ (Rokas، 2001 Rokas et al.، 2001 Stone et al.، 2001). بالإضافة إلى ذلك ، فقد تم إثبات تجريبياً أن الأنواع وثيقة الصلة يمكن أن تشكل هجائن قابلة للحياة (Folliot ، 1964) ، ومن المعروف أن النقل الأفقي للأنماط الفردية عن طريق الإدخال بين الأنواع وثيقة الصلة يحدث في مجموعة من الحشرات (على سبيل المثال ، Powell ، 1983 سوتا وآخرون ، 2001 ثيلويل وآخرون ، 2000). مجتمعة ، تثير هذه الحقائق إمكانية مشاركة أنماط الفردانية الخاصة بالملاجئ ضمن مجموعة مرتبطة ارتباطًا وثيقًا من الأصناف الهجينة ، بحيث يمكن أن يكون أعضاء من عدة أنواع داخل نفس الملجأ أكثر تشابهًا في تسلسل من النوع الفرداني من الأنواع المتفردة من الأنواع المختلفة. الملاجئ.

هنا نستخدم بيانات التسلسل الخلوي من 62

الأنواع لتحليل تأثير دمج تباين النمط الفرداني داخل النوع في حل العلاقات بين أنواع البلوط المرارة. على وجه الخصوص ، نقوم بتقييم أحادي لـ 16 نوعًا منتشرًا جغرافيًا من خلال تضمين أنماط فردانية إضافية ، مما يؤدي إلى مجموعة بيانات ممتدة من 85 تسلسلًا. يتم اشتقاق الأنماط الفردانية المستخدمة من ملاجئ Palaearctic الغربية المتباينة وراثيًا

(اتكينسون ، 2000 روكاس ، 2001) لمجموعات اندريكوس

الخواص التي تظهر في التحليلات السابقة على أنها أقرباء (Cook et al. ، 2002 Stone and Cook ، 1998) ، في محاولة لاكتشاف أحداث فرز النسب أو داخل الملجأ

تهجين. علاوة على ذلك ، نقوم بتضمين متواليات لـ 28

أنواع An-dricus المعروفة حاليًا فقط من جيل واحد. إن الجمع بين نوع واحد من كل نوع داخل كليد واحد مع دعم مرتفع لحذاء التمهيد من شأنه أن يوفر دليلًا قويًا غير مباشر على تمثيلهما نصفين لدورة حياة مفردة التوالد دوريًا.

تتكون مجموعة البيانات التي تم تحليلها في هذه الدراسة من 62 نوعًا من فصيلة البلوط. سبعة وخمسون من هؤلاء ينتمون إلى 9 أجناس من الجالواشب الأوروبية ، وهو ما يمثل أكثر من ثلث العدد الإجمالي للأنواع المعروفة الموجودة في أوروبا. من بين هذه الأنواع ، هناك 28 نوعًا معروفًا حاليًا فقط

من جيل واحد - إما جنسي (7 أنواع) أو

التوالد العذري (21 نوعًا). الأنواع الخمسة الأخرى هي

اليابانية (Andricus kashiwaphilus، Andricus mukaigawae،

Andricus symbioticus و Trichagalma serratae) أو الأمريكي (Andricus spectabilis). مجموعة البيانات أيضا

يحتوي على 23 نوعًا فردانيًا إضافيًا من 16 نوعًا (10

An-dricuspecies ، 4 أنواع من جنس الجن ، 1 نوع عصبي و 1 نوع حيوي) تم أخذ عينات منها من ملاجئ مميزة من العصر الجليدي البليستوسيني في أوروبا وتركيا. تسميات الأنواع تتبع Melika et al. (2000). لم يتم استخدام أي مجموعة خارجية نظرًا لأن قبائل الغالواسب الأخرى ، وفقًا للواسم الجزيئي المستخدم في هذه الدراسة ، تم إعادة ربطها بشكل بعيد جدًا بـ Cynipini (Rokas et al. ، 2002).

تم استخلاص الحمض النووي باستخدام مجموعة DNeasy Tissue (QIAGEN cat. 69504). A 433 نقطة أساس جزء من

تم تضخيم جين السيتوكروم ب الميتو كوندريا بواسطة تفاعل البوليميراز المتسلسل

باستخدام مزيج التمهيدي CB1 / CB2 من Jermiin و Crozier (1994) (الاسم المستعار CB-J-10933 و CB-N-11367 من Simon et al. ، 1994) والظروف الموصوفة سابقًا (Rokas et al. ، 2001 Stone and Cook ، 1998). تم إجراء التسلسل باستخدام كيمياء Perkin – Elmer BigDye Terminator على جهاز تسلسل ABI 377. تم تسلسل كلا الخيوط لتقليل أخطاء PCR والغموض وأخطاء الاتصال الأساسي. تم فحص إخراج الكروماتوجرام بالعين. يتم إيداع جميع التسلسلات في GenBank (AJ131065 – AJ131070 ، AJ228448 – AJ228461 ، AJ228463–

أربعة أنواع من المرارة (Andricus aries ، Andricus

the-ophrastii و Andricus tomentosus و Neuroterus lanugi-nosus) فشل في التسلسل المباشر ، بسبب إنتاج

منتجات PCR متعددة السيتوكروم ب. لحل

المشكلة ، تم اعتماد استراتيجية الاستنساخ. تم استنساخ نواتج تفاعل البوليميراز المتسلسل (PCR) في ناقل ذي نهايات حادة يتبعها

تعليمات الشركة المصنعة (Zero Blunt TOPO

مجموعة الاستنساخ ، Invitrogen ، القط. K4500-01). لكل نوع من الأنواع الأربعة ، تم اختيار ما يصل إلى 10 مستعمرات وتربيتها وتنقيتها (QIAprep spin miniprep kit ، QIAGEN cat. 27104) للتسلسل اللاحق.

احتمالية قصوى ، ML. تم تقدير سلالات التطور من خلال تحليل الاحتمالية القصوى (ML) لبيانات التسلسل باستخدام إصدارات PAUP * 4.0b8-10 (Swof-ford ، 2002). تم تحديد أفضل نموذج ML لكل مجموعة بيانات باستخدام اختبارات نسبة الاحتمالية (Huelsenbeck and Rannala ، 1997) كما هو مطبق في Modeltest 3.06 (Po-sada and Crandall ، 1998). كانت المعلمات المسموح لها بالتنوع في النموذج هي التركيب الأساسي ومعدلات الاستبدال وعدم تجانس المعدل بين المواقع. أفضل نموذج يتضمن ترددات أساسية غير متكافئة ، ومعدل واحد للانتقالات وأربعة معدلات مختلفة للتحولات وكذلك بين تباين الموقع (نسبة غير متغيرة

sites¼0.29 ، شكل معلمة a لـ c

التوزيع 0.37). قيم المعلمات التي اقترحها

تم استخدام Mod-eltest للبحث عن طوبولوجيا ML ، باستخدام بحث إرشادي مع مبادلة TBR و 10 مكررات عشوائية إضافة. تم إنشاء قيم Bootstrap باستخدام نفس قيم المعلمات وخوارزمية بحث تبادل الجوار الأقرب (NNI) على 500 مجموعة بيانات مكررة.

الاستدلال بايزي. تم تقدير الأنساب أيضًا باستخدام برنامج MRBAYES ، الإصدار 2.0 (Huelsen-beck and Ronquist ، 2001). في MRBAYES ، يتم أخذ عينات من الأشجار من التوزيع الاحتمالي الخلفي من خلال تنفيذ Metropolis-coupled

سلسلة ماركوف خوارزمية مونتي كارلو —MCÞ3 لـ

قصيرة. تسمح خوارزمية MCÞ3 بتشغيل عدة ملفات

سلاسل ماركوف. تم إجراء تشغيل بأربع سلاسل لـ 2،000،000 جيل ، في ظل نموذج عام قابل للانعكاس الزمني (جميع أنواع الاستبدال الستة التي تحدث بمعدلات مختلفة) مع تقدير قيمة المعلمة للترددات الأساسية ، وقيم مصفوفة الاستبدال ومعدل عدم تجانس معدل الجينات المتغايرة كان يقدر كلاهما باستخدام

توزيع ج للمواقع المتغيرة وكذلك حسب

كمجموع جزء معين من المواقع لتكون ثابتة. كان وقت الاحتراق 100000 جيل.

تم الإبلاغ عن المحاذاة والطوبولوجيا في هذه الدراسة

متوفرة إلكترونيًا من TreeBASE (http: //

www.herbaria.harvard.edu/treebase/ ، رقم انضمام دراسة TreeBASE S793).

3.1. شظايا متعددة تشبه السيتوكروم ب في أربعة أنواع من الدبابير المرارية

تسلسل استنساخ متعددة للسيتوكرومبفروم

الأنواع الأربعة للغالوا (A. aries ، A. theophrastii ، A.

tomentosus و N. lanuginosus) التي فشلت بشكل مباشر

كشف se-quencing عن شظايا متعددة تشبه السيتوكرومب.

من أصل سبعة من الحيوانات المستنسخة A. aries ، كان أحدها صحيحًا

الطول (433 نقطة أساس) وإطار القراءة (لا توجد رموز توقف / in-dels) ، بينما كان للنسخ الستة الأخرى قيمة 1 نقطة أساس في indel

(434 نقطة أساس) ومقسمة بنسبة 3.7٪ (مسافة ف غير مصححة)

من أول استنساخ. في A. theophrastii ، كان لدى خمسة مستنسخات

الطول وإطار القراءة الصحيحين ، في حين أن الخمسة الأخرى على الرغم من الطول الصحيح لها رمز توقف. ال

مجموعتين استنساخ تباينت بنسبة 10.2٪. في A. tomentosus ،

تم العثور على خمسة متواليات متميزة. نسخة واحدة فقط لها الطول الصحيح وإطار القراءة الكامل المفتوح. خمسة مستنسخات كان لها الطول الصحيح لكن الترجمة كشفت عن وجود كودون توقف. كان الاستنساخ الواحد أطول بمقدار 2 نقطة أساس (435 نقطة أساس) ، في حين كان آخر نسختين أقصر (375 و 376 نقطة أساس ، على التوالي). أدنى اختلاف

كان ob- خدم بين هذه المتواليات الخمسة 2.6٪. خمارة.

lanuginosus ، استعادت جميع الحيوانات المستنسخة الأربعة تسلسلًا واحدًا من الطول الصحيح وإطار القراءة. بالنسبة لتحليلات phyloge-netic المقدمة في هذه الدراسة ، تم استخدام النمط الفرداني فقط مع الطول الصحيح وإطار القراءة من كل نوع.

3.2 العلاقات التطورية بين عوارض البلوط الأوروبية وتأثير التباين داخل المحدد على أنماط النشوء والتطور

يتم عرض عمليات إعادة البناء الوراثي باستخدام أقصى قدر من likeli-hood واستدلال Bayesian ، وقيم دعم فرع التمهيد / الاحتمالية الخلفية لكل منهما ، في التين. 1 و 2 على التوالي. والنتيجة الأكثر لفتًا للانتباه هي أن 10 من أصل 16 نوعًا لها

تم تضمين أكثر من نمط فرداني ليس أحادي النمط ، وبالتالي ينتج عنه تناقض بينهما

شجرة الجينات السيتوكروم ب والتصنيف الحالي.

لتقديم المزيد من الدعم لنتائجنا بخصوص

غير monophyly من هذه الأنواع ، قمنا بحساب الاحتمال الخلفي لكل نوع من الأنواع الستة عشر التي تكون أحادية اللون باستخدام مجموعة البيانات التي تم إنشاؤها من

تحليل بايزي (الجدول 1). بافتراض وجود قيمة مقطوعة

التين. 1. Phylogram يمثل طوبولوجيا ML المكتشفة باستخدام خوارزمية البحث الإرشادية. جذر الشجرة تعسفي وقد تم اختياره للحصول على أفضل تصور. يتم فرض قيم Bootstrap من 500 pseudoreplicates. الفروع التي لا تحتوي على قيم دعم تمهيد التشغيل مدعومة بأقل من 50٪ من التكرارات. يتم عرض الأنواع التي تم تضمين أنماط فردانية متعددة لها بخط عريض. بعد اسم النوع ، يتم سرد الجيل (الأجيال) الذي يعرف منه النوع (SO ، PO الجنسي فقط ، CP التوالد فقط ، التوالد التوالدي الدوري) ، بلد المنشأ ورقم انضمام GenBank.

بنسبة 0.01 (1٪) ، تم رفض monophyly لـ 9 من أصل 16 نوعًا. النوع الوحيد الذي يبدو غير أحادي النمط الذي لا يمكن رفض monophyly على أساسه

الاحتمالات اللاحقة هي Cynips quercusfolii (الجدول 1 ،

غير monophyly شائع بشكل خاص في الداخل

An-dricus ، حيث ساهم اثنان فقط من الأنواع العشرة

كان لدى الأنماط الفردانية المتعددة (A. Coronatus و A. solitarius)

سلالات النمط الفرداني أحادي النمط (الشكلان 1 و 2 ، الجدول 1). يتم دائمًا تجميع الأنماط الفردية من كل الأنواع غير أحادية النمط في نفس الفرع (سينسو كوك

وآخرون ، 2002 Stone and Cook ، 1998) في Andricus

النسب (على سبيل المثال ، كل Andricus caputmedusae

يتم وضع الأنماط الفردانية داخل Andricus quercuscalicis

التين. 2. خمسون بالمائة من قاعدة الأغلبية الإجماع phylogram من تحليل بايزي. الشجرة متوسطة الجذور. يتم دعم الفروع التي لا تحتوي على قيم احتمالية لاحقة بنسبة تقل عن 50٪ من الأشجار التي تم أخذ عينات منها. تسميات الأنواع والمعلومات الواردة هناك نفسها كما في الشكل 1.

كلايد التين. 1 و 2). غير monophyly أقل

مؤيد خارج أندريكوس ، حيث يوجد 5 من أصل 6 أنواع

المساهمة في أنماط الفرد المتعددة هي أحادية النمط. ال

فقط الأنواع غير أحادية النمط هي C. quercus (الجدول 1).

باختصار ، هناك نمطان عامان من التناقض

بين شجرة cytb والتصنيف الحالي

التصنيف موجود في التين. 1 و 2:

(أ) غير monophyly. تكمن الأنماط الفردية للعديد من أنواع المرارة داخل كليد واحد يتضمن أيضًا أنماطًا فردية لنوع إضافي واحد أو أكثر. أمثلة

في كلود توزيع أنماط الفردوس لأندريكوس لوسيدوس

أندريكوس بانتيلين أ. Mayriclade ، و Andricus Coriariusin أ. كولاريكليد. يتم النظر في الأسباب المحتملة لمثل هذه الأنماط بالتفصيل أدناه.

(ب) مجموعات من الأنماط الفردانية لأنواع ذات صلة وثيقة من نفس الملجأ الجليدي. يظهر المثال الوحيد الواضح لهذه الظاهرة داخل فرع Andricus الرئيسي لـ A. caputmedusae و A. dentimitratus و A. mitratus. تشكل الأنماط الفردية من هذه الأنواع الثلاثة التي تم أخذ عينات منها في تركيا كليدًا مفصولًا بقيم دعم عالية للفرع من الأنماط الفردية لنفس الأنواع الثلاثة التي تم أخذ عينات منها في إيطاليا / المجر. هذا النمط هو بالضبط كما هو متوقع للتهجين بين الأنواع داخل ملاجئ مشتركة منفصلة وراثيًا.

تُظهر السلالات التي أعيد بناؤها من كلتا الطريقتين دقة جيدة للأنساب في أعماق التصنيفية المتوسطة ، وتحديد العديد من الكتل المدعومة بقوة ، ولكنها تفشل في إعادة بناء حديثة جدًا أو قديمة جدًا

الاختلافات. تبين أن معظم الأنواع التي تتوفر لها أنماط فردانية متعددة غير أحادية النمط. هناك ثلاثة أسباب رئيسية للخلاف بين الجين و

الأنواع - على افتراض أن تقدير

السابق صحيح: (أ) ازدواجية الجينات ، (ب) فرز النسب لتعدد أشكال الأجداد ، و (ج) النقل الأفقي (ماديسون ، 1997). تشير بياناتنا إلى أن جميع العمليات الثلاث قد تكون حدثت / تحدث في مراوح البلوط.

4.1 الازدواجية الجينية: الجينات الكاذبة السيتوكروم ب

استنساخ السيتوكرومب لأربعة بلوط

الأنواع التي فشلت في التسلسل المباشر كشفت عدة

تسلسل السيتوكروم ب. تسلسل واحد فقط من

تم العثور على كل نوع ليكون من الطول الصحيح وإطار القراءة ، مما يشير إلى أن التسلسلات الأخرى التي تم العثور عليها هي على الأرجح جينات خادعة نووية للميتوكوندريا (أرقام) ، كما يتضح من انحلالها الطفري (وجود أكواد الإيقاف و / أو indels) (Bensasson et al. ، 2001). التفسيرات البديلة لوجود متواليات شبيهة بالميتوكوندريا تشمل التكرارات غير المتجانسة والازدواجية داخل الميتوكوندريا (Bensas-son et al.، 2001 Mirol et al.، 2000) Rea (Bensas-sons لماذا كلا هذين البديلين ليسوا تفسيرات محتملة إلى حد ما في دراسات مثل هذه نوقشت بالتفصيل من قبل Mirol et al. (2000). ومع ذلك ، حتى التسلسلات ذات الطول الصحيح وإطار القراءة ليست بالضرورة

am-pli cations of the ÔtrueÕ mitochondrial copy directory

من أنواع المرارة الأخرى ، في بعض الأحيان ، يوجد أكثر من نمط فرداني للطول الصحيح وإطار القراءة (Rokas et al. ، قيد التحضير). هذه مشكلة خطيرة محتملة لإعادة توضيح النشوء والتطور ، نظرًا لأن الأرقام المشتقة هي في الأساس نظائر لمواقع الميتوكوندريا.

4.2 التوفيق بين الخلاف بين شجرة البلوط وتصنيف البلوط الحالي

السمة اللافتة للنظر من هذا التحليل هي الافتقار إلى monophyly لـ 9 من أصل 16 نوعًا ممثلة في أنماط الفردانية متعددة الأشكال (الجدول 1 ، الشكلان 1 و 2). نحن هنا نتناول بدورنا ثلاثة أسباب محتملة للتضارب

بين شجرة السيتوكروم ب والبلوط

التصنيف: (أ) إغلاق دورات الحياة التوالدية الدورية ، (ب) فرز النسب ، و (ج) النقل الأفقي من خلال التهجين التدريجي. ثم نناقش الآثار المترتبة على فرز النسب والتهجين لتقديرات الاختلاف الجيني بين الأصناف.

(أ) إغلاق أزواج دورة الحياة. على الرغم من نشوء التكاثر الدوري في جميع مراوح البلوط تقريبًا التي تم فحص بيولوجيتها بالتفصيل (Stone et al. ، 2002) ، لا تزال العديد من الأنواع الأوروبية معروفة فقط من الجيل الجنسي أو التوالد العذري. إن البالغين والفتات من جيلين من نوع واحد متميزون من الناحية الشكلية

قيم الاحتمالية الخلفية للأحادية لكل نوع من أنواع هذه الدراسة البالغ عددها 16 والتي تم تضمين أكثر من نمط فرداني لها في تحليل الأنواع الاحتمالية اللاحقة للأنواع أحادية اللون (٪) حالة التجميع وفقًا للتين. 1 و 2

Andricus caputmedusae 0 non-monophyletic

Andricus فاي CONI سلطات الجمارك 0 غير أحادي النمط الخلوي

Andricus Coriarius 0 غير وحيد الخلية

أندريكوس كوريناتوس 99.5 مونوفيلتيك

Andricus dentimitratus 0 غير أحادي النمط

Andricus lucidus 0.1 غير وحيد الخلية

Andricus mitratus 0 غير مونوفيليتيك

Andricus Panteli 0.3 Non-monophyletic

Andricus seckendor فاي ط 0 غير أحادي النمط الخلوي

أندريكوس سوليتاريوس 100 مونوفيليتيك

بيورهيزا باليدا 100 مونوفيلتيك

Cynips كورنيفكس 96.6 مونوفيلتيك

سينيبس لونجيفينتريس 48.5 مونوفيلتيك

Cynips quercus 0 غير monophyletic

Cynips quercusfolii 14.8 غير أحادي الشكل

لا يمكن إقرانها على أساس الهيكل وحده (Ambrus، 1974 Stone et al.، 1995 Stone and Cook، 1998). حتى وقت قريب ، كان الاقتران بين الأجيال التوالدية والجنسية يتطلب تجارب حبس في الحقل ونتيجة لذلك فإن هذه العملية بعيدة عن الاكتمال (Folliot ، 1964 Lund et al. ، 1998 Wehrmaker ، 1998). لذلك من الممكن أن تكون الكتل الموجودة في سلالاتنا التي هي paraphyletic لأنها تحتوي على تصنيف واحد معروف فقط من الجيل الجنسي ، وآخر معروف فقط من جيل التوالد العذري قد يكون في الواقع الجيلين المتناوبين من الأنواع الدورية التوالد العذري. الأنساب المقدمة هنا تشير إلى اثنين

الاقتران المحتمل. تم العثور على الحالة الأولى في A. مايوريكليد

إذا كان A. aestivalis (معروف حاليًا فقط من خلال جنسه

جيل) هو الجيل الجنسي من أ. لوسيدوس

(معروف حاليًا فقط من جيل التوالد العذري) ،

ثم الظاهر غير monophyly ofA. لوسيدوس

تختفي الأنواع الفردية (تسلسل A. aestivalis هو من

المجر ، وكما هو متوقع ، المجموعات ذات النمط الفرداني من

نفس الملجأ). تم العثور على حالة ثانية في A. هارتيجي

كليد ، حيث سلطات الجمارك فاي CONI (المعروفة حاليا فقط من لها

التوالد العذري الوراثي) قد يكون التوالد العذري

جيل أ. cydoniae (معروف حاليًا فقط من ملفه

جيل جنسي) ، على الرغم من أن في هذه الحالة

غير أحادية phyly ofA. لا تختفي المخروطية. أزواج مماثلة

قد توجد بين Andricus Grossulariae (الجنسي) و A.

بانتيلي (التوالد العذري) في أ. مايوريكليد.

(ب) فرز النسب لتعدد الأشكال السلفي. أينما كان تعدد الأشكال موجودًا في علامة قبل الانتواع ، فإن تعدد الأشكال السلفية المشتركة قد ينتج عنه تناقض بين شجرة الجينات والأنواع

شجرة. عمل سابق على موقع السيتوكروم ب في

أظهرت الدبابير المرارية تباينًا واسعًا بين الأنواع ، حيث يمكن أن يتجاوز وقت الاندماج العمق الزمني المعاد بناؤه للفصل بين الأنواع (Rokas et al. ، 2001 Stone and Cook ، 1998 Stone et al. ، 2001). وبالتالي ، فإن فرز تعدد الأشكال السلفي ليس غير متشابه في عوارض البلوط ، وينتج عن الأنواع غير الأحادية للأنواع البنت. على الرغم من أن فرز النسب والتهجين الهجين يمكن أن يكون صعبًا أو يستحيل التمييز بينهما في أحداث الانتواع الحديثة جدًا (Sota et al. ، 2001) ، يمكن التمييز بين الاثنين من خلال النظر في الأنماط المكانية في تشابه النمط الفرداني بين الأنواع. بالتعريف ، يجب أن يسبق الاختلاف في تعدد الأشكال السلفية تباعد الأنواع (إدواردز وبيرلي ، 2000). إذا كان الفرز العشوائي لتعدد الأشكال الأسلاف مسؤولاً عن التشابه في الأنماط الفردانية عبر الأنواع ، فلا يوجد بالتالي سبب لتوقع أنماط فردية مماثلة في الأنواع المختلفة ليتم أخذ عينات منها من مجموعات متعاطفة. ومع ذلك ، إذا تم إنشاء تشابه النمط الفرداني عبر الأنواع عن طريق التهجين ، فيجب عندئذٍ تقديم أوجه التشابه هذه في مجموعات متماثلة (ومن ثم التهجين المحتمل) من تلك الأنواع. تتمثل إحدى الصعوبات في التمييز بين هذه السيناريوهات في أن عدم كفاية أخذ العينات من الاختلاف داخل النوع في التهجين سيؤدي إلى استنتاج فرز الأجداد.

تعدد الأشكال. نظرًا لأن هذا الأخير محتمل مسبقًا بين الأنواع ذات الصلة الوثيقة ، فإننا نأخذ هذا السبب باعتباره التفسير الأكثر جاذبية للتنوع الفردي غير الأحادي للتنوع الفردي داخل التخصص ، والتهجين الاحتياطي كتفسير للحالات ذات الارتباط الواضح بين - تشابه تسلسل توين والتعاطف ، كما هو موضح أدناه.

التناقضات بين الجينات وأشجار الأنواع المرتبطة بفرز تعدد الأشكال السلفية تعتمد على مستوى تعدد الأشكال السلفية ، ووقت اندماج تلك الأشكال المتعددة في نسالة. تقترح نظرية Coa-lescence أن فرز النسب لتعدد الأشكال الأسلاف سيكون أسرع بالنسبة لمواقع mtDNA نظرًا لأن حجمها السكاني ربع ذلك بالنسبة للجينات الصافية (Moore ، 1995 انظر Hoelzer ، 1997 ، للحصول على excep-tions Palumbi et al. ، 2001). وبالتالي من المتوقع أن تحمل المواقع النووية ذات معدلات الطفرات العالية توقيعًا أقوى لفرز النسب. 590 زوج أساسي من جزء

الجين النووي طويل الموجة opsin (LW Rh)

أظهر تحليلًا نسبيًا جيدًا لـ 21 نوعًا من الجالواشب (Cook et al. ، 2002) ، لكن الأليلات من ملاجئ جغرافية مختلفة لم يتم فحصها بعد. تشير النسبة المئوية المرتفعة للأنماط الفردانية غير أحادية النمط لنوع معين من البلوط المرارة في سلالات الميتوكوندريا المعروضة هنا إلى أن سلالات الأنواع من قوارض البلوط قد يكون من الصعب حلها بالكامل مع البيانات الجزيئية. يمكن إجراء تنبؤات مماثلة لمجموعات تصنيفية أخرى (على سبيل المثال ، العديد من الحشرات) ، التي شهدت معدلات انتواع عالية (على سبيل المثال ، Farrell ، 1998 Kambysellis et al. ، 1995).

(ج) النقل الأفقي للأنماط الفردانية من خلال التهجين التقريبي. نقل أفقي

الأنماط الفردانية الميتوكون دريال هي دائمًا احتمال حيث

لم تكتمل الحواجز الإنجابية بين السلالات ، وقد أظهرت العديد من الدراسات إدخال الجينوم الصافي نوعيًا لأحد أنواع الحشرات بواسطة جينوم الميتوكوندريا من نوع آخر من خلال التهجين (على سبيل المثال ، باول ، 1983 سوتا وآخرون ، 2001 ثيلويل وآخرون ، 2000 ). أظهرت تجارب التربية أن البلوط وثيق الصلة

أنواع المرارة

يمكن أن تتزاوج وتنتج زنبركًا قادرًا على العبور إلى كلا الوالدين لمدة تصل إلى ثلاثة أجيال (Folliot ، 1964). هذان النوعان أعضاء في نفس النوع

المجموعة (A. kollari clade) ولكنها ليست من الأصناف الشقيقة ، لذلك

التهجين بين الأنواع الأكثر ارتباطًا هو احتمال في ظل الظروف الطبيعية. نقترح ذلك

بياناتنا عن A. caputmedusae ، Andricus dentimitratus ،

و Andricus mitratus في سلسلة A. quercuscalicis clade تقدم دليلاً على التبادل الأفقي للأنماط الفردانية عن طريق التهجين التدريجي ، لأن الأنماط الفردية من الأنواع المختلفة من ملجأ جليدي معين (تركيا) أكثر تشابهًا من أعضاء نفس النوع عبر الملاجئ. كما نوقش أعلاه ، من غير المحتمل أن تظهر هذه النتيجة من خلال فرز تعدد الأشكال السالف وحده. على الرغم من أن الأنماط الفردانية من الملاجئ الأخرى (المجر وإيطاليا) مدرجة في هذه المجموعة من الأنواع ، لا يوجد تجمع

حسب الجغرافيا يحدث. في حين أن هذا يمكن أن يفسر على أنه عدم وجود دعم للتهجين بين

هذه الأنواع ، فقد ثبت أن السيتوكروم ب

لا تميز بيانات se-quence بين هذين الملاجئ في جميع الأنواع التي تم فحصها حتى الآن (Rokas et al. ، 2001 Stone et al. ، 2001) (Rokas et al. ، بيانات غير منشورة).

من بين أنواع Andricus الثلاثة المعنية ، هناك نوع واحد فقط

(A. dentimitratus) له جيل جنسي معروف. تستدل التحليلات الجينية السكانية بقوة على وجود امتداد

جيل جنسي غير معروف في A. caputmedusae

(At-kinson، 2000) ، بينما لا يوجد شيء معروف عن دورة حياة A. mitratus. يوفر التبادل الأفقي المستنتج لأنماط الفردانية مزيدًا من الأدلة غير المباشرة على إعادة الإنتاج الجنسي في جميع الأنواع الثلاثة. ربما يكون لجميع الأنواع الثلاثة أجيال جنسية تتطور بشكل صغير

براعم الربيع على خشب البلوط في قسم Cerris (Atkinson ،

2000 Cook et al. ، 1998 Cook et al. ، 2002). التزاوج في

يحدث Andricus ذات الصلة على سطح المرارة

(Stone and Sunnucks ، 1993 Stone et al. ، 2001) ، وحيث تكون كثافات نوعين أو أكثر من الأنواع وثيقة الصلة بكثافة عالية ، فمن الممكن أن يحدث التهجين في ظل الظروف الطبيعية.

تثير المناقشة أعلاه تلك النقطة العامة التي مفادها أن الاختلاف الكلي بين نوعين ، كما تم قياسه بمتوسط ​​التباعد الزوجي بين أطراف النسب في النوعين ، يتضمن ثلاثة مكونات: (أ) التباعد الأليلي بين الأنواع التي تراكمت بعد تقسيم النسب (أي ، إشارة حقيقية للتطور لتكوين الأنواع أحادية الشكل) ، (ب) الغواص الأليلي داخل الأنواع السلفية المشتركة ، و (ج) الاختلاف في الأليلات المتبادلة من خلال التهجين. قد يُدخل المكونان الثاني والثالث أخطاء إشارة في تقديرات التنوع داخل المحدد

والتباعد الجيني فيما بين الأنواع - وبالتالي إلى

معلمات أخرى (مثل حجم السكان في الماضي والتأريخ الجزيئي لأحداث الانتواع) المقدرة من هذه. على سبيل المثال ، إذا كان جزء مهم من التباين بين النوعين متوارثًا عن الأسلاف ، فإن تجاهل التباين داخل المحدد في كل نوع (كتقدير لتنوع الأجداد) قد يؤدي إلى تقدير مفرط إجمالي لما بين النوعين. الاختلاف (على الأقل بالنسبة للأنواع المتباينة مؤخرًا) (انظر أيضًا Edwards ، 1997). في المقابل ، ستؤدي المستويات العالية من التقديم إلى تقديرات مبالغ فيها للتنوع الجيني داخل الأنواع ، وتقليل تقدير الاختلاف بين الأنواع. بالنظر إلى أن كلا الخطأين الناجمين عن فرز النسب والإدخال سيكونان أكثر وضوحًا لأن أنواع الأجداد تصبح أكثر بنية (Nei and Takahata ، 1993) ، يجب مراعاة هذه التأثيرات بجدية في إعادة بناء السلالات للأنواع المنتشرة ذات الجينات الخاصة بالملاذ. تنوع.

يمكن معالجة مجموعة من الأسئلة الوراثية الجزيئية المثيرة للاهتمام والعامة باستخدام أحجار البلوط.

على سبيل المثال ، قد يكون لفرز النسب لتعدد الأشكال السلفية (نتيجة محتملة للتركيب الجيني للسكان بسبب دورات التجلد في العصر الجليدي) تأثير خطير على علم الوراثة داخل الجنس. علاوة على ذلك ، فإن إمكانية التهجين التدريجي بين الأنواع وحقيقة الأجيال غير المتطابقة حتى الآن تجعل مهمة إعادة بناء النشوء والتطور أكثر صعوبة.

من غير المرجح أن يتم حل التاريخ الوراثي لمجموعة مثل البلوط Gallwasps ، حيث أوقات الاختلاف بين الأصناف في مصفوفة بيانات مأخوذة جيدًا بترتيب مغناطيسي ، من غير المحتمل أن يتم حلها بواسطة أي موضع واحد. قد يكون النهج المركب ، الذي يستخدم العديد من المواقع التي تُظهر معدلات (وأنماط) مختلفة ومتكاملة من evo-lution ، هو الطريقة الوحيدة للحصول على فرضيات النشوء والتطور المدعومة جيدًا (Hillis et al.، 1996 Rokas and Holland، 2000 Rokas et آل ، 2002). ستكون الدروس المستفادة من دراسات المكان الواحد أكثر إرشادًا مفيدًا لتحقيق هذه الأهداف.

تم تمويل هذا العمل من منح من N.E.R.C. (برنامج EDGE الموضوعي GR9 / 03553 والمنحة رقم GR12847) والجمعية الملكية (574006) والجمعية البيئية البريطانية (منحة المشروع البيئي الصغير رقم 1462) إلى G.N.S.A.R. تم تمويله جزئيًا من منحة NERC وهو حاليًا زميل طويل الأجل في برنامج Human Frontier Science. جيه إل إن- أ. كان جزئيًا ممتعًا من DGES (PGC ، PB97-1241). جي إم سيتم دعمه من قبل زمالة NERC المتقدمة. أ. أشكر أعضاء هيئة التدريس ومساعدي التدريس والطلاب المشاركين فيها

2001 "ورشة عمل حول التطور الجزيئي" في وودز

هول ، ماساتشوستس وخاصة مديرها مايك كامينغز لمناقشة قضايا علم الوراثة وتوفير التسهيلات الحسابية. نشكر جيل لوفيل على الدعم الفني الممتاز ، وروب ديسال واثنين من الحكام المجهولين على التعليقات المكثفة على المخطوطة ، وريتشيل أتكينسون وريتشارد بيلي وجوردون براون على التشجيع والمساعدة في جمع المرارة وتربيتها.

أمبروس ، ب. ، 1974. سينيبيدا - جوباكسوك - سيسيديا سينيباروم. مطبعة Aca-demic ، بودابست ، المجر.

Askew ، R.R. ، 1984. بيولوجيا الدبابير. في: أنانثاكريشنان ، تي إن. (محرر) ، بيولوجيا الحشرات الشريرة. أكسفورد وشركة آي بي إتش للنشر ، نيودلهي ، ص ٢٢٣-٢٧١.

أتكينسون ، آر جيه ، 2000. التحليل الجيني للتاريخ الطبيعي ، واستراتيجية التكاثر ، والتركيب السكاني في البلوط الأوروبي (Hymenoptera: Cynipidae). دكتوراه. أطروحة ، جامعة أكسفورد ، أكسفورد ، ص 286.

Bensasson، D.، Zhang، D.-X.، Hartl، DL، Hewitt، GM، 2001. الجينات الكاذبة للميتوكوندريا: شهود التطور في غير محله. اتجاهات. ايكول. Evol. 16 ، 314 - 321.

Cook، J.M.، Rokas، A.، Pagel، M.، Stone، G.N.، 2002. التحولات التطورية بين أنواع البلوط المضيف وأعضاء النبات المضيف في Andricus

المرارة. التطور ، في الصحافة.

Cook ، J.M. ، Stone ، G.N. ، Rowe ، A. ، 1998. الأنماط في تطور بنية المرارة ودورات الحياة في البلوط Gallwasps (Hymenoptera: Cynipidae). في: Csoka ، G. ، Mattson ، WJ ، Stone ، GN ، Price ، P.W. (محرران) ، بيولوجيا المفصليات التي تحفز المرارة. وزارة الزراعة الأمريكية ، خدمة الغابات ، محطة الأبحاث المركزية الشمالية ، سانت بول ، مينيسوتا ، ص 261-279.

Drown ، D.M. ، Brown ، J.M. ، 1998. السلالات الجزيئية لسينبيني (Hymenoptera: Cynipidae) تحتاج إلى منافذ دعم للتقسيم العام. في: Csoka ، G. ، Mattson ، WJ ، Stone ، GN ، Price ، P.W. (محرران) ، بيولوجيا المفصليات التي تحفز المرارة. وزارة الزراعة الأمريكية ، خدمة الغابات ، محطة الأبحاث المركزية الشمالية ، سانت بول ، مينيسوتا ، الصفحات من 241 إلى 246. Edwards، S.V.، 1997. ملاءمة عمليات التطور الجزئي للمنظومات الجزيئية ذات المستوى الأعلى. في: Mindell، D.P. (محرر) ، التطور الجزيئي لطيور الطيور وعلم اللاهوت النظامي. المطبعة الأكاديمية ، نيويورك ، ص 251-278.

Edwards، S.V.، Beerli، P.، 2000. التطور 54 ، 1839-1854.

Farrell، BD، 1998. أوضح "الولع المفرط": لماذا يوجد الكثير من الخنافس؟ العلوم 281 ، 555-559.

Folliot ، R. ، 1964. مساهمة lÕetude de la biologie des Cynipides gallicoles (Hymenoptera: Cynipoidea). Annals des Sciences Natur-elles، Zoologie (Paris)، Series 12 6، 407–564.

Hillis، DM، Mable، B.K.، Moritz، C.، 1996. تطبيقات النظم الجزيئية. في: Hillis، DM، Moritz، C.، Mable، B.K. (محرران) ، النظاميات الجزيئية. سيناور ، سندرلاند ، ماساتشوستس ، ص.515-543. Hoelzer، GA، 1997. استنتاج الأنساب من تباين mtDNA:

إعادة النظر في أشجار جينات الميتوكوندريا مقابل أشجار الجينات النووية. إيفو لوشن 51 ، 622-626.

Huelsenbeck ، J.P. ، Rannala ، B. ، 1997. تطورت طرق علم الوراثة: اختبار الفرضيات في سياق تطوري. العلوم 276 ، 227-232.

Huelsenbeck ، J.P. ، Ronquist ، F. ، 2001. MRBAYES: الاستدلال البايزي على أشجار النشوء والتطور. المعلوماتية الحيوية 17 ، 754-755.

Jermiin، L.S.، Crozier، R.H.، 1994. منطقة السيتوكروم في الحمض النووي للميتوكوندريا للنمل تيترابونيرا روفونيجر: قد يترافق الاختلاف المتسلسل في غشائيات الأجنحة مع محتوى النوكليوتيدات. جيه مول. Evol. 38 ، 282-294.

Kambysellis، MP، Ho، K.F.، Craddock، E.M.، Piano، F.، Parisi، M.، Cohen، J.، 1995. نمط التحولات البيئية في تنوع ذبابة هاواي المستمدة من نسالة جزيئية. بالعملة. بيول. 5 ، 1129-1139.

كينزي ، إيه سي ، 1936. أصل الفئات العليا في سينيبس. إنديانا يونيف. Publ. ، علوم. سر. 4 ، 1–334.

Liljeblad، J.، Ronquist، F.، 1998. تحليل النشوء والتطور لعلاقات الدبابير المرارية ذات المستوى الأعلى (Hymenoptera: Cynipidae). النظام. انتومول. 23 ، 229-252.

Lund ، J.N. ، Ott ، J.R. ، Lyon ، R.J. ، 1998. Heterogony in Belonocnema Treatae Mayr (Hymenoptera: Cynipidae). بروك. انتومول. شركة يغسل. 100 ، 755-763.

ليون ، آر جيه ، 1996. دبابير سينيبيد جديدة من جنوب غرب الولايات المتحدة (Hymenoptera: Cynipidae). Pan-Paci c Entomol. 72 ، 181 - 192.

Maddison ، W.P. ، 1997. أشجار الجينات في أشجار الأنواع. النظام. بيول. 46 ، 523-536.

Manos، PS، Doyle، J.J.، Nixon، K.

Quercus (فاجاسيا). مول. Phylog. Evol. 12 ، 333-349.

Melika ، G. ، Abrahamson ، WG ، 2000. مراجعة لدبابير المرارة cynipid من جنس Loxaulus Mayr (Hymenoptera: Cynipidae) مع أوصاف الأنواع الجديدة. بروك. انتومول. شركة غسل .102 ، 198-211. Melika، G.، Csoka، G.، Pujade-Villar، J.، 2000. قائمة مراجعة لدبابير البلوط في المجر ، مع بعض الملاحظات التصنيفية (Hymenoptera:

Cynipidae و Cynipinae و Cynipini). آن. اصمت-نات. المصحف. ناتل. التعلق. 92 ، 265 - 296.

Mirol، P.M.، Mascheretti، S.، Searle، J.B.، 2000. الجينات الخادعة النووية المتعددة من cytochromebin Ctenomys (Cavio-morpha، Rodentia) مع وجود تشابه كبير مع أو ارتفاع الغواص من تسلسل الميتوكوندريا الحقيقي. الوراثة 84، 538-547. Moore، WS، 1995. استنتاج الأنساب من تباين mtDNA: أشجار جينات الميتوكوندريا مقابل أشجار الجينات النووية. التطور 49 ، 718-726.

Nei، M.، Takahata، N.، 1993. الحجم الفعال للسكان والتنوع الجيني ووقت الاندماج في المجموعات السكانية المقسمة. جيه مول. Evol. 37 ، 240 - 244.

Nieves-Aldrey ، J.L. ، 1987. Estado الفعلي del conocimiento de la subfamilia Cynipinae (Hymenoptera ، Parasitica ، و Cynipidae) في لا بينينسولا إيبيريكا. إيوس 63 ، 179–195.

Nieves-Aldrey ، J.-L. ، 2001. Hymenoptera: Cynipidae. Museo Nacional de Ciencias Naturales ، CSIC ، مدريد.

Palumbi، S.R.، Cipriano، F.، Hare، MP، 2001. توقع اندماج الجينات النووية من بيانات الميتوكوندريا: قاعدة الثلاث مرات. التطور 55 ، 859-868.

Posada، D.، Crandall، K.A، 1998. MODELTEST: اختبار نموذج استبدال الحمض النووي. المعلوماتية الحيوية 14 ، 817-818.

باول ، جيه آر ، 1983. الجين السيتوبلازمي بين النوعين يتدفق في غياب الجين النووي: دليل من ذبابة الفاكهة. بروك. ناتل. أكاد. علوم. الولايات المتحدة الأمريكية 80 ، 492-495.

روكاس ، أ. ، 2001. تفكير الشجرة ، الجزيئات والمعلقات التي تحلل الأنماط التطورية في الغالوات الأوروبية باستخدام نهج النشوء والتطور الجزيئي. دكتوراه. أطروحة ، جامعة ادنبره ، ادنبره ، ص. 255.

Rokas، A.، Atkinson، R.J.، Brown، GS، West، SA، Stone، G.N.، 2001.

اكتساح انتقائي؟ الوراثة 87 ، 294-304.

Rokas، A.، Holland، P.W.H.، 2000. تغييرات جينومية نادرة كأداة لعلم الوراثة. اتجاهات Ecol. Evol. 15 ، 454-459.

Rokas، A.، Nylander، J.A. مول. Phylog. Evol. 22 ، 206-219.

Ronquist ، F. ، 1994. تطور التطفل بين الأنواع وثيقة الصلة: العلاقات التطورية وأصول الاستفسار في الدبابير (غشائيات الأجنحة: Cynipidae). التطور 48 ، 241-266. Ronquist، F.، 1999. نسالة وتصنيف وتطور

سينيبويدا. زول. سكر. 28 ، 139–164.

Simon، C.، Frati، F.، Beckenbach، A.، Crespi، B.، Liu، H.، Flook، P.، 1994. بادئات تفاعل البلمرة المتسلسل. آن. انتومول. شركة أكون. 87 ، 651-701. سوتا ، ت. ، إيشيكاوا ، ر. ، أوجي ، إم. ، كوسوموتو ، إف ، فوجلير ، إيه بي ، 2001.

تعدد أشكال الميتوكوندريا عبر الأنواع في خنافس Cara-bid الخنافس Carabus subgenus Ohomopterus الناجم عن التهجين التدريجي المتكرر. مول. ايكول. 10 ، 2833-2847.

Stone، GN، Atkinson، R.، Rokas، A.، Csooka، G.، Nieves-Aldrey، J.-L.، 2001. نجاحات مختلفة في توسيع النطاق باتجاه الشمال بين الأنماط البيئية للرخام الرخامي Andricus kollari: قصة دورتين من الحياة . مول. ايكول. 10 ، 761-778.

Stone ، GN ، Cook ، J.M. ، 1998. هيكل عوارض البلوط cynipid: أنماط في تطور النمط الظاهري الممتد. بروك. R. Soc. لوند ، سير. ب 265 ، 979-988.

ستون ، جنرال موتورز ، شونروج ، ك ، أتكينسون ، آر جيه ، بيليدو ، دي ، بوجادي- €

فيلار ، ج. ، 2002. علم الأحياء السكانية لبلوط غالواسب (Hyme-noptera: Cynipidae). Annu. القس Entomol. 47 ، 633-668.

Stone ، GN ، Schoonrogge ، K. ، Crawley ، M.J. ، Fraser ، S. ، 1995. €

الاختلاف الجغرافي وبين الأجيال في مجتمعات الطفيليات المرتبطة بغزو المرارة ، Andricus quercuscalicis (Hymenoptera: Cynipidae). أويكولوجيا 104 ، 207-217.


16.3. تطبيقات علم الوراثة الجزيئي

نما علم الوراثة الجزيئي منذ بداية التسعينيات ، ويرجع ذلك إلى حد كبير إلى تطوير طرق أكثر صرامة لبناء الأشجار ، جنبًا إلى جنب مع انفجار معلومات تسلسل الحمض النووي التي تم الحصول عليها في البداية عن طريق تحليل PCR ومؤخرًا من خلال مشاريع الجينوم. كما تم تعزيز أهمية علم الوراثة الجزيئي من خلال التطبيق الناجح لإعادة بناء الأشجار وغيرها من تقنيات علم الوراثة لبعض القضايا الأكثر إرباكًا في علم الأحياء. في هذا القسم الأخير سوف نستعرض بعض هذه النجاحات.

16.3.1. أمثلة على استخدام أشجار النشوء والتطور

أولاً ، سننظر في مشروعين يوضحان الطرق المختلفة التي يتم بها استخدام إعادة بناء الأشجار التقليدية في البيولوجيا الجزيئية الحديثة.

أوضح علم الوراثة الوراثي للحمض النووي العلاقات التطورية بين البشر والرئيسيات الأخرى

كان داروين (1871) أول عالم أحياء يتكهن بالعلاقات التطورية بين البشر والرئيسيات الأخرى. كانت وجهة نظره - القائلة بأن البشر يرتبطون ارتباطًا وثيقًا بالشمبانزي والغوريلا وإنسان الغاب - مثيرة للجدل عندما تم اقتراحها لأول مرة ولم تحظ بالاهتمام ، حتى بين أنصار التطور ، في العقود التالية. في الواقع ، كان علماء الأحياء من بين أكثر المدافعين المتحمسين عن وجهة النظر البشرية لمكانتنا في عالم الحيوان (غودمان ، 1962).

من دراسات الأحافير ، خلص علماء الأحافير قبل عام 1960 إلى أن الشمبانزي والغوريلا هما أقرب أقربائنا ، لكن العلاقة كانت بعيدة ، والانقسام ، الذي أدى إلى البشر من جهة والشمبانزي والغوريلا من جهة أخرى ، بعد 15 مليون سنة تقريبًا. منذ. أكدت البيانات الجزيئية التفصيلية الأولى ، التي تم الحصول عليها من خلال الدراسات المناعية في الستينيات (Goodman، 1962 Sarich and Wilson، 1967) أن البشر والشمبانزي والغوريلا يشكلون بالفعل كليدًا واحدًا (انظر الإطار 16.2) ولكنها اقترحت أن العلاقة أقرب بكثير ، ساعة جزيئية تشير إلى أن هذا الانقسام حدث قبل 5 ملايين سنة فقط. كانت هذه واحدة من المحاولات الأولى لتطبيق ساعة جزيئية على بيانات النشوء والتطور ، وقد تمت معالجة النتيجة ، بشكل طبيعي تمامًا ، ببعض الشك. في الواقع ، انفتح نقاش حاد بين علماء الأحافير ، الذين آمنوا بالانقسام القديم الذي أشارت إليه الأدلة الأحفورية ، وعلماء الأحياء ، الذين كانوا أكثر ثقة في التاريخ الحديث الذي اقترحته البيانات الجزيئية. كان هذا الجدل في النهاية & # x02018won & # x02019 من قبل علماء الأحياء الجزيئية ، الذين أصبح رأيهم بأن الانقسام حدث منذ حوالي 5 ملايين سنة مقبولًا بشكل عام.

المربع 16.2

مصطلحات علم الوراثة الجزيئي. يتضمن النص تعريفات لمعظم المصطلحات الهامة المستخدمة في علم الوراثة الجزيئي. فيما يلي بعض التعريفات الإضافية التي قد تجدها مفيدة عند قراءة المقالات البحثية حول هذا الموضوع: تعريفات تشغيلية (المزيد.)

مع الحصول على المزيد والمزيد من البيانات الجزيئية ، أصبحت الصعوبات في تحديد النمط الدقيق للأحداث التطورية التي أدت إلى البشر والشمبانزي والغوريلا واضحة. اقترحت مقارنات جينومات الميتوكوندريا للأنواع الثلاثة عن طريق رسم خرائط التقييد (القسم 5.3.1) وتسلسل الحمض النووي أن الشمبانزي والغوريلا مرتبطان بشكل وثيق ببعضهما البعض أكثر من ارتباط أي منهما بالبشر (الشكل 16.14 أ) ، بينما تهجين الحمض النووي والحمض النووي دعمت البيانات علاقة أوثق بين البشر والشمبانزي (الشكل 16.14 ب). سبب هذه النتائج المتضاربة هو التشابه الوثيق بين تسلسل الحمض النووي في الأنواع الثلاثة ، حيث تقل الاختلافات عن 3٪ حتى في أكثر المناطق تباينًا في الجينوم (القسم 15.4). هذا يجعل من الصعب إقامة علاقات لا لبس فيها.

الشكل 16.14

تفسيرات مختلفة للعلاقات التطورية بين البشر والشمبانزي والغوريلا. انظر الى النص للحصول على التفاصيل. الاختصار: Myr ، مليون سنة.

كان حل المشكلة هو إجراء مقارنات بين أكبر عدد ممكن من الجينات المختلفة واستهداف تلك المواقع التي من المتوقع أن تظهر أكبر قدر من الاختلاف. بحلول عام 1997 ، تم الحصول على 14 مجموعة بيانات جزيئية مختلفة ، بما في ذلك متواليات المواقع المتغيرة مثل الجينات الكاذبة والمتواليات غير المشفرة (Ruvolo ، 1997). أكد تحليل مجموعات البيانات هذه أن الشمبانزي هو الأقرب بالنسبة للإنسان ، حيث تباعدت سلالاتنا قبل 4.6 & # x020135.0 مليون سنة. الغوريلا هي ابن عم أبعد بقليل ، فقد تباعد نسلها عن الإنسان والشمبانزي بين 0.3 و 2.8 مليون سنة قبل ذلك (الشكل 16.14C).

أصول الإيدز

لقد أثر الوباء العالمي لمتلازمة نقص المناعة المكتسب (الإيدز) في حياة الجميع. يحدث الإيدز بسبب فيروس نقص المناعة البشرية 1 (HIV-1) ، وهو فيروس ارتجاعي (القسم 2.4.2) يصيب الخلايا المشاركة في الاستجابة المناعية. سرعان ما أعقب العرض في أوائل الثمانينيات أن فيروس نقص المناعة البشرية -1 مسؤول عن الإيدز تكهنات حول أصل المرض. تركزت التكهنات حول اكتشاف أن فيروسات نقص المناعة المماثلة موجودة في الرئيسيات مثل الشمبانزي ، المنغابي ، الماندريل والقرود المختلفة. فيروسات نقص المناعة القردية (SIVs) ليست مسببة للأمراض في مضيفها العاديين ولكن كان يُعتقد أنه إذا تم نقل أحدهم إلى البشر ، فقد يكون للفيروس داخل هذا النوع الجديد خصائص جديدة ، مثل القدرة على التسبب في المرض والانتشار بسرعة من خلال السكان.

تتراكم جينومات الفيروسات القهقرية الطفرات بسرعة نسبيًا لأن إنزيم النسخ العكسي ، وهو الإنزيم الذي ينسخ جينوم الحمض النووي الريبي الموجود في جسيم الفيروس إلى نسخة الحمض النووي التي تندمج في جينوم المضيف (انظر القسم 2.4.2) ، يفتقر إلى نشاط تدقيق فعال (القسم 13.2.2) ) وهكذا يميل إلى ارتكاب أخطاء عندما يقوم بتخليق الحمض النووي المعتمد على الحمض النووي الريبي. هذا يعني أن الساعة الجزيئية تعمل بسرعة في الفيروسات القهقرية ، والجينومات التي تباعدت مؤخرًا تُظهر تباينًا كافيًا في النوكليوتيدات لإجراء تحليل علم الوراثة. على الرغم من أن الفترة التطورية التي نهتم بها هي أقل من 100 عام ، فإن جينومات فيروس نقص المناعة البشرية و SIV تحتوي على بيانات كافية لعلاقاتهما يمكن استنتاجها من خلال تحليل النشوء والتطور.

نقطة البداية لهذا التحليل الوراثي هو الحمض النووي الريبي المستخرج من جزيئات الفيروس. لذلك يتم استخدام RT-PCR (انظر الملاحظة التقنية 4.4) لتحويل الحمض النووي الريبي إلى نسخة DNA ثم تضخيم الحمض النووي بحيث يتم الحصول على كميات كافية لتسلسل النوكليوتيدات. أدت المقارنة بين تسلسل الحمض النووي للفيروس إلى إعادة بناء الشجرة الموضحة في الشكل 16.15 (Leitner وآخرون. ، 1996 Wain-Hobson ، 1998). تحتوي هذه الشجرة على عدد من الميزات المثيرة للاهتمام. أولاً ، يُظهر أن عينات مختلفة من HIV-1 لها تسلسلات مختلفة قليلاً ، والعينات ككل تشكل كتلة ضيقة ، تقريبًا نمط يشبه النجم ، يشع من أحد طرفي الشجرة غير المتجذرة. تشير هذه الطوبولوجيا الشبيهة بالنجوم إلى أن وباء الإيدز العالمي بدأ بعدد صغير جدًا من الفيروسات ، ربما فيروس واحد فقط ، انتشر وتنوع منذ دخول البشر. أقرب فيروس HIV-1 بين الرئيسيات هو SIV من الشمبانزي ، مما يعني أن هذا الفيروس قفز عبر حاجز الأنواع بين الشمبانزي والبشر وبدأ وباء الإيدز. ومع ذلك ، لم يبدأ هذا الوباء على الفور: ففرع طويل غير متقطع نسبيًا يربط مركز إشعاع HIV-1 بالعقدة الداخلية المؤدية إلى تسلسل SIV ذي الصلة ، مما يشير إلى أنه بعد انتقاله إلى البشر ، خضع HIV-1 لفترة كامنة عندما يكون ظلت محصورة في جزء صغير من سكان العالم ، ويفترض في أفريقيا ، قبل أن تبدأ في الانتشار السريع إلى أجزاء أخرى من العالم. لا ترتبط SIVs الأخرى بفيروس HIV-1 ارتباطًا وثيقًا ، ولكن واحدًا ، SIV من mangabey السخامي ، مجموعات في الشجرة مع فيروس نقص المناعة البشرية الثاني ، HIV-2. يبدو أن HIV-2 قد تم نقله إلى البشر بشكل مستقل عن HIV-1 وعن مضيف قرد مختلف. فيروس HIV-2 قادر أيضًا على التسبب في مرض الإيدز ، لكنه لم يصبح وباءً عالميًا حتى الآن.

الشكل 16.15

أعيد بناء شجرة النشوء والتطور من تسلسل الجينوم لفيروس نقص المناعة البشرية وفيروس نقص المناعة البشرية. يعود وباء الإيدز إلى فيروس نقص المناعة HIV-1M. يتم وضع ZR59 بالقرب من جذر النمط الشبيه بالنجوم الذي يتكون من جينومات من هذا النوع. استنادًا إلى Wain-Hobson (المزيد.)

تم إجراء إضافة مثيرة للاهتمام لشجرة HIV / SIV في عام 1998 عندما تم إجراء تسلسل لعزل HIV-1 من عينة دم مأخوذة عام 1959 من ذكر أفريقي (Zhu وآخرون. ، 1998). كان الحمض النووي الريبي مجزأًا للغاية ويمكن الحصول على تسلسل DNA قصير فقط ، لكن هذا كان كافياً لوضع التسلسل على شجرة النشوء والتطور (انظر الشكل 16.15). هذا التسلسل ، المسمى ZR59 ، يرتبط بالشجرة بفرع قصير ينبثق بالقرب من مركز إشعاع HIV-1. يشير تحديد الموقع إلى أن تسلسل ZR59 يمثل أحد أقدم الإصدارات من HIV-1 ويظهر أن الانتشار العالمي لـ HIV-1 كان جاريًا بالفعل بحلول عام 1959. وقد اقترح تحليل لاحق وأكثر شمولاً لتسلسلات HIV-1 أن الانتشار بدأ في الفترة ما بين 1915 و 1941 ، بأفضل تقدير لعام 1931 (كوربر وآخرون، 2000). إن تحديد التاريخ بهذه الطريقة قد مكّن علماء الأوبئة من بدء التحقيق في الظروف التاريخية والاجتماعية التي ربما كانت مسؤولة عن بداية وباء الإيدز.

16.3.2. علم الوراثة الجزيئي كأداة في دراسة عصور ما قبل التاريخ البشرية

الآن سنوجه انتباهنا إلى استخدام علم الوراثة الجزيئي في دراسات غير محددة: دراسة التاريخ التطوري لأعضاء من نفس النوع. يمكننا اختيار أي واحد من العديد من الكائنات الحية المختلفة لتوضيح مناهج وتطبيقات الدراسات غير المحددة ، لكن الكثير من الناس ينظرون إليها الانسان العاقل باعتبارها الكائن الحي الأكثر إثارة للاهتمام ، لذا سنبحث في كيفية استخدام علم الوراثة الجزيئي لاستنتاج أصول الإنسان الحديث والأنماط الجغرافية لهجراتهم الأخيرة في العالمين القديم والجديد.

تتطلب الدراسات غير المحددة مواضع وراثية شديدة التباين

في أي تطبيق لعلم الوراثة الجزيئي ، يجب أن تظهر الجينات المختارة للتحليل تنوعًا في الكائنات الحية قيد الدراسة. إذا لم يكن هناك تباين ، فلا توجد معلومات عن النشوء والتطور. يمثل هذا مشكلة في الدراسات داخل النوعية لأن الكائنات الحية التي تتم مقارنتها جميعًا أعضاء في نفس النوع وبالتالي تشترك في قدر كبير من التشابه الجيني ، حتى لو انقسمت الأنواع إلى مجموعات تتزاوج بشكل متقطع فقط. هذا يعني أن تسلسلات الحمض النووي المستخدمة في تحليل النشوء والتطور يجب أن تكون أكثرها تنوعًا. هناك ثلاثة احتمالات رئيسية في البشر.

من المهم أن نلاحظ أنه ليس احتمال التغيير أمرًا حاسمًا لتطبيق هذه المواقع في تحليل النشوء والتطور ، بل هي حقيقة أن الأليلات المختلفة أو الأنماط الفردانية للموضع تتعايش في السكان ككل. وبالتالي فإن المواقع متعددة الأشكال (انظر الإطار 16.3) ويمكن الحصول على المعلومات المتعلقة بالعلاقات بين الأفراد المختلفين من خلال مقارنة مجموعات الأليلات و / أو الأنماط الفردانية التي يمتلكها هؤلاء الأفراد.

أصول الإنسان الحديث - خارج إفريقيا أم لا؟

يبدو من المؤكد بشكل معقول أن أصل البشر يكمن في إفريقيا لأنه تم العثور هنا على جميع أقدم الحفريات التي تعود إلى ما قبل الإنسان. تكشف الأدلة الحفرية أن البشر انتقلوا لأول مرة خارج إفريقيا منذ أكثر من مليون سنة ، لكن هؤلاء لم يكونوا بشرًا حديثين ، بل كانوا من الأنواع السابقة التي تسمى الانسان المنتصب. كان هؤلاء أول البشر الذين أصبحوا مشتتين جغرافيًا ، وانتشروا في النهاية إلى جميع أنحاء العالم القديم.

الأحداث التي أعقبت تفريق الانسان المنتصب مثيرة للجدل. من المقارنات باستخدام الجماجم والعظام الأحفورية ، خلص علماء الأحافير إلى أن الانسان المنتصب السكان الذين أصبحوا موجودين في أجزاء مختلفة من العالم القديم أدى إلى ظهور التجمعات البشرية الحديثة في تلك المناطق من خلال عملية تسمى التطور متعدد الأقاليم (الشكل 16-16 أ). قد يكون هناك قدر معين من التزاوج بين البشر من مناطق جغرافية مختلفة ، ولكن إلى حد كبير ، ظلت هذه المجموعات السكانية المختلفة منفصلة طوال تاريخها التطوري.

الشكل 16.16

فرضيتان متنافستان عن أصول الإنسان الحديث. (أ) تنص الفرضية متعددة الأقاليم على ذلك الانسان المنتصب غادر إفريقيا منذ أكثر من مليون سنة ثم تطورت إلى إنسان حديث في أجزاء مختلفة من العالم القديم. (ب) فرضية الخروج من إفريقيا (المزيد)

أثيرت الشكوك حول الفرضية متعددة الأقاليم لأول مرة من خلال إعادة تفسير الأدلة الأحفورية ثم تم طرحها لاحقًا عن طريق النشر في عام 1987 لشجرة النشوء والتطور التي أعيد بناؤها من بيانات RFLP للميتوكوندريا التي تم الحصول عليها من 147 شخصًا يمثلون السكان من جميع أنحاء العالم (Cann). وآخرون. ، 1987). أكدت الشجرة (الشكل 16.17) أن أسلاف الإنسان الحديث عاشوا في إفريقيا لكنها أشارت إلى أنهم كانوا لا يزالون هناك منذ حوالي 200000 عام. تم التوصل إلى هذا الاستنتاج من خلال تطبيق الساعة الجزيئية للميتوكوندريا على الشجرة ، والتي أظهرت أن الحمض النووي للميتوكوندريا ، وهو الحمض النووي الذي تنحدر منه جميع الحمض النووي للميتوكوندريا الحديثة ، كان موجودًا منذ ما بين 140.000 و 290.000 سنة. أظهرت الشجرة أن جينوم الميتوكوندريا هذا كان موجودًا في إفريقيا ، لذلك يجب أن يكون الشخص الذي يمتلكه ، ما يسمى بحواء الميتوكوندريا (كان يجب أن تكون أنثى لأن الحمض النووي للميتوكوندريا يتم توريثه فقط من خلال خط الأنثى).

الشكل 16.17

أعيد بناء شجرة النشوء والتطور من بيانات RFLP للميتوكوندريا التي تم الحصول عليها من 147 إنسانًا حديثًا. يُستدل على وجود الحمض النووي للميتوكوندريا في إفريقيا بسبب الانقسام في الشجرة بين جينومات الميتوكوندريا الأفريقية السبعة الحديثة (المزيد).

أدى اكتشاف حواء الميتوكوندريا إلى ظهور سيناريو جديد لأصول الإنسان الحديث. بدلاً من التطور بالتوازي في جميع أنحاء العالم ، كما هو مقترح في الفرضية متعددة المناطق ، تنص Out of Africa على أن الانسان العاقل نشأت في أفريقيا ، ثم انتقل أعضاء هذا النوع إلى بقية العالم القديم بين 100000 و 50000 سنة مضت ، مما أدى إلى تشريد أحفاد الانسان المنتصب التي واجهوها (انظر الشكل 16.16 ب).

مثل هذا التغيير الجذري في التفكير لم يمر بلا منازع حتمًا. عندما حصلت Cann على بيانات RFLP وآخرون. (1987) تم فحصه من قبل علماء علم الوراثة الجزيئي الآخرين ، وأصبح من الواضح أن تحليل الكمبيوتر الأصلي كان معيبًا ، وأنه يمكن إعادة بناء العديد من الأشجار المختلفة تمامًا من البيانات ، وبعضها ليس له جذور في إفريقيا. تمت مواجهة هذه الانتقادات بمجموعات بيانات تسلسل الحمض النووي للميتوكوندريا الأكثر تفصيلاً ، والتي يتوافق معظمها مع أصل أفريقي حديث نسبيًا وبالتالي تدعم فرضية خارج إفريقيا بدلاً من التطور متعدد الأقاليم (مثل Ingman). وآخرون، 2000). تم توفير مكمل مثير للاهتمام لـ & # x02018mitochondrial Eve & # x02019 من خلال دراسات كروموسوم Y ، مما يشير إلى أن & # x02018Y كروموسوم Adam & # x02019 عاش أيضًا في إفريقيا منذ حوالي 200000 عام (P & # x000e4 & # x000e4bo ، 1999). بالطبع ، لم تكن حواء وآدم معادلين لشخصيات الكتاب المقدس ولم تكن بأي حال من الأحوال الوحيدين على قيد الحياة في ذلك الوقت: لقد كانوا ببساطة الأفراد الذين حملوا الحمض النووي للميتوكوندريا وكروموسومات Y التي أدت إلى ظهور جميع الحمض النووي للميتوكوندريا و الكروموسومات Y الموجودة اليوم. النقطة المهمة هي أن هذه الحمض النووي للأجداد كانت لا تزال في إفريقيا بعد انتشارها بفترة طويلة الانسان المنتصب في أوراسيا.

يبدو أن دراسات الحمض النووي والكروموسوم Y للميتوكوندريا تقدم أدلة قوية تدعم نظرية خارج إفريقيا. لكن ظهرت مضاعفات من دراسات الجينات النووية غير تلك الموجودة على الكروموسوم Y. على سبيل المثال ، تعطي تسلسل & # x003b2-globin تاريخًا أبكر بكثير ، منذ 800000 عام ، للسلف المشترك (هاردينغ وآخرون. ، 1997) ، ودراسات الجين X كروموسوم ، PDHA1، ضع تسلسل الأسلاف في 1 900000 سنة مضت (Harris and Hey ، 1999). يناقش علماء الأنثروبولوجيا الجزيئية حاليًا أهمية هذه النتائج (P & # x000e4 & # x000e4bo ، 1999). المزيد من مجموعات البيانات ، ونأمل أن يكون نوعًا من التوليف الكبير ، في انتظار بفارغ الصبر.

كما أن أنماط الهجرات الأخيرة إلى أوروبا مثيرة للجدل

مهما كان المسار التطوري ، كان البشر المعاصرون موجودين في معظم أنحاء أوروبا قبل 40000 عام. هذا واضح من السجلات الحفرية والأثرية. المسألة المثيرة للجدل التالية في عصور ما قبل التاريخ البشرية تتعلق بما إذا كان هؤلاء السكان قد نزحوا بعد حوالي 30000 سنة من قبل بشر آخرين هاجروا إلى أوروبا من الشرق الأوسط.

يركز السؤال على العملية التي انتشرت بها الزراعة في أوروبا. حدث الانتقال من الصيد والجمع إلى الزراعة في الشرق الأوسط منذ حوالي 9000 & # x0201310000 عام ، عندما بدأ القرويون الأوائل من العصر الحجري الحديث في زراعة محاصيل مثل القمح والشعير. بعد تأسيسها في الشرق الأوسط ، انتشرت الزراعة في آسيا وأوروبا وشمال إفريقيا. من خلال البحث عن أدلة على الزراعة في المواقع الأثرية ، على سبيل المثال من خلال البحث عن بقايا النباتات المزروعة أو عن الأدوات المستخدمة في الزراعة ، كان من الممكن تتبع التوسع في الزراعة على طول طريقين عبر أوروبا ، أحدهما حول الساحل إلى إيطاليا و إسبانيا والثاني عبر وديان الدانوب والراين إلى شمال أوروبا (الشكل 16.18).

الشكل 16.18

انتشار الزراعة من الشرق الأوسط إلى أوروبا. المنطقة الخضراء الداكنة هي & # x02018 الهلال الخصيب & # x02019 ، منطقة الشرق الأوسط حيث تنمو العديد من محاصيل اليوم - القمح والشعير وما إلى ذلك - برية وحيث يُعتقد أن هذه النباتات بها (المزيد).

كيف انتشرت الزراعة؟ أبسط تفسير هو أن المزارعين هاجروا من جزء من أوروبا إلى جزء آخر ، آخذين معهم أدواتهم وحيواناتهم ومحاصيلهم ، وقاموا بتشريد مجتمعات ما قبل الزراعة الأصلية التي كانت موجودة في أوروبا في ذلك الوقت. تم تفضيل هذه الموجة من النموذج المتقدم في البداية من قبل علماء الوراثة بسبب نتائج التحليل الوراثي واسع النطاق لترددات الأليل لـ 95 جينًا نوويًا في مجموعات من جميع أنحاء أوروبا (Cavalli-Sforza ، 1998). لا يمكن تحليل مجموعة البيانات الكبيرة والمعقدة هذه بأي طريقة ذات مغزى من خلال بناء الأشجار التقليدي ، ولكن بدلاً من ذلك يجب فحصها من خلال طرق إحصائية أكثر تقدمًا ، تلك التي تعتمد على بيولوجيا السكان أكثر من علم الوراثة. أحد هذه الإجراءات هو تحليل المكون الرئيسي ، والذي يحاول تحديد الأنماط في مجموعة البيانات المقابلة للتوزيع الجغرافي غير المتكافئ للأليلات ، وقد تكون هذه التوزيعات غير المتكافئة مؤشراً على هجرات السكان السابقة. النمط الأكثر لفتًا للانتباه في مجموعة البيانات الأوروبية ، والذي يمثل حوالي 28٪ من التباين الجيني الإجمالي ، هو تدرج ترددات الأليل عبر أوروبا (الشكل 16.19). يشير هذا النمط إلى أن هجرة الأشخاص حدثت إما من الشرق الأوسط إلى شمال شرق أوروبا ، أو في الاتجاه المعاكس. نظرًا لأن الأول يتزامن مع التوسع في الزراعة ، كما يتضح من السجل الأثري ، فقد تم النظر إلى هذا المكون الرئيسي الأول على أنه يوفر دعمًا قويًا لموجة النموذج المتقدم.

الشكل 16.19

تدرج جيني عبر أوروبا الحديثة. انظر الى النص للحصول على التفاصيل.

بدا التحليل مقنعًا ولكن تم توجيه انتقادين. الأول هو أن البيانات لم تقدم أي إشارة إلى وقت حدوث الهجرة المستنتجة ، لذا فإن الصلة بين المكون الرئيسي الأول وانتشار الزراعة استندت فقط إلى نمط تدرج الأليل ، وليس على أي دليل تكميلي يتعلق بالفترة عندما تم إعداد هذا التدرج. نشأ الانتقاد الثاني بسبب نتائج دراسة ثانية للسكان الأوروبيين ، والتي تضمنت بعدًا زمنيًا (ريتشاردز) وآخرون. ، 1996). نظرت هذه الدراسة في الأنماط الفردية للحمض النووي للميتوكوندريا في 821 فردًا من مجموعات سكانية مختلفة في جميع أنحاء أوروبا. فشلت في تأكيد تدرج ترددات الأليل المكتشفة في مجموعة بيانات الحمض النووي النووي ، وبدلاً من ذلك أشارت إلى أن السكان الأوروبيين ظلوا ثابتًا نسبيًا على مدار العشرين ألف عام الماضية. أدى تنقيح هذا العمل إلى اكتشاف أن أحد عشر نمطًا فرديًا للحمض النووي للميتوكوندريا يسود في السكان الأوروبيين الحديثين ، لكل منها وقت منشأ مختلف ، يُعتقد أنه يشير إلى التاريخ الذي دخل فيه النمط الفرداني إلى أوروبا (الشكل 16.20 ريتشاردز) وآخرون، 2000). ظهر النمط الفرداني الأقدم ، المسمى U ، لأول مرة في أوروبا منذ حوالي 50000 عام ، بالتزامن مع الفترة التي انتقل فيها أول إنسان حديث إلى القارة ، وفقًا للسجل الأثري ، حيث انسحبت الصفائح الجليدية إلى الشمال في نهاية آخر التجلد الكبير. أصغر أنماط الفردانية ، J و T1 ، والتي يمكن أن تتوافق مع أصول الزراعة في عمر 9000 عام ، يمتلكها 8.3 ٪ فقط من سكان أوروبا الحديثة ، مما يشير إلى أن انتشار الزراعة في أوروبا لم يكن موجة التقدم الهائلة المشار إليها من خلال دراسة المكون الرئيسي. بدلاً من ذلك ، يُعتقد الآن أن الزراعة تم جلبها إلى أوروبا من قبل مجموعة أصغر من & # x02018pioneers & # x02019 الذين تزاوجوا مع مجتمعات ما قبل الزراعة الحالية بدلاً من إزاحتها.

الشكل 16.20

11 نمط فرداني رئيسي للميتوكوندريا في أوروبا. يتم عرض وقت المنشأ المحسوب لكل نمط فرداني ، الأجزاء المغلقة والمفتوحة من كل شريط تشير إلى درجات مختلفة من الثقة. تشير النسب المئوية إلى نسب الأوروبيين الحديثين (المزيد).

المربع 16.1

نياندرتال DNA. يوفر تحليل تسلسل & # x02018ancient DNA & # x02019 المستخرج من عظم أحفوري يتراوح عمره بين 30000 و 100000 عام دعمًا لفرضية Out of Africa. البشر البدائيون هم من البشر المنقرضين الذين عاشوا في أوروبا بين 300000 (أكثر).

هجرات ما قبل التاريخ البشرية إلى العالم الجديد

أخيرًا ، سنفحص المجموعة المختلفة تمامًا من الخلافات المحيطة بالفرضيات المتعلقة بأنماط الهجرة البشرية التي أدت إلى دخول الناس لأول مرة إلى العالم الجديد. لا يوجد دليل على انتشار الانسان المنتصب في الأمريكتين ، لذلك يُفترض أن البشر لم يدخلوا العالم الجديد إلا بعد العصر الحديث الانسان العاقل تطورت أو هاجرت إلى آسيا. مضيق بيرينغ بين آسيا وأمريكا الشمالية ضحل تمامًا وإذا انخفض مستوى سطح البحر بمقدار 50 مترًا ، فسيكون من الممكن السير من قارة إلى أخرى. يُعتقد أن هذا هو الطريق الذي سلكه البشر الأوائل للمغامرة في العالم الجديد (الشكل 16.21).

الشكل 16.21

الطريق التي دخل بها البشر العالم الجديد لأول مرة.

كان البحر أقل من مستواه الحالي بخمسين مترًا أو أكثر في معظم فترات العصر الجليدي الأخير ، ما بين حوالي 60000 و 11000 عام مضت ، ولكن في معظم هذا الوقت كان الطريق غير سالك بسبب تراكم الجليد. أيضًا ، كان من الممكن أن تكون الأجزاء الشمالية من أمريكا في القطب الشمالي خلال معظم هذه الفترة ، مما يوفر عددًا قليلاً من حيوانات اللعبة للمهاجرين للصيد والقليل جدًا من الأخشاب التي يمكنهم من خلالها إشعال الحرائق. أدت هذه الاعتبارات ، جنبًا إلى جنب مع عدم وجود أدلة أثرية على البشر في أمريكا الشمالية قبل 11500 عام ، إلى اعتماد & # x02018 منذ حوالي 12000 عام & # x02019 كتاريخ لدخول البشر لأول مرة إلى العالم الجديد. دفعت الاكتشافات الحديثة للأدلة على الاستيطان البشري في المواقع التي يعود تاريخها إلى 20000 عام ، في كل من أمريكا الشمالية والجنوبية ، إلى بعض إعادة التفكير ، ولكن لا يزال يُفترض عمومًا أن هجرة سكانية كبيرة إلى أمريكا الشمالية ، وربما تلك التي نشأت منها كلها حديثة. ينحدر الأمريكيون الأصليون ، منذ حوالي 12000 عام.

ما هي المعلومات التي يوفرها علم الوراثة الجزيئي؟ أجريت الدراسات الأولى ذات الصلة في أواخر الثمانينيات باستخدام بيانات RFLP. أشارت هذه الدراسات إلى أن الأمريكيين الأصليين ينحدرون من أسلاف آسيويين وحددوا أربعة أنماط فردانية مميزة للميتوكوندريا بين السكان ككل (والاس وآخرون. ، 1985 شور وآخرون. ، 1990). أظهرت الدراسات اللغوية بالفعل أنه يمكن تقسيم اللغات الأمريكية إلى ثلاث مجموعات مختلفة ، مما يشير إلى أن الأمريكيين الأصليين المعاصرين ينحدرون من ثلاث مجموعات من الناس ، كل منهم يتحدث لغة مختلفة. لم يكن الاستنتاج من البيانات الجزيئية أنه ربما كان هناك في الواقع أربع مجموعات من الأسلاف مقلقًا للغاية. تم الحصول على أول مجموعة بيانات مهمة لتسلسل الحمض النووي للميتوكوندريا في عام 1991 ، مما يتيح التطبيق الصارم للساعة الجزيئية. يشير هذا إلى أن الهجرات إلى أمريكا الشمالية حدثت منذ ما بين 15000 و 8000 سنة (Ward وآخرون. ، 1991) ، وهو ما يتوافق مع الأدلة الأثرية على أن البشر كانوا غائبين عن القارة قبل 11500 عام.

أكدت هذه التحليلات المبكرة للتطور ، أو على الأقل لم تكن متعارضة مع الأدلة التكميلية التي قدمتها الدراسات الأثرية واللغوية. ومع ذلك ، فإن البيانات الجزيئية الإضافية التي تم الحصول عليها منذ عام 1992 تميل إلى إرباك المشكلة بدلاً من توضيحها. على سبيل المثال ، قدمت مجموعات البيانات المختلفة مجموعة متنوعة من التقديرات لعدد الهجرات إلى أمريكا الشمالية. التحليل الأكثر شمولاً ، بناءً على الحمض النووي للميتوكوندريا (Forster وآخرون. ، 1996) ، هذا الرقم عند هجرة واحدة فقط ، ويشير إلى أنها حدثت منذ ما بين 25000 و 20000 سنة ، أي قبل التاريخ التقليدي بكثير. حددت الدراسات التي أجريت على كروموسومات Y تاريخًا يقارب 22500 عام مضت لـ & # x02018 Native American Adam & # x02019 ، الناقل للكروموسوم Y الذي هو سلف لمعظم ، إن لم يكن كل ، كروموسومات Y في الأمريكيين الأصليين المعاصرين (De ميندوزا وبراجينسكي ، 1999). المعنى الضمني من هذه الدراسات هو أن البشر قد نشأوا في أمريكا الشمالية منذ حوالي 20000 عام ، أي قبل ذلك بكثير مما تشير إليه الأدلة الجينية الأثرية والمبكرة. لا تزال هذه الفرضية قيد التقييم من قبل علماء الأحياء الجزيئية وعلماء الآثار.


التنميط الجيني لإشارة بدء الترجمة في mRNA بدائية النواة

غالبًا ما يكون بدء الترجمة محددًا للمعدل في البكتيريا وفي العاثيات (Liljenstrom and von Heijne 1987 Bulmer 1991 Xia 2007c Xia et al. 2007 Kudla et al. 2009 Tuller et al. 2010 Prabhakaran et al. 2015). تتضمن إشارات بدء الترجمة على mRNA في بدائيات النوى كودون البدء الذي تم فك تشفيره بواسطة fMet-tRNA fMet و Shine-Dalgarno التسلسل (SD) المرتبط بالتسلسلات المضادة لـ SD (aSD) عند الطرف 3 من الوحدة الفرعية الصغيرة RNA (ssu rRNA) ( شاين ودالغارنو 1974 هوي ودي بوير 1987).

ما هو الاقتران الأمثل SD / aSD؟

سأوضح أولاً ما الذي يشكل اقترانًا جيدًا بين SD / aSD. أظهر التحديد الهيكلي (Milon et al. 2012) أن fMet-tRNA fMet وعوامل بدء الترجمة يمكن أن ترتبط بالريبوسوم 30S بشكل تآزري (ربط أحدهما يسهل ربط الآخرين). تتمثل وظيفة ربط SD / aSD في وضع كودون البدء جنبًا إلى جنب مع مضاد كودون fMet-tRNA fMet (الشكل 1 أ). في حين أن العديد من الجينات لها SD الخاصة بها هي AGGAGGU أو جزء منها ، فإن العديد منها لها SDs مختلفة (الشكل 1 ب). كل SD لها المسافة المثلى المحددة (D) بين SD وكودون البدء ، على سبيل المثال ، D الأمثل هو D1 من أجل SD1 و د2 من أجل SD2 في الشكل 1 أ. حالة واحدة حقيقية تتضمن الإشريكية القولونية rpsQ الجين (الشكل 1 ج) الذي يحتوي على 2 SDs مفترضة ، AAGG و GGUG (الشكل 1 ج). ومع ذلك ، نلاحظ أن 2 SDs في الشكل 1 أ لهما نفس Dللبدأ تُعرَّف بأنها المسافة بين نهاية 3 ′ لـ ssu rRNA وكودون البدء (الشكل 1 أ). دللبدأ مقيدة بشدة ضمن نطاق ضيق في مجموعة متنوعة من الأنواع البكتيرية من سالبة الجرام بكتريا قولونية موجب الجرام العصوية الرقيقةمما يوحي بأن دللبدأ هو مؤشر أفضل وأكثر عمومية لقياس الوضع الأمثل لاقتران SD / aSD من D1 او د2 في الشكل 1 أ (لأن د1 او د2 خاصة بـ SD). 2 SDs المفترضة في rps الجين (الشكل 1 ج) يرتبط بـ aSDs المختلفة لكن كلاهما لهما D متشابهللبدأ القيم (15 و 14 على التوالي ، الشكل 1 ج). لا معنى للقول أن المسافة المثلى بين SD وكودون البدء هي 5 أو 10 نيوكليوتيدات (nt) دون تحديد ماهية SD. يمكن أن يكون SD قريبًا جدًا من رمز البدء ، كما في حالة pflB مع 4 nt فقط بينهما (الشكل 1) أو متباعدة كما في حالة adk مع 11 nt بينهما (الشكل 1 ب). ما هو مشترك بينهم جميعًا هو أن لديهم جميعًا متشابهًا Dللبدأ (الشكل 1 ب ، ج).

الملامح الرئيسية للمكونات المتفاعلة لمحاذاة كودون البدء مقابل مضاد كودون fMet-tRNA fMet البادئ. (أ) نموذج الاقتران SD / aSD. اثنين من SDs مختلفة على mRNA (SD1 و SD2) بمسافات مختلفة (D1 و د2، على التوالي) إلى رمز البدء ، يمكن لـ AUG محاذاة AUG بشكل صحيح ضد الحمض الريبي النووي النقال. ينتج عن اقتران SD / aSD المختلفان نفس D.للبدأ، المعرفة على أنها المسافة بين نهاية 3 ssu rRNA إلى كود البداية. (ب) عينة من اقتران SD / aSD من التعبير العالي الإشريكية القولونية الجينات ، مع كودون البداية و anticodon الحمض الريبي النووي النقال في حالة صغيرة. (ج) أحد الأمثلة على الجين المعبر عنه بدرجة عالية (rps) مع 2 SDs مفترضة (ج). تكون معرفات الجينات في شكل "اسم الجين / Locus_tag". تختلف SDs في (ب) و (ج) في التسلسل والمسافة إلى كودون البداية ، لكن جميعها لها نفس Dللبدأ. تغيير في دللبدأ سيؤدي إلى اختلال محاذاة كودون البدء ومضاد الحمض الريبي النووي النقال.

الملامح الرئيسية للمكونات المتفاعلة لمحاذاة كودون البدء مقابل مضاد كودون fMet-tRNA fMet البادئ. (أ) نموذج الاقتران SD / aSD. اثنين من SDs مختلفة على mRNA (SD1 و SD2) بمسافات مختلفة (D1 و د2، على التوالي) إلى رمز البدء ، يمكن لـ AUG محاذاة AUG بشكل صحيح ضد الحمض الريبي النووي النقال. ينتج عن اقتران SD / aSD المختلفان نفس D.للبدأ، المعرفة على أنها المسافة بين نهاية 3 ssu rRNA إلى كود البداية. (ب) عينة من اقتران SD / aSD من التعبير العالي الإشريكية القولونية الجينات ، مع كودون البداية و anticodon الحمض الريبي النووي النقال في حالة صغيرة. (ج) أحد الأمثلة على الجين المعبر عنه بدرجة عالية (rps) مع 2 SDs مفترضة (ج). تكون معرفات الجينات في شكل "اسم الجين / Locus_tag". تختلف SDs في (ب) و (ج) في التسلسل والمسافة إلى كودون البداية ، لكن جميعها لها نفس Dللبدأ. تغيير في دللبدأ سيؤدي إلى اختلال محاذاة كودون البدء و anticodon الحمض الريبي النووي النقال.

بالنظر إلى جينوم بدائية النواة مشروح ، يمكن لـ DAMBE 1) استخراج تسلسل المنبع لكل تسلسل ترميز (CDS) ، على سبيل المثال ، 20 nt على الفور المنبع من كودون البدء ، 2) تحديد SDs المفترضة في جميع تسلسلات تشفير البروتين ، و 3) إخراج مجموعة متنوعة من الإحصائيات الموجزة لإظهار الجين الذي يحتوي على SD / aSD قويًا وموضعًا على النحو الأمثل. هذا موضح ببيانات من بكتريا قولونية ( الشكل 2). عظم بكتريا قولونية مباريات SD / aSD لها Dللبدأ = 13 (الشكل 2 أ). التردد يزيد بشكل حاد من Dللبدأ = 11 إلى دللبدأ = 12 ، لكنها تتناقص بشكل تدريجي على الجانب الأيمن (الشكل 2 أ). هذه الميزة شائعة بين الأنواع البكتيرية المتنوعة. عظم بكتريا قولونية يتم تقييد SDs ضمن نطاق ضيق في حدود 20 nt من المنبع من كودون البدء (الشكل 2 ب). ثلاثة الأكثر تكرارا بكتريا قولونية SDs هي AGGA و GGAG و GAGG التي تتداخل لتشكل الشكل الأطول والأكثر شهرة لـ AGGAGG (الجدول 1). الغالبية العظمى من SDs يبلغ طولها 4 نانومتر (الشكل 2 د) ، على الرغم من أن العديد من الدراسات تشير إلى أن SDs الأطول أكثر كفاءة في توطين كودون البدء (Vimberg et al. 2007).

إحصاءات موجزة تم إنتاجها من DAMBE على اقتران SD / aSD بتنسيق الإشريكية القولونية بين 20 nt المنبع من بدء الكود و 13 nt في 3 نهاية ssu rRNA ، مع الحد الأدنى لطول SD يساوي 4. (أ) دللبدأ مقيد بشدة ضمن نطاق ضيق. (ب) تقع معظم SDs ضمن نطاق ضيق من المنبع لكودون البدء. كود البدء موجود في المواقع 21-23. (ج) ال 13 nt في 3 نهاية بكتريا قولونية تشارك ssu rRNA بشكل مختلف في الاقتران SD / aSD. استبدال النوكليوتيدات في CU ثنائي النوكليوتيد في الموقعين 5 و 6 من شأنه أن يؤثر على أكثر من 3000 من أزواج SD / aSD. (د) معظم SDs يبلغ طولها 4 nt فقط ، على الرغم من أن SDs الأطول غالبًا ما تكون أكثر كفاءة في بدء الترجمة.

إحصاءات موجزة تم إنتاجها من DAMBE على اقتران SD / aSD بتنسيق الإشريكية القولونية بين 20 nt المنبع من بدء الكود و 13 nt في 3 نهاية ssu rRNA ، مع أدنى طول SD يساوي 4. (أ) دللبدأ مقيد بشدة ضمن نطاق ضيق. (ب) تقع معظم SDs ضمن نطاق ضيق من المنبع لكودون البدء. كود البدء موجود في المواقع 21-23. (ج) ال 13 nt في 3 نهاية بكتريا قولونية تشارك ssu rRNA بشكل مختلف في الاقتران SD / aSD. استبدال النوكليوتيدات في CU ثنائي النوكليوتيد في الموقعين 5 و 6 من شأنه أن يؤثر على أكثر من 3000 من أزواج SD / aSD. (د) معظم SDs يبلغ طولها 4 nt فقط ، على الرغم من أن SDs الأطول غالبًا ما تكون أكثر كفاءة في بدء الترجمة.

تردد مختلف SDs في الإشريكية القولونية جينات ترميز البروتين ، مرتبة حسب موقع الاقتران على طول 3 نهاية ssu rRNA

SD المفترض. عدد .
GAUC 85
UGAU 191
UGAUC 11
GUGA 146
GUGAU 26
الجوجوك 10
GGUG 72
جوجا 42
جوجو 11
GGUGAUC 2
AGGU 168
AGGUG 42
اجوجا 27
اجوجاو 7
اجوجوك 2
GAGG 377
جاجو 152
جاجوج 41
جاجوجا 25
جاجوجاو 4
جاجوجوك 1
GGAG 479
GGAGG 167
جاجو 35
GGAGGUG 10
GGAGGUGA 5
GGAGGUGAU 1
AGGA 409
AGGAG 288
AGGAGG 54
AGGAGGU 13
AGGAGGUG 5
AGGAGGUGAU 1
AAGG 239
AAGGA 256
AAGGAG 169
AAGGAGG 23
AAGGAGGU 5
AAGGAGGUGA 1
AAGGAGGUG 2
UAAG 222
UAAGG 109
UAAGGA 152
UAAGGAG 121
UAAGGAGG 10
UAAGGAGGUG 1
SD المفترض. عدد .
GAUC 85
UGAU 191
UGAUC 11
GUGA 146
GUGAU 26
الجوجوك 10
GGUG 72
جوجا 42
جوجو 11
GGUGAUC 2
AGGU 168
AGGUG 42
اجوجا 27
اجوغاو 7
اجوجوك 2
GAGG 377
جاجو 152
جاجوج 41
جاجوجا 25
جاجوجاو 4
جاجوجوك 1
GGAG 479
GGAGG 167
جاجو 35
GGAGGUG 10
GGAGGUGA 5
GGAGGUGAU 1
AGGA 409
AGGAG 288
AGGAGG 54
AGGAGGU 13
AGGAGGUG 5
AGGAGGUGAU 1
AAGG 239
AAGGA 256
AAGGAG 169
AAGGAGG 23
AAGGAGGU 5
AAGGAGGUGA 1
AAGGAGGUG 2
UAAG 222
UAAGG 109
UAAGGA 152
UAAGGAG 121
UAAGGAGG 10
UAAGGAGGUG 1

تردد مختلف SDs في الإشريكية القولونية جينات ترميز البروتين ، مرتبة حسب موقع الاقتران على طول 3 نهاية ssu rRNA

SD المفترض. عدد .
GAUC 85
اوغاو 191
UGAUC 11
GUGA 146
GUGAU 26
الجوجوك 10
GGUG 72
جوجا 42
جوجو 11
GGUGAUC 2
AGGU 168
AGGUG 42
اجوجا 27
اجوغاو 7
اجوجوك 2
GAGG 377
جاجو 152
جاجوج 41
جاجوجا 25
جاجوجاو 4
جاجوجوك 1
GGAG 479
GGAGG 167
جاجو 35
GGAGGUG 10
GGAGGUGA 5
GGAGGUGAU 1
AGGA 409
AGGAG 288
AGGAGG 54
AGGAGGU 13
AGGAGGUG 5
AGGAGGUGAU 1
AAGG 239
AAGGA 256
AAGGAG 169
AAGGAGG 23
AAGGAGGU 5
AAGGAGGUGA 1
AAGGAGGUG 2
UAAG 222
UAAGG 109
UAAGGA 152
UAAGGAG 121
UAAGGAGG 10
UAAGGAGGUG 1
SD المفترض. عدد .
GAUC 85
UGAU 191
UGAUC 11
GUGA 146
GUGAU 26
الجوجوك 10
GGUG 72
جوجا 42
جوجو 11
GGUGAUC 2
AGGU 168
AGGUG 42
اجوجا 27
اجوجاو 7
اجوجوك 2
GAGG 377
جاجو 152
جاجوج 41
جاجوجا 25
جاجوجاو 4
جاجوجوك 1
GGAG 479
GGAGG 167
جاجو 35
GGAGGUG 10
GGAGGUGA 5
GGAGGUGAU 1
AGGA 409
AGGAG 288
AGGAGG 54
AGGAGGU 13
AGGAGGUG 5
AGGAGGUGAU 1
AAGG 239
AAGGA 256
AAGGAG 169
AAGGAGG 23
AAGGAGGU 5
AAGGAGGUGA 1
AAGGAGGUG 2
UAAG 222
UAAGG 109
UAAGGA 152
UAAGGAG 121
UAAGGAGG 10
UAAGGAGGUG 1

ال 13 nt في 3 نهاية E. لفائف تشارك ssu RNA بشكل مختلف في SD / aSD ، مع بعض المواقع (على سبيل المثال ، UCCUC في المواقع 3-7) تشارك في اقتران SD / aSD بشكل متكرر أكثر من غيرها. سيؤثر استبدال النوكليوتيدات في أحد هذه المواقع على اقتران SD / aSD (وبالتالي بدء الترجمة) لآلاف الجينات. لذلك نتوقع أن تكون هذه المواقع محفوظة للغاية بسبب قيود العديد من الجينات. والنتيجة الطبيعية من هذا الإطار المنطقي هي أن المواقع الأخرى المقيدة بعدد أقل من اقتران SD / aSD سيكون أكثر تسامحًا.

يتطلب بدء ترجمة معظم الجينات بدائية النواة اقترانًا جيدًا بقاعدة SD / aSD ، على الرغم من أن اقتران قاعدة SD / aSD ليس ضروريًا دائمًا للترجمة في بكتريا قولونية (ميلانكون وآخرون 1990 فارجو وآخرون 1998) و كلاميدوموناس رينهاردتي البلاستيدات الخضراء (فارجو وآخرون 1998) ، ولترجمة الجينات عديمة الرائد التي لا تحتوي على تسلسل SD (Sartorius-Neef and Pfeifer 2004). تؤثر قوة وموضع اقتران قاعدة SD / aSD بشدة على بدء الترجمة في العديد من الجينات (Shine and Dalgarno 1974 Hui and de Boer 1987 de Smit and van Duin 1994 Olsthoorn et al. 1995 Vimberg et al. 2007 Osterman et al. 2013 ). الأدوات المقدمة في DAMBE تسهل دراسة واسعة النطاق للتطور المشترك SD / aSD حيث أن الأنواع المختلفة لها 3 نهاية مختلفة من الوحدة الفرعية الصغيرة rRNA (3 ′ TAIL) التي تتطلب ديناميكيات اقتران SD / aSD مختلفة.

إشارة بدء الترجمة والبنية الثانوية

يشكل SD وكودون البدء إشارات بدء الترجمة الرئيسية على mRNA ليتم التعرف عليها بواسطة الريبوسومات وبدء الحمض الريبي النووي النقال ، على التوالي. إن تضمين هذه الإشارات في بنية ثانوية يقلل من كفاءة بدء الترجمة (de Smit and van Duin 1990، 1994 Nivinskas et al. 1999 Milon and Rodnina 2012 Milon et al. 2012 Osterman et al. 2013) ، خاصة في الجينات المعبر عنها بشكل كبير.

يتضمن DAMBE وظائف لاستخراج CDS وتسلسلات المنبع والمصب ، ويمكن استخدام نافذة منزلقة لحساب الحد الأدنى من طاقة الطي (MFE) التي تقيس استقرار البنية الثانوية المحلية (Hofacker 2003). يُظهر ملف تعريف MFE انخفاضًا كبيرًا في البنية الثانوية حول كودون البداية والمنطقة المحيطة ، وهو واضح بشكل خاص في الجينات المعبر عنها بشكل كبير (الشكل 3 أ). لوحظ اتجاه مماثل في أكواد الإيقاف ، لكن طغت عليه زيادة أقوى بكثير في استقرار الهيكل الثانوي حوالي 30 نانومتر في اتجاه مجرى كود الإيقاف (الشكل 3 ب) ، والذي من المحتمل أن يكون بسبب دبوس الشعر المتضمن في الإنهاء المستقل عن rho.

التغيير في MFE المحيط بكودون البدء (أ) و Stop codon (ب). يتم استخدام نافذة انزلاقية 40 nt. يكون كود البدء في المواقع 101-103 في (أ) ويكون كود الإيقاف في المواقع 98-100 في (ب). يتم استخدام ألف جين معبر للغاية (HEGs) و 1000 جين معبر بشكل ضعيف (LEGs) على النقيض من ذلك.

التغيير في MFE المحيط بكودون البدء (أ) و Stop codon (ب). يتم استخدام نافذة انزلاقية 40 nt. يكون كود البدء في المواقع 101-103 في (أ) ويكون كود الإيقاف في المواقع 98-100 في (ب). يتم استخدام ألف جين معبر للغاية (HEGs) و 1000 جين معبر بشكل ضعيف (LEGs) على النقيض من ذلك.

في بدائيات النوى ، تكون بعض الجينات متباعدة عن كثب مع تكوينات التسلسل مثل -AUGA- (حيث UGA هو كود الإيقاف للجين المنبع و AUG هو كودون البدء للجين المصب) و -UAAUG- (حيث UAA هو كود الإيقاف لـ الجين المنبع و AUG هو كودون البدء للجين المصب). الأنماط الموجودة في الشكل 3 هي من الجينات ذات التسلسل الجيني 100 nt على الأقل لتجنب الخلط بين نمط MFE بالقرب من كودون البداية وذلك عند كودون التوقف. يمكن لـ DAMBE تضمين معلومات موقع الجين اختياريًا في ملف تسلسل الإخراج.


نتائج

بناء وتدريب شبكة التنبؤات المتبقية لعلم الوراثة

يشبه متنبئ الشبكة العصبية العميقة الخاص بنا الشبكة الأصلية المتبقية المقترحة لتصنيف الصور (He et al. 2016) ولكنه يستخدم بعدًا واحدًا (1-D) بدلاً من الالتواء ثنائي الأبعاد (الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت ، راجع المواد والطرق ). يأخذ المتنبئ محاذاة أربعة متواليات من الأحماض الأمينية المشفرة على الساخن بطول عشوائي كمدخل ، والتي تحتوي على 4 (تصنيفات) × 20 (أحماض أمينية) قنوات. يطبق المتنبئ جولتين من الالتواء مما يقلل من عدد قنوات الإدخال إلى 32 ، تليها سلسلة من الوحدات النمطية المتبقية وطبقات التجميع. تتكون كل وحدة متبقية من جولتين متتاليتين من الالتفاف 1-D + 1-D- تطبيع الدفعات + تنشيط الوحدة الخطية المصححة (ReLU) ، والتي تتم إضافة نتائجها مرة أخرى إلى مدخلات الوحدة المتبقية كمخرجاتها. بعد أربع مجموعات من الوحدات النمطية المتبقية وطبقات التجميع ، تقوم طبقة كثيفة من الوظائف الخطية بتحويل البيانات إلى ثلاثة احتمالات ، تمثل على التوالي احتمالية كل من الهياكل الشجرية الثلاثة المحتملة للأصناف الأربعة المعنية. حقيقة أن الوحدة المتبقية "تتذكر" بيانات الإدخال عن طريق إضافتها مباشرة إلى المخرجات التلافيفية من المتوقع أن تحمي من تأثير "التدرجات المتلاشية" في الشبكات العميقة جدًا (He et al. 2016).

توجد حالات قليلة نعرف فيها التطور الحقيقي للأصناف مع بيانات التسلسل ، لكن الشبكات العصبية العميقة تحتاج إلى كمية كبيرة من البيانات المصنفة بالحقيقة للتدريب. ومن ثم ، قمنا بمحاكاة تطور تسلسل الأحماض الأمينية ماركوفيان على طول الأشجار التي تم إنشاؤها عشوائيًا كبيانات تدريب (انظر المواد والطرق). إذا كانت جميع القيم الممكنة لمعلمات الشجرة الرباعية وبيانات التسلسل المرتبطة بها تشكل مساحة معلمة ، فيجب أن تكون عيناتنا متنوعة وغير متجانسة بما يكفي لاحتواء وتمثيل الفضاء الفرعي لبيانات النشوء والتطور الحقيقية. لقد أنشأنا أشجارًا عشوائية بأكثر من أربعة أصناف وتسلسل أحماض أمينية محاكاة بأطوال متفاوتة وفقًا للأشجار. يتم اختيار مصفوفة تبادل الأحماض الأمينية S لكل محاذاة محاكية عشوائيًا من تسع مصفوفات تجريبية مستخدمة على نطاق واسع محددة في PAML 4.9 (Yang 2007). فيما يتعلق بعدم تجانس الموقع ، معدل تطوري نسبي ص لكل موقع ، جنبًا إلى جنب مع ملف تعريف تردد توازن الأحماض الأمينية الخاص بالموقع المستمدة من محاذاة كبيرة من البروتينات الحقيقية المشفرة بالجينوم النووى والعضوي. كل فرع في الشجرة لديه احتمالية معينة لاحتواء عدم التجانس الزمني ، والذي يتحقق عن طريق خلط ص القيم بين بعض المواقع (تبادل المعدل) وتغيير ملف التوازن لكل موقع (انظر المواد والطرق). بعد إنشاء كل شجرة وبيانات التسلسل المرتبطة بها ، قمنا بتقليم الشجرة بحيث لا يتبقى سوى أربعة أصناف ، ومن ثم إنشاء عينة شجرة رباعية جاهزة للتدريب أو التحقق من صحة أو اختبار متنبئ الشبكة المتبقي. في استدلال الشجرة الرباعية ، يشتمل التحدي التقليدي على أشجار ذات فرعين طويلين ، كل واحدة مجمعة بفرع قصير ويفصل بينها فرع داخلي قصير. يخضع هذا النوع من الأشجار لجذب الفروع الطويلة (LBA) ، والذي يقوم عن طريق الخطأ بتجميع الفرعين الطويلين نتيجة لتقارب التسلسل العشوائي (Felsenstein 1978). يعد LBA مشكلة خاصة بالنسبة لـ MP ، ولكنه يحدث أيضًا للطرق الأخرى في ظل النماذج التطورية التي لم يتم تحديدها بشكل خاطئ. للتأكد من أن عملية التدريب تضمنت مواد تعليمية متنوعة وصعبة ، قمنا بتقطيع نسبة من الأشجار إلى أربعة أصناف تم اختيارها عشوائيًا (أشجار عادية) ، والأشجار الأخرى إلى أربعة أصناف ذات حساسية عالية لـ LBA (أشجار LBA ، راجع المواد والطرق للحصول على التفاصيل التفصيلية) المعايير).

تألف التدريب من عدة فترات متكررة ، بناءً على مجموعة تدريب إجمالية قدرها 100000 رباعيات تحتوي على 85٪ من الأشجار العادية و 15٪ من أشجار LBA. تم استخدام فقدان الانتروبيا لقياس الخلاف بين تنبؤات الشبكة المتبقية وطبولوجيا الأشجار الحقيقية (انظر المواد والطرق الخاصة بالتعريف الرياضي). في كل حقبة ، تم سحب 2000 عينة تدريب بشكل عشوائي من المجموعة الإجمالية لبيانات التدريب ، قام متنبئ الشبكة المتبقية بتحديث نفسه وفقًا للانتشار العكسي من فقدان الانتروبيا على عينات التدريب (فقدان التدريب) ، مما أدى إلى توقع جديد. بعد كل حقبة ، تم تقييم أداء المتنبئ الحالي من خلال فقده في الانتروبيا (فقدان التحقق من الصحة) في توقع 2000 عينة تحقق (انظر المواد والطرق) ، والتي تمت محاكاتها بشكل منفصل ولكن في ظل مخططات مماثلة مثل بيانات التدريب. بعد 500 حقبة ، ستستمر عملية التدريب حتى كان هناك 80 حقبة متتالية مع فقدان تحقق أعلى من الحد الأدنى الحالي للخسارة بين جميع العصور. للتحقيق في تأثير بيانات التدريب على أداء المتنبئ الناتج ، قمنا بتدريب شبكتنا المتبقية على ثلاث مجموعات بيانات تم إنشاؤها بموجب مخططات محاكاة مختلفة ، وبالتالي حصلنا على ثلاث سلاسل من المتنبئين المسماة الشبكة العصبية العميقة 1 (dnn1) و dnn2 و dnn3 . احتوت بيانات التدريب المستخدمة لـ dnn1 (التدريب 1 في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت) على تغايرات زمنية أكثر من تلك الخاصة بـ dnn2 (التدريب 2 في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت) و dnn3 (التدريب 3 في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت). بالإضافة إلى ذلك ، فإن أشجار التدريب على dnn2 لها أطوال فروع موزعة جاما أقصر من تلك الموزعة بشكل موحد لـ dnn1 و dnn3 في المتوسط ​​(الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت ، انظر المواد والطرق). توقف تدريب dnn1 و dnn2 و dnn3 عند 669 و 1،359 و 1،179 حقبة على التوالي ، ووصلت جميعها إلى مستويات منخفضة من فقدان التحقق حوالي 0.15-0.3 (الشكل 1 أ).

تكتسب الشبكات المتبقية القدرة التنبؤية في حل أشجار الرباعية من خلال التدريب. (أ) فقدان الانتروبيا (مقياس للخطأ ، انظر المواد والطرق) للمتنبئين على مجموعات بيانات التدريب والتحقق من الصحة المقابلة بعد كل فترة تدريب. تشير الأسهم الزرقاء إلى المتنبئات المستخدمة في التحليلات اللاحقة ، لأن هذه المتنبئات لديها أدنى خسائر في الانتروبيا في التحقق من الصحة. (ب) أداء الشبكات المتبقية في فترات أخذ العينات على مجموعات بيانات الاختبار بالأشجار العادية وأشجار LBA ، على التوالي. يشير الخط المتقطع إلى أفضل أداء من بين الطرق الحالية التي تم فحصها على الأشجار العادية (الخضراء) أو أشجار LBA (الأرجواني) ، مع الإشارة إلى أفضل طريقة أداءً أسفل الخط المتقطع.

تكتسب الشبكات المتبقية القدرة التنبؤية في حل أشجار الرباعية من خلال التدريب. (أ) فقدان الانتروبيا (مقياس للخطأ ، انظر المواد والطرق) للمتنبئين على مجموعات بيانات التدريب والتحقق من الصحة المقابلة بعد كل فترة تدريب. تشير الأسهم الزرقاء إلى المتنبئات المستخدمة في التحليلات اللاحقة ، لأن هذه المتنبئات لديها أدنى خسائر في الانتروبيا في التحقق من الصحة. (ب) أداء الشبكات المتبقية في فترات أخذ العينات على مجموعات بيانات الاختبار بالأشجار العادية وأشجار LBA ، على التوالي. يشير الخط المتقطع إلى أفضل أداء من بين الأساليب الحالية التي تم فحصها على الأشجار العادية (الخضراء) أو أشجار LBA (الأرجواني) ، مع الإشارة إلى أفضل طريقة أداءً أسفل الخط المتقطع.

أداء تنبؤات الشبكة المتبقية على بيانات الاختبار

قمنا أولاً بفحص أداء تنبئ الشبكة المتبقية على بيانات التسلسل التي تمت محاكاتها باستخدام نفس المعلمات كما في إنشاء بيانات التدريب المقابلة. نظرًا لأن بيانات التدريب كانت مزيجًا من الأشجار العادية و LBA ، فقد قمنا بتقييم دقة التنبؤ لكل من dnn1 و dnn2 و dnn3 في نقاط زمنية مختلفة للتدريب ، على مجموعات بيانات اختبار منفصلة مع الأشجار العادية فقط (test1_nolba ، test2_nolba ، و test3_nolba في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت ، النقاط الخضراء في الشكل 1 ب) وأشجار LBA فقط (test1_lba ، test2_lba ، and testing3_lba في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت ، النقاط البنفسجية في الشكل 1 ب). ومن المثير للاهتمام ، أن المتنبئين حصلوا على الأداء الأمثل على الأشجار العادية في غضون 10 فترات أثناء التدريب ، لكنهم تحسنوا بشكل أبطأ بكثير في التنبؤ بأشجار LBA (الشكل 1 ب).

لقياس أداء تنبئ الشبكة المتبقية ، قمنا بمقارنتها مع العديد من طرق الاستدلال النشوء والتطور المستخدمة على نطاق واسع: NJ و MP المطبقان في برنامج MEGA X (Kumar et al.2018) ، تم تنفيذ ML بواسطة برنامج RAxML v8 (Stamatakis 2014) و PhyML v3.1 (Guindon et al. 2010) ، وتم تنفيذ BI في MrBayes 3.2 (Ronquist et al. 2012). استخدمنا إعدادات معلمات معقولة في كل برنامج من هذه البرامج لضمان مقارنات عادلة (انظر المواد والطرق). على سبيل المثال ، تم حساب المسافات الزوجية في نيوجيرسي باستخدام نموذج Jones-Taylor-Thornton (JTT) وتغير معدل توزيع غاما (معلمة الشكل = 1). في MP ، تم استخدام خوارزمية تبادل الفروع (SPR) في البحث عن الشجرة المثلى. في RAxML ، تم استخدام النموذج "PROTCATAUTO" بحيث يستنتج البرنامج الأشجار تحت مصفوفات الاستبدال المختلفة ويبلغ عن أفضل نتيجة. تم تحديد مصفوفة استبدال LG (Le and Gascuel 2008) في كل من PhyML و MrBayes. في MrBayes ، تم إجراء عمليتين متماثلتين لأربعة عينات من سلسلة ماركوف (MCMC) المكونة من 20000 خطوة لكل محاذاة تسلسل ، وتم تلخيص أشجار الإجماع بعد أول 25 ٪ من خطوات الاحتراق (انظر المواد والطرق للحصول على التفاصيل).

في مراحل لاحقة من التدريب ، أظهر كل من dnn1 و dnn3 أداءً مطابقًا أو متفوقًا لأفضل طرق الاستدلال الحالية على الأشجار العادية والأشجار LBA (الخطوط المتقطعة في الشكل 1 ب). أظهر المتنبئ dnn2 أداءً أضعف من أفضل أداء للطرق الحالية (PhyML) على أشجار LBA ، وربما يرجع ذلك إلى حقيقة أنه تم تدريبه بشكل أساسي على الأشجار ذات الفروع القصيرة نسبيًا. تم استخدام المتنبئين الثلاثة في الفترات ذات أدنى خسارة للتحقق (الحقبة 588 لـ dnn1 و 1،272 لـ dnn2 و 1،098 لـ dnn3) ، يشار إليها باسم DNN1 و DNN2 و DNN3 ، على التوالي ، في التحليلات اللاحقة.

أظهرت مقارنة مفصلة أنه على الرغم من أن دقة جميع الطرق التي تم فحصها كانت عالية جدًا ، إلا أن تنبؤات الشبكة المتبقية تفوقت بشكل عام على الطرق الحالية (الجدول 1). على سبيل المثال ، من بين 2000 عينة اختبار (test1_mixed) تمت محاكاتها وخلطها تحت نفس المعلمات مثل بيانات تدريب DNN1 (تدريب 1) ، توقع DNN1 بشكل صحيح 1،881 شجرة ، في حين كان أفضل أداء لأي طريقة موجودة هو 1،868 شجرة صحيحة (RAxML). على الأشجار العادية (test1_nolba) ، تجاوز كل من DNN1 (1925 تنبؤًا صحيحًا) و DNN3 (1936 تنبؤًا صحيحًا) جميع الطرق الحالية التي تم فحصها ، ومن بينها أفضل أداء كان بواسطة MP (1924 شجرة صحيحة). بالنسبة لأشجار LBA (test1_lba) ، استنتج DNN1 1،653 شجرة صحيحة ، بينما كان أفضل أداء لأي طريقة موجودة هو 1600 شجرة صحيحة فقط (RAxML). لوحظ نفس الاتجاه على بيانات الاختبار التي تمت محاكاتها باستخدام المعلمات المستخدمة في توليد بيانات التدريب لـ DNN2 و DNN3 ، على التوالي. بشكل عام ، أظهر كل من DNN1 و DNN3 أداءً فائقًا في ستة على الأقل من مجموعات بيانات الاختبار التسعة التي تم النظر فيها عند مقارنتها بأي طريقة واحدة موجودة تم فحصها هنا (الجدول 1). ومن المثير للاهتمام ، أن DNN2 لم يعمل جيدًا حتى في مجموعات بيانات الاختبار التي تمت محاكاتها بشكل مشابه مثل بيانات التدريب (الجدول 1) ، بما يتوافق مع الملاحظة السابقة (الشكل 1 ب).

عدد أشجار الرباعية المستنبطة بشكل صحيح بواسطة تنبؤات الشبكة المتبقية والطرق الحالية في مجموعات بيانات الاختبار المحاكية في إطار مخططات محاكاة التدريب.

مجموعات بيانات الاختبار. عدد أشجار الاختبار. DNN1. DNN2. DNN3. نيوجيرسي. النائب. RAxML. PhyML. مستر بايز.
اختبار 1_ مختلط أ 2,000 1,881 ب 1,847 1,858 1,844 1,791 1,868 1,860 1,860
اختبار 1_nolba 2,000 1,925 1,920 1,9361,910 1,924 1,912 1,896 1,906
اختبار 1_lba 2,000 1,6531,366 1,458 1,416 1,078 1,600 1,592 1,475
اختبار 2_ مختلط أ 2,000 1,8851,854 1,862 1,868 1,807 1,853 1,841 1,842
اختبار 2_nolba 2,000 1,943 1,936 1,945 1,9511,933 1,926 1,917 1,920
test2_lba 2,000 1,6021,345 1,532 1,437 1,045 1,494 1,536 1,479
الاختبار 3_ مختلط أ 2,000 1,785 1,756 1,7861,753 1,736 1,758 1,731 1,738
test3_nolba 2,000 1,899 1,9131,899 1,904 1,904 1,890 1,867 1,879
test3_lba 2,000 1,3011,062 1,269 1,140 867 1,190 1,230 1,162
مجموعات بيانات الاختبار. عدد أشجار الاختبار. DNN1. DNN2. DNN3. نيوجيرسي. النائب. RAxML. PhyML. مستر بايز.
اختبار 1_ مختلط أ 2,000 1,881 ب 1,847 1,858 1,844 1,791 1,868 1,860 1,860
اختبار 1_nolba 2,000 1,925 1,920 1,9361,910 1,924 1,912 1,896 1,906
اختبار 1_lba 2,000 1,6531,366 1,458 1,416 1,078 1,600 1,592 1,475
اختبار 2_ مختلط أ 2,000 1,8851,854 1,862 1,868 1,807 1,853 1,841 1,842
اختبار 2_nolba 2,000 1,943 1,936 1,945 1,9511,933 1,926 1,917 1,920
test2_lba 2,000 1,6021,345 1,532 1,437 1,045 1,494 1,536 1,479
الاختبار 3_ مختلط أ 2,000 1,785 1,756 1,7861,753 1,736 1,758 1,731 1,738
test3_nolba 2,000 1,899 1,9131,899 1,904 1,904 1,890 1,867 1,879
test3_lba 2,000 1,3011,062 1,269 1,140 867 1,190 1,230 1,162

تشير "_mixed" إلى مجموعة الاختبار التي تحتوي على 85٪ من الأشجار العادية و 15٪ من أشجار LBA (كما هو الحال في بيانات التدريب).

تشير الخلية المائلة في كل صف إلى أفضل أداء بين جميع الطرق.

عدد أشجار الرباعية المستنبطة بشكل صحيح بواسطة تنبؤات الشبكة المتبقية والطرق الحالية في مجموعات بيانات الاختبار المحاكية في إطار مخططات محاكاة التدريب.

مجموعات بيانات الاختبار. عدد أشجار الاختبار. DNN1. DNN2. DNN3. نيوجيرسي. النائب. RAxML. PhyML. مستر بايز.
اختبار 1_ مختلط أ 2,000 1,881 ب 1,847 1,858 1,844 1,791 1,868 1,860 1,860
اختبار 1_nolba 2,000 1,925 1,920 1,9361,910 1,924 1,912 1,896 1,906
اختبار 1_lba 2,000 1,6531,366 1,458 1,416 1,078 1,600 1,592 1,475
اختبار 2_ مختلط أ 2,000 1,8851,854 1,862 1,868 1,807 1,853 1,841 1,842
اختبار 2_nolba 2,000 1,943 1,936 1,945 1,9511,933 1,926 1,917 1,920
test2_lba 2,000 1,6021,345 1,532 1,437 1,045 1,494 1,536 1,479
الاختبار 3_ مختلط أ 2,000 1,785 1,756 1,7861,753 1,736 1,758 1,731 1,738
test3_nolba 2,000 1,899 1,9131,899 1,904 1,904 1,890 1,867 1,879
test3_lba 2,000 1,3011,062 1,269 1,140 867 1,190 1,230 1,162
مجموعات بيانات الاختبار. عدد أشجار الاختبار. DNN1. DNN2. DNN3. نيوجيرسي. النائب. RAxML. PhyML. مستر بايز.
اختبار 1_ مختلط أ 2,000 1,881 ب 1,847 1,858 1,844 1,791 1,868 1,860 1,860
اختبار 1_nolba 2,000 1,925 1,920 1,9361,910 1,924 1,912 1,896 1,906
اختبار 1_lba 2,000 1,6531,366 1,458 1,416 1,078 1,600 1,592 1,475
اختبار 2_ مختلط أ 2,000 1,8851,854 1,862 1,868 1,807 1,853 1,841 1,842
اختبار 2_nolba 2,000 1,943 1,936 1,945 1,9511,933 1,926 1,917 1,920
test2_lba 2,000 1,6021,345 1,532 1,437 1,045 1,494 1,536 1,479
الاختبار 3_ مختلط أ 2,000 1,785 1,756 1,7861,753 1,736 1,758 1,731 1,738
test3_nolba 2,000 1,899 1,9131,899 1,904 1,904 1,890 1,867 1,879
test3_lba 2,000 1,3011,062 1,269 1,140 867 1,190 1,230 1,162

تشير "_mixed" إلى مجموعة الاختبار التي تحتوي على 85٪ من الأشجار العادية و 15٪ من أشجار LBA (كما هو الحال في بيانات التدريب).

تشير الخلية المائلة في كل صف إلى أفضل أداء بين جميع الطرق.

أداء تنبؤات الشبكة المتبقية على بيانات محاكاة متنوعة

على الرغم من أن بيانات التدريب لدينا غير متجانسة ، إلا أنها لا تمثل سوى جزء من مساحة معلمة الشجرة. نتيجة لذلك ، قد يعمل المتنبئون لدينا بشكل جيد فقط على بيانات الاختبار التي تم إنشاؤها بشكل مشابه مثل بيانات التدريب. لفحص هذا الاحتمال ، قمنا بالتحقق من أداء المتنبئين لدينا عندما تختلف خصائص شجرة معينة اختلافًا كبيرًا. تمت محاكاة ثلاث مجموعات من مجموعات بيانات الاختبار بأعماق متفاوتة للأشجار ، وأطوال متسلسلة ، ومستويات عدم تجانس ، على التوالي.

في السلسلة الأولى ، تمت محاكاة ست مجموعات بيانات من 1000 شجرة من 20 صنفاً بأطوال فرع فردية في النطاق [0.02 ، 0.2) ، [0.2 ، 0.4) ، [0.4 ، 0.6) ، [0.6 ، 0.8) ، [0.8) ، 1.0) ، و [1.0 ، 2.0) ، على التوالي ، قبل تقليم العينات الرباعية ، لم تتغير جميع المعلمات الأخرى (test_branch_00 – test_branch_05 في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت). كما هو متوقع ، تُظهر جميع تنبؤات الشبكة الثلاثة المتبقية والطرق الخمس الحالية أفضل أداء عندما لا تكون الفروع قصيرة جدًا ولا طويلة جدًا (الشكل 2 أ). علاوة على ذلك ، فإن أداء DNN1 و DNN2 و DNN3 مشابه أو أفضل من أداء جميع الطرق الحالية التي تم فحصها ، بغض النظر عن أطوال الفروع (الشكل 2 أ) ، مما يدل على قابلية تطبيق تنبؤات الشبكة المتبقية على بيانات النشوء والتطور لمستويات تباعد مختلفة .

تتفوق تنبؤات الشبكة المتبقية بشكل عام على الأساليب الحالية على الأشجار الرباعية ذات الخصائص المتنوعة. يتم عرض أعداد الاستدلالات الصحيحة من أصل 1000 شجرة لمجموعات بيانات اختبار مختلفة مع (أ) نطاقات مختلفة من أطوال الفروع ، (ب) نطاقات مختلفة من أطوال تسلسل الأحماض الأمينية ، و (ج) مستويات مختلفة من انتظام المفاصل.

تتفوق تنبؤات الشبكة المتبقية بشكل عام على الأساليب الحالية على الأشجار الرباعية ذات الخصائص المتنوعة. يتم عرض أعداد الاستدلالات الصحيحة من أصل 1000 شجرة لمجموعات بيانات اختبار مختلفة مع (أ) نطاقات مختلفة من أطوال الفروع ، (ب) نطاقات مختلفة من أطوال تسلسل الأحماض الأمينية ، و (ج) مستويات مختلفة من انتظام المفاصل.

ثانيًا ، قمنا بمحاكاة خمس مجموعات بيانات من 1000 شجرة بطول تسلسل يتراوح من [100 ، 200) إلى [3 ، 000 ، 10 ، 000) من الأحماض الأمينية (test_seqlen_00 – test_seqlen_04 في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت). كما هو متوقع ، تزداد دقة كل طريقة استدلال مع طول التسلسل ، من 900 إلى 980 شجرة صحيحة (الشكل 2 ب). لا توجد طريقة واحدة حالية تعرض دقة أعلى من DNN1 أو DNN2 أو DNN3 على أكثر من مجموعتي بيانات ، مما يشير إلى أن تنبئ الشبكة المتبقية لدينا متفوقة بأطوال تسلسل مختلفة.

ثالثًا ، قمنا بتغيير مستوى عدم التجانس في التطور. تم تحقيق تباين معدل التطور لنفس الموقع بين فروع الأشجار المختلفة ، أو التغاير ، عن طريق الخلط ص القيم بين نسبة (ص) من مواقع الأحماض الأمينية في بداية كل فرع. قمنا بمحاكاة خمس مجموعات من 1000 شجرة باستخدام ص تتراوح من 0 إلى 1 (test_heterotachy_00 – test_heterotachy_04 في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت). تشبه دقة DNN2 أفضل أداء لأي طريقة موجودة ، خاصة عندما يكون مستوى التباين عاليًا (على سبيل المثال ، 969 شجرة صحيحة بواسطة DNN2 مقابل 959 بواسطة NJ عندما ص = 1) ، في حين تفوق DNN1 و DNN3 على ML و BI (الشكل 2 ج). وبالتالي ، تعمل المتنبئات لدينا بشكل جيد تحت درجات مختلفة من التغاير.

أداء تنبؤات الشبكة المتبقية على بيانات LBA مع Heterotachy

كما ذكرنا ، تمثل أشجار LBA مجموعة من الحالات الصعبة في الاستدلال الوراثي. أفادت الدراسات السابقة أن طرق التطور الوراثي المختلفة تظهر حساسيات مختلفة لـ LBA عند وجود مستويات مختلفة من التغاير (Kolaczkowski and Thornton 2004 Philippe et al.2005). نظرًا لأن متنبئات الشبكة المتبقية قد تم تدريبهم على بيانات التسلسل غير المتجانسة ، فقد تكون أقل حساسية من الطرق الأخرى لـ LBA في وجود التباين غير المتجانسة. تحقيقا لهذه الغاية ، قمنا بمحاكاة سلسلتين من مجموعات بيانات الشجرة الرباعية ذات أطوال الفروع المعينة مباشرة: الفرعين الخارجيين القصيرين لهما أطوال ب يتراوح طول الفرعين الطويلين من 0.1 إلى 1.0 أ تتراوح من 2ب حتى 40ب، والفرع الداخلي له طول ج تتراوح من 0.01ب إلى ب (الشكل 3 أ). تحتوي كل مجموعة بيانات على 100 شجرة رباعية تمت محاكاتها. تمت محاكاة السلسلة الأولى من الأشجار مع عدم وجود تغاير زمني (testlba_F_h0 في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت) ، في حين تمت محاكاة السلسلة الثانية باستخدام غير متجانسة (معدل موقع الخلط ص، testlba_F_h1 في الجدول التكميلي S2 ، المواد التكميلية عبر الإنترنت). قمنا بعد ذلك بتقييم أداء تنبئ الشبكة المتبقية لدينا والطرق الحالية على هاتين السلسلتين من مجموعات بيانات الاختبار. تنخفض دقة جميع طرق الاستدلال عندما ب الزيادات (الشكل 3 ب) ، أ/ب زيادة النسبة (الشكل 3 ب) ، أو ج/ب تنخفض النسبة (الشكل 3 ج). كما هو متوقع ، يُظهر MP دائمًا أسوأ أداء في ظل ظروف حساسة لـ LBA (الشكل 3 ج ، الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت). متي أ/ب كبير (على سبيل المثال ، الصف الأخير في الشكل 3 ج والشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت) ، كل الطرق تنتج فعليًا أشجارًا خاطئة فقط ، في حين أن العكس هو الصحيح عندما تكون هذه النسبة صغيرة (على سبيل المثال ، الصف الأول في الشكل 3 ج و الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت). بين هذين النقيضين لمساحة معلمة الشجرة ، تعمل متنبئات الشبكة المتبقية بشكل عام بشكل مقارن مع PhyML و MrBayes أو أدنى منها قليلاً عندما لا يكون هناك تغاير في التطور (الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت). ومع ذلك ، في سلسلة الأشجار ذات التباين غير المتجانس ، يتفوق DNN2 وخاصة DNN3 على الطرق الموجودة في العديد من تركيبات المعلمات (المشار إليها بواسطة البنتاغون الملون في الشكل 3 ج). نظرًا لأن عدم التجانس هو السائد في تطور التسلسل الفعلي ، فإن هذه النتائج تشير إلى المرافق العملية لتنبؤاتنا.

تتفوق تنبؤات الشبكة المتبقية بشكل عام على الأساليب الحالية على أشجار LBA ذات التباين غير المتجانسة. (أ) شجرة رباعية تخطيطية تعرض تدوينات طول الفرع. (ب) سطح ثلاثي الأبعاد متوسط ​​دقة DNN3 (يشار إليه أيضًا باللون) عبر الكل ج/ب المستويات في كل قطعة فرعية من اللوحة (ج) ، في مساحة ب المستويات و أ/ب المستويات. الأرقام المحاطة بدائرة تتوافق مع تلك الموجودة في (ج). (ج) تم استنتاج نسب 100 شجرة رباعية بشكل صحيح بواسطة متنبئاتنا (موضحة بألوان مختلفة) والطرق الحالية (موضحة برموز رمادية مختلفة) ضمن مجموعات مختلفة من المعلمات ب, أ/ب، و ج/ب. لكل ج/ب المستوى المشار إليه في X-المحور ، إذا كان أداء متنبئ الشبكة المتبقي أفضل من جميع الطرق الحالية ، يتم رسم خماسي من اللون المقابل أعلى اللوحة.

تتفوق تنبؤات الشبكة المتبقية بشكل عام على الأساليب الحالية على أشجار LBA ذات التباين غير المتجانسة. (أ) شجرة رباعية تخطيطية تعرض تدوينات طول الفرع. (ب) سطح ثلاثي الأبعاد متوسط ​​دقة DNN3 (يشار إليه أيضًا باللون) عبر الكل ج/ب المستويات في كل قطعة فرعية من اللوحة (ج) ، في مساحة ب المستويات و أ/ب المستويات. الأرقام المحاطة بدائرة تتوافق مع تلك الموجودة في (ج). (ج) تم استنتاج نسب 100 شجرة رباعية بشكل صحيح بواسطة متنبئاتنا (موضحة بألوان مختلفة) والطرق الحالية (موضحة برموز رمادية مختلفة) ضمن مجموعات مختلفة من المعلمات ب, أ/ب، و ج/ب. لكل ج/ب المستوى المشار إليه في X-المحور ، إذا كان أداء متنبئ الشبكة المتبقي أفضل من جميع الطرق الحالية ، يتم رسم خماسي من اللون المقابل أعلى اللوحة.

تدعم تنبؤات الشبكة المتبقية بشكل عام الطبولوجيا المقبولة للبيانات الفعلية

على الرغم من أن تنبؤات الشبكة المتبقية ، خاصة DNN1 و DNN3 ، تعمل بشكل جيد على بيانات التسلسل المحاكى ، إلا أن أداؤها على البيانات الفعلية غير معروف. يوجد نوعان من البيانات الفعلية. في النوع الأول ، تُعرف الشجرة الحقيقية بالتالي ، يمكن مقارنة أداء طرق بناء الأشجار المختلفة بشكل موضوعي. لكن هذا النوع من البيانات نادر للغاية ، وبالتالي لا يمكن للمرء أن يستخلص استنتاجات عامة على أساس هذه البيانات. في النوع الثاني ، توجد شجرة يعتقد على نطاق واسع على الرغم من عدم ضمان كونها الشجرة الحقيقية. نظرًا لأنه لا يمكن تصديق الشجرة التي يُعتقد على نطاق واسع أنها لا يمكن تصديقها على نطاق واسع إذا لم تكن مدعومة بقوة من قبل بعض الطرق الحالية ، فلا يمكن لتنبؤات الشبكة المتبقية أن تتفوق على هذه الأساليب الحالية في مثل هذه البيانات. حتى مع هذه التحذيرات الخطيرة ، تسمح البيانات الحقيقية بفحص سلامة المتنبئين لدينا الذين تم تدريبهم حصريًا على بيانات محاكاة.

اختبرنا أولًا تنبئنا باستخدام محاذاة 19 تسلسلًا من البروتينات الفلورية الحمراء (بطول 225 من الأحماض الأمينية) التي تم إنشاؤها عن طريق التطور التجريبي في المختبر باستخدام تفاعل البوليميراز المتسلسل المعرض للخطأ (PCR Randall et al. 2016). ومن ثم ، فإن الشجرة الحقيقية للتسلسلات التسعة عشر معروفة (الشكل التكميلي S2 أ، المواد التكميلية على الإنترنت). من بين جميع الأشجار الرباعية البالغ عددها 3876 والتي تم تقليمها من شجرة ذات 19 صنفاً ، استنتجت DNN1 و DNN2 و DNN3 بشكل صحيح 3075 و 3122 و 3129 شجرة على التوالي. يتفوق أداء MP و NJ و RAxML على المتنبئين لدينا بـ 3220 و 3219 و 3165 شجرة صحيحة ، في حين أن أداء PhyML و MrBayes أسوأ (3053 و 3047 شجرة صحيحة 2). وبالتالي ، فإن المتنبئين لدينا يظهرون أداءً مشابهاً كالطرق الحالية. قد تكون التتابعات القصيرة وعملية الاستبدال الاصطناعية الناتجة عن تفاعل البوليميراز المتسلسل المعرض للخطأ مسئولين جزئيًا عن الأداء الضعيف لـ ML و BI من NJ و MP.

أعداد أشجار الرباعية المستنتجة بواسطة تنبؤات الشبكة المتبقية والطرق الحالية التي تتوافق مع طبولوجيا الأشجار المفترضة في بيانات النشوء والتطور الفعلية.

مجموعات بيانات الاختبار. عدد أشجار الرباعية. DNN1. DNN2. DNN3. نيوجيرسي. النائب. RAxML. PhyML. مستر بايز.
بروتين الفلورسنت الأحمر 3,876 3,075 3,122 3,129 أ 3,219 3,220 3,165 3,053 3,047
جينات الثدييات 2,661 1,845 1,8771,844 1,924 1,812 1,855 1,873 1,751
الثدييات (متسلسلة) 2,000 1,609 1,6131,612 1,650 1,659 1,662 1,631 1,634
النباتات (متسلسلة) 1,000 891887 884 909 887 895 892 895
الثدييات (ميتوكوندريا) 247 7 16 10511 24 81 76 53
مجموعات بيانات الاختبار. عدد أشجار الرباعية. DNN1. DNN2. DNN3. نيوجيرسي. النائب. RAxML. PhyML. مستر بايز.
بروتين الفلورسنت الأحمر 3,876 3,075 3,122 3,129 أ 3,219 3,220 3,165 3,053 3,047
جينات الثدييات 2,661 1,845 1,8771,844 1,924 1,812 1,855 1,873 1,751
الثدييات (متسلسلة) 2,000 1,609 1,6131,612 1,650 1,659 1,662 1,631 1,634
النباتات (متسلسلة) 1,000 891887 884 909 887 895 892 895
الثدييات (ميتوكوندريا) 247 7 16 10511 24 81 76 53

تشير الخلية المائلة في كل صف إلى أعلى تناسق مع هيكل الشجرة المفترض بين تنبؤات الشبكة المتبقية.

أعداد أشجار الرباعية المستنتجة بواسطة تنبؤات الشبكة المتبقية والطرق الحالية التي تتوافق مع طبولوجيا الأشجار المفترضة في بيانات النشوء والتطور الفعلية.

مجموعات بيانات الاختبار. عدد أشجار الرباعية. DNN1. DNN2. DNN3. نيوجيرسي. النائب. RAxML. PhyML. مستر بايز.
بروتين الفلورسنت الأحمر 3,876 3,075 3,122 3,129 أ 3,219 3,220 3,165 3,053 3,047
جينات الثدييات 2,661 1,845 1,8771,844 1,924 1,812 1,855 1,873 1,751
الثدييات (متسلسلة) 2,000 1,609 1,6131,612 1,650 1,659 1,662 1,631 1,634
النباتات (متسلسلة) 1,000 891887 884 909 887 895 892 895
الثدييات (ميتوكوندريا) 247 7 16 10511 24 81 76 53
مجموعات بيانات الاختبار. عدد أشجار الرباعية. DNN1. DNN2. DNN3. نيوجيرسي. النائب. RAxML. PhyML. مستر بايز.
بروتين الفلورسنت الأحمر 3,876 3,075 3,122 3,129 أ 3,219 3,220 3,165 3,053 3,047
جينات الثدييات 2,661 1,845 1,8771,844 1,924 1,812 1,855 1,873 1,751
الثدييات (متسلسلة) 2,000 1,609 1,6131,612 1,650 1,659 1,662 1,631 1,634
النباتات (متسلسلة) 1,000 891887 884 909 887 895 892 895
الثدييات (ميتوكوندريا) 247 7 16 10511 24 81 76 53

تشير الخلية المائلة في كل صف إلى أعلى تناسق مع هيكل الشجرة المفترض بين تنبؤات الشبكة المتبقية.

بعد ذلك ، قمنا بتجميع مجموعات بيانات الاختبار بناءً على نسالة الثدييات. وفقًا للدراسات السابقة ، استخدمنا شجرة مكونة من 24 من الثدييات باعتبارها الشجرة الحقيقية المفترضة (الشكل التكميلي S2) ب، المواد التكميلية عبر الإنترنت) ، وتجنب العقد الرئيسية المثيرة للجدل مثل العلاقات بين أربعة أوامر eutherian superorders وتلك من بين الطلبات الأربعة داخل Laurasiatheria (Romiguier et al. 2013). تم تنزيل ما مجموعه 2684 جينًا بتسلسل الأحماض الأمينية المفلترة للأنواع الـ 24 من OrthoMaM v10 (Scornavacca et al. 2019). أجرينا اختبارين مختلفين. في الاختبار الأول ، تم جمع المحاذاة غير المقيدة لتسلسلات البروتين مع & gt50 من الأحماض الأمينية لأربعة أنواع تم اختيارها عشوائيًا كمجموعة بيانات اختبار ، بإجمالي 2661 محاذاة. تتوافق معظم تنبؤات DNN1 (1،845 شجرة متسقة) و DNN2 (1،877 شجرة متسقة) و DNN3 (1،844 شجرة متناسقة) مع الهيكل الأصلي فهي أدنى من NJ (1،924 شجرة متناسقة) ، على غرار RAxML (1،855 شجرة متناسقة) و PhyML (1،873 شجرة متناسقة) ، ولكنها متفوقة على MP (1،812 شجرة متناسقة) و MrBayes (1،751 شجرة متناسقة انظر "جينات الثدييات" في الجدول 2). في الاختبار الثاني ، قمنا بجمع تسلسل جميع الجينات البالغ عددها 2684 جينًا وأخذنا عينات عشوائية من 2000 محاذاة لأربعة أنواع من 100-3000 موقع من مواقع الأحماض الأمينية. في هذا الاختبار ، تُظهر جميع الشبكات العصبية الثلاثة المتبقية مستويات تناسق أقل قليلاً (1،609-1،613 شجرة متسقة) من الطرق الحالية (1631–1662 شجرة متناسقة انظر "الثدييات (متسلسلة)" في الجدول 2).

ثالثًا ، قمنا بفحص نسالة نباتات البذور (spermatophytes). قمنا بتجميع شجرة متعددة الاختصاصات للغاية من 25 نوعًا من النباتات (الشكل التكميلي S2 ج، المواد التكميلية عبر الإنترنت) ، مع الاحتفاظ فقط بالعقد المتشعبة لسبع مجموعات تصنيفية كبيرة: عاريات البذور ، ودرجة ANA ، و monocots ، و fabids ، و malvids ، و campanulids ، و lamiids (Wickett et al. 2014 Byng et al. 2016). تم أخذ عينات عشوائية من أربعة أنواع محاذاة من 100-3000 موقع من الأحماض الأمينية من محاذاة متسلسلة من 604 جينات (Wickett وآخرون ، 2014). بالنسبة لمجموعة بيانات الاختبار هذه ، استنتجت DNN1 و DNN2 و DNN3 وجميع الطرق الحالية باستثناء شجرة NJ 884-895 المتوافقة مع الشجرة الحقيقية المفترضة NJ 909 شجرة متسقة (الجدول 2).

رابعًا ، نظرًا لأن متنبئات الشبكة العصبية المتبقية أظهرت أداءً أفضل من الأساليب الحالية على البيانات المحاكاة المعرضة لـ LBA ، فإننا هنا نتحرى عن هذه الخاصية في حالة حقيقية. تم الإبلاغ عن أنه عند استخدام التسلسل البروتيني لجينات الميتوكوندريا ، فإن القنفذ Erinaceus europaeus تميل إلى الظهور على أنها أكثر الثدييات المشيمية القاعدية (نيكايدو وآخرون.2001) بدلاً من تجميعها مع أنواع Eulipotyphla الأخرى كما هو الحال في الأشجار التي أعيد بناؤها باستخدام الجينات النووية (Romiguier et al. 2013). قمنا بتجميع 18 تصنيفًا (15 من الثدييات المشيمية ، واثنان من الجرابيات ، وواحد أحادي انظر الشكل التكميلي. S2 د، المواد التكميلية عبر الإنترنت) محاذاة 3،751 من الأحماض الأمينية المشفرة بواسطة 13 جينة لترميز بروتين الميتوكوندريا وفحصت 247 رباعيات حساسة لـ LBA تتضمن القنفذ والأنواع ذات الصلة (انظر المواد والطرق). اختلف الأداء بشكل كبير بين تنبؤات DNN والطرق الحالية ، ربما بسبب السمات الخاصة للتسلسلات بسبب أصلها من جينات الميتوكوندريا (انظر "الثدييات (الميتوكوندريا)" في الجدول 2). ومع ذلك ، كان DNN3 أعلى دقة بين جميع الطرق التي تم فحصها.

على أساس النتائج المذكورة أعلاه من تحليل أربع مجموعات بيانات حقيقية ، نستنتج أن متنبئات الشبكة المتبقية تجتاز اختبار السلامة ويمكن مقارنتها بشكل عام بالطرق الحالية في الأداء.

إعادة بناء الأشجار الكبيرة باستخدام تنبؤات الشبكة المتبقية جنبًا إلى جنب مع الرباعية المحيرة

بينما تتفوق متنبئات الشبكة المتبقية لدينا على الأساليب الحالية في معظم مجموعات بيانات الاختبار التي تم فحصها ، فإن صياغة استدلال الشجرة الرباعية كمشكلة تصنيف يحد من تعميم متنبئنا لبناء أشجار من أعداد عشوائية من الأصناف. على الرغم من ذلك ، يمكن الجمع بين الأشجار الرباعية التي استنتجتها متنبئات الشبكة المتبقية لبناء أشجار أكبر باستخدام الخوارزميات الموجودة مثل الحيرة الرباعية (Strimmer and von Haeseler 1996). يبدأ اللغز الرباعي من شجرة رباعية واحدة ويضيف تدريجياً أصنافًا إلى الشجرة على أساس جميع الأشجار الرباعية ، حتى نيتم الحصول على شجرة وسيطة -taxon. يتم تنفيذ عمليات تكرار متعددة ويتم إنتاج إجماع لجميع الأشجار الوسيطة للتخلص من الأخطاء الإرشادية الناتجة عن استخدام رباعيات بداية مختلفة وأوامر مختلفة من إضافات الأصناف.

طبقنا رباعيًا محيرًا على مجموعة بيانات البروتين الفلوري الأحمر المكونة من 19 تصنيفًا. على أساس 3876 شجرة رباعية تم إنشاؤها بواسطة متنبئات الشبكة العصبية المتبقية لدينا ، قمنا بإعادة بناء شجرة توافق حكم الأغلبية من 1000 شجرة وسيطة. أشجار الإجماع لها مسافات روبنسون-فولدز (دالترددات اللاسلكية) من 12 (DNN1) أو 10 (DNN2 و DNN3) من الهيكل الحقيقي (الجدول 3). للمقارنة ، نتج عن أشجار الرباعية الصحيحة والأشجار الرباعية العشوائية أشجار إجماع مع دالترددات اللاسلكية = 0 و 32 على التوالي. وبالمثل ، بُنيت الرباعية المحيرة الأشجار على أساس الأشجار الرباعية التي استنتجتها الأساليب الحالية دالترددات اللاسلكية من 8-14 من الشجرة الحقيقية (الجدول 3). لقد استنتجنا أيضًا بشكل مباشر طوبولوجيا شجرة 19 تصنيفًا بكل طريقة موجودة. من بينها ، حققت واحدة فقط من الأشجار الثلاثة التي تتساوى في البخل دالترددات اللاسلكية من 8 (كانت الشجرتان الأخريان متساويتان في البخل دالترددات اللاسلكية 12 و 14). بالنسبة للطرق الأخرى الموجودة ، دالترددات اللاسلكية بين 10 و 12 (الجدول 3). وبالتالي ، فإن شجرة الحيرة الرباعية المستندة إلى تنبؤات DNN2 أو DNN3 تكون دقيقة أو أكثر دقة من تلك التي تم إنشاؤها بواسطة الطرق الحالية. تُظهر هذه النتائج أنه عند دمجها مع الحيرة الرباعية ، يمكن تطبيق تنبؤات DNN الخاصة بنا بسهولة على مجموعات البيانات لأكثر من أربعة تصنيفات ، والقيد الوحيد هو العدد الكبير من الرباعيات المحتملة مع زيادة العدد الإجمالي للأصناف. نظرًا للكفاءة الزمنية العالية لتنبؤات DNN الخاصة بنا في حل طبولوجيا الرباعية بالتوازي (انظر المناقشة) ، يمكن إعادة بناء شجرة من عشرات الأنواع في وقت قصير ، والذي يناسب مقياس معظم دراسات التطور.

دقة الأشجار الكبيرة من بروتينات الهلال الأحمر ، التي تم تجميعها من قبل الرباعية المحيرة بناءً على استدلالات مختلفة لشجرة الرباعية أو أعيد بناؤها مباشرة بالطرق الحالية.

المتنبئون. مسافة روبنسون - فولدز (دالترددات اللاسلكية) من الشجرة الحقيقية.
إجماع الرباعية المحيرة. الاستدلال المباشر للشجرة الكبيرة.
DNN1 12
DNN2 10
DNN3 10
نيوجيرسي 8 10
النائب 14 11.3 أ
RAxML 12 12
PhyML 10 12
مستر بايز 8 12
المتنبئون. مسافة روبنسون - فولدز (دالترددات اللاسلكية) من الشجرة الحقيقية.
إجماع الرباعية المحيرة. الاستدلال المباشر للشجرة الكبيرة.
DNN1 12
DNN2 10
DNN3 10
نيوجيرسي 8 10
النائب 14 11.3 أ
RAxML 12 12
PhyML 10 12
مستر بايز 8 12

متوسط دالترددات اللاسلكية من ثلاثة أشجار MP شحيحة بالتساوي.

دقة الأشجار الكبيرة من بروتينات الهلال الأحمر ، التي تم تجميعها من قبل الرباعية المحيرة بناءً على استدلالات مختلفة لشجرة الرباعية أو أعيد بناؤها مباشرة بالطرق الحالية.

المتنبئون. مسافة روبنسون - فولدز (دالترددات اللاسلكية) من الشجرة الحقيقية.
إجماع الرباعية المحيرة. الاستدلال المباشر للشجرة الكبيرة.
DNN1 12
DNN2 10
DNN3 10
نيوجيرسي 8 10
النائب 14 11.3 أ
RAxML 12 12
PhyML 10 12
مستر بايز 8 12
المتنبئون. مسافة روبنسون - فولدز (دالترددات اللاسلكية) من الشجرة الحقيقية.
إجماع الرباعية المحيرة. الاستدلال المباشر للشجرة الكبيرة.
DNN1 12
DNN2 10
DNN3 10
نيوجيرسي 8 10
النائب 14 11.3 أ
RAxML 12 12
PhyML 10 12
مستر بايز 8 12

متوسط دالترددات اللاسلكية من ثلاثة أشجار MP شحيحة بشكل متساوٍ.


الملخص

تظهر الجرابيات تنوعًا كبيرًا في البيئة والتشكل. ومع ذلك ، مقارنة بمجموعتهم الشقيقة ، الثدييات المشيمية ، فإن فهمنا للعديد من جوانب التطور الجرابي لا يزال محدودًا. نحن نستخدم 101 جينوم ميتوكوندريا وبيانات من 26 موقعًا نوويًا لإعادة بناء سلالة مؤرخة تتضمن 97٪ من الأجناس الموجودة و 58٪ من الأنواع الجرابيات الحديثة. تسمح لنا هذه الشجرة بتحليل تطور تفضيل الموائل والتوزيعات الجغرافية لأنواع جرابيات عبر الزمن. لقد وجدنا نمطًا من الأنساب المتكيفة مع المسطحات تتطور لاستخدام المزيد من الموائل القاحلة والمفتوحة ، والتي تتوافق على نطاق واسع مع المناخ الإقليمي والتغير البيئي. ومع ذلك ، على عكس الاتجاه العام ، يبدو أن العديد من السلالات قد تحولت لاحقًا من الموائل الأكثر جفافاً إلى الموائل الأكثر كثافة. تشير عمليات إعادة البناء الجغرافي الجغرافي إلى ضرورة مراجعة الآراء الحالية حول الترابط بين أستراليا وغينيا الجديدة / والاسيا خلال العصر الميوسيني والبليوسيني. تشير العصور القديمة للعديد من مجموعات غينيا الجديدة المستوطنة بقوة إلى فترة أقدم بكثير من الاتصال تمتد إلى العصر الميوسيني الأوسط وتشير إلى أن غينيا الجديدة قد استُعمرت من قبل مجموعات متعددة على الفور تقريبًا بعد تشكيلها الرئيسي.


الذي نفعله

نحن معمل أبحاث في قسم البيئة والتطور وعلم الوراثة الرائع في الجامعة الوطنية الأسترالية في كانبيرا ، أستراليا. نقضي وقتنا في العمل على جينومات مجموعة متنوعة من الكائنات الحية لفهم كيف ولماذا تتغير بمرور الوقت.

عملنا يربط بين المقاييس المكانية والزمانية: من الطفرات التي تحدث داخل فرد واحد على مدى بضعة عقود ، إلى التطور طويل المدى لكتل ​​الأنواع الموزعة عالميًا على مدى ملايين السنين. نعمل أيضًا على الجوانب النظرية للتطور الجزيئي ، ونطور طرقًا وبرامج إحصائية جديدة لتحليل مجموعات بيانات الحمض النووي الضخمة. وراء كل هذا دافع لفهم بعض الأسئلة الكبيرة في علم الأحياء ، من وجود ووظائف الخطوط الجرثومية إلى محاولات استنتاج شجرة الحياة كلها. أفضل طريقة للحصول على فكرة جيدة عما نقوم به هي إلقاء نظرة على منشوراتنا.


تطور الجراثيم الجزيئية ، والجغرافيا الحيوية ، وتفضيل الموائل للجرابيات

تظهر الجرابيات تنوعًا كبيرًا في البيئة والتشكل. ومع ذلك ، بالمقارنة مع المجموعة الشقيقة ، الثدييات المشيمية ، فإن فهمنا للعديد من جوانب التطور الجرابي لا يزال محدودًا. نحن نستخدم 101 جينوم ميتوكوندريا وبيانات من 26 موقعًا نوويًا لإعادة بناء سلالة مؤرخة تتضمن 97٪ من الأجناس الموجودة و 58٪ من الأنواع الجرابيات الحديثة. تسمح لنا هذه الشجرة بتحليل تطور تفضيل الموائل والتوزيعات الجغرافية لأنواع جرابيات عبر الزمن. لقد وجدنا نمطًا من الأنساب المتكيفة مع المسطحات تتطور لاستخدام المزيد من الموائل القاحلة والمفتوحة ، والتي تتوافق على نطاق واسع مع المناخ الإقليمي والتغير البيئي. ومع ذلك ، على عكس الاتجاه العام ، يبدو أن العديد من السلالات قد تحولت لاحقًا من الموائل الأكثر جفافاً إلى الموائل الأكثر كثافة. تشير عمليات إعادة البناء الجغرافي الجغرافي إلى ضرورة مراجعة الآراء الحالية حول الترابط بين أستراليا وغينيا الجديدة / والاسيا خلال العصر الميوسيني والبليوسيني. تشير العصور القديمة للعديد من مجموعات غينيا الجديدة المستوطنة بقوة إلى فترة أقدم من الاتصال تمتد إلى العصر الميوسيني الأوسط وتشير ضمناً إلى أن غينيا الجديدة كانت مستعمرة من قبل مجموعات متعددة على الفور تقريبًا بعد تكوينها الرئيسي.

الكلمات الدالة: إعادة بناء دولة الأسلاف فوق مصفوفة الميتوكوندريا الثديية.


شاهد الفيديو: أساسيات علم الوراثة - Genetics Basics (قد 2022).


تعليقات:

  1. Ronson

    من حيث المبدأ ، لا أعرف الكثير عن هذا المنشور ، لكنني سأحاول أن أفهم كل شيء.

  2. Heallstede

    لا أعلم.

  3. Dikesone

    احتج على ذلك.

  4. Yozshushicage

    انت لست على حق. أرسل لي بريدًا إلكترونيًا إلى PM.

  5. Wadley

    فكرت ، وأزال فكرته



اكتب رسالة