معلومة

G> T التحويل مقابل. T> G التحويل؟

G> T التحويل مقابل. T> G التحويل؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لذلك أنا أقرأ عن كيف يمكن أن تحدث الطفرات في الحمض النووي عن طريق الضرر التأكسدي. يتم إعطاء مثال على أحد منتجات الضرر التأكسدي: 8-oxo-7-hydrodeoxyguanosine

يقول كتابي المدرسي أن هذا المنتج يخطئ كثيرًا مع A ، مما يؤدي إلى مستوى عالٍ من G -> ت.

ما لا أفهمه هو سبب كونه تحويلاً من نوع G -> T. إذا كان 8-oxo-G يقترن بـ A ، مما ينتج عنه زوج A-G ، أليس هذا تحويل T -> G؟ أم أن الأمر لا يهم؟


في الأصل كان للموقف زوج من G: C. بعد الطفرة ، يوجد زوج oxoG: C. عند التكرار ، سيتم إقران الخيط مع C مع G وسيتم إنشاء الزوج الأصلي كما هو متوقع. ومع ذلك ، نظرًا لأن oxoG يمكن أن يقترن أيضًا بـ A ، فقد يشكل الخيط الذي يحتوي على oxoG نوعًا من oxoG: A. جولة أخرى من النسخ تعطي النواتج T: A و oxoG: A. وبالتالي يتم استبدال G في الخيط الأصلي بـ T (أي أنه تحويل G $ {->} $ T).


طفرات الحمض النووي على نطاق الجينوم في نباتات الأرابيدوبسيس بعد التعرض متعدد الأجيال لدرجات حرارة عالية

يمكن أن تسبب درجات الحرارة المرتفعة استجابات فسيولوجية وكيميائية حيوية وجزيئية في النباتات يمكن أن تؤثر بشكل كبير على نموها وتطورها. الطفرات هي القوة الأساسية الدافعة للتطور البيولوجي. ومع ذلك ، كيف تؤثر الارتفاعات طويلة المدى في درجة الحرارة على تراكم الطفرات في النباتات لا تزال غير معروفة.

نتائج

التعرض متعدد الأجيال أرابيدوبسيس ينتج عن خطوط MA (تراكم الطفرات) ومجموعات MA إلى الحرارة الشديدة والاحترار المعتدل زيادة ملحوظة في معدلات الطفرات في متغيرات النوكليوتيدات المفردة (SNVs) و indels الصغيرة. نلاحظ أطياف طفرات مميزة تحت درجات حرارة شديدة الارتفاع ومعتدلة ، مع زيادات كبيرة في ترددات الانتقال والانتقال. تحدث الطفرات بشكل متكرر في المناطق الجينية ومناطق الترميز والعناصر القابلة للنقل في النباتات التي تنمو تحت درجات حرارة مرتفعة. في درجات الحرارة المرتفعة ، يتراكم المزيد من الطفرات في الجينات المرتبطة بالاستجابات الدفاعية وإصلاح الحمض النووي والإشارات. والجدير بالذكر أن أنماط توزيع الطفرات بين جميع السلالات تختلف بين مجموعات MA وخطوط MA ، مما يشير إلى حدوث تأثيرات انتقاء أقوى في المجموعات السكانية. يتم ملاحظة المثيلة بشكل متكرر في مواقع الطفرات ، مما يشير إلى مساهمتها في عملية الطفرة في درجات حرارة مرتفعة. الطفرات التي تحدث داخل نفس الجينوم تحت درجات حرارة مرتفعة منحازة بشكل كبير نحو مناطق كثافة الجينات المنخفضة ، ثلاثي النوكليوتيدات الخاصة ، التكرارات الترادفية ، والتكرارات البسيطة المجاورة. بالإضافة إلى ذلك ، تتداخل الطفرات الموجودة في جميع السلالات بشكل كبير مع الاختلافات الجينية المبلغ عنها في 1001 جينوم ، مما يشير إلى التوزيع غير المنتظم لطفرات دي نوفو من خلال الجينوم.

استنتاج

بشكل جماعي ، تشير نتائجنا إلى أن درجات الحرارة المرتفعة يمكن أن تسرع من تراكم ، وتغيير الملامح الجزيئية ، لطفرات الحمض النووي في النباتات ، وبالتالي توفير نظرة ثاقبة حول كيفية تغذي درجات الحرارة البيئية تطور النبات.


مقدمة

على الرغم من أن سرطان الغدة الدرقية يمثل 1٪ فقط من جميع الأمراض الخبيثة ، إلا أنه أكثر الأورام الخبيثة شيوعًا في نظام الغدد الصماء ، وهو مسؤول عن غالبية الوفيات الناجمة عن سرطانات الغدد الصماء (Mazzaferri ، 1993 Farid et al. ، 1995). يصنف سرطان الغدة الدرقية من الناحية النسيجية على أنه سرطان الغدة الدرقية الحليمي (PTC) ، وسرطان الغدة الدرقية الجريبي (FTC) ، وسرطان الغدة الدرقية الكشمي (ATC) ، وسرطان الغدة الدرقية النخاعي (MTC) ، وهو ما يمثل حوالي 80 و 15 و 2 و 4٪ من جميع الغدة الدرقية الأورام الخبيثة على التوالي (Hundahl et al. ، 1998). مشتق PTC و FTC و ATC من الخلايا الظهارية للغدة الدرقية الجريبي ، في حين أن MTC مشتق من خلايا parafollicullar C التي تفرز الكالسيتونين. يحدث MTC إما بشكل متقطع أو عائلي (75-80 و 20-25 ٪ من الحالات ، على التوالي) (Girelli et al. ، 1998 Massoll and Mazzaferri ، 2004) ، وهي سمة ثابتة للأورام الصماء المتعددة MEN2A ، MEN2B ، والعائلة من غير MEN MTC (FMTC). تم العثور على طفرة السلالة الجرثومية للجين الورمي الأولي RET في غالبية المرضى الذين يعانون من MEN2 و FMTC ، ويعتبر السبب الجيني الأساسي للمرض (مارش وآخرون ، 1997). تم الإبلاغ أيضًا عن طفرات نقطية جسدية RET في 40-50 ٪ من MTCs المتفرقة (Hansford and Mulligan ، 2000 Elisei et al. ، 2004). يعتمد العلاج الناجح لـ MTC بشكل كبير على التشخيص والعلاج المبكر. تعتمد الاستراتيجيات السريرية الحالية في تشخيص وإدارة MTC الوراثي على اختبار البلازما الروتيني كالسيتونين والاختبار الجيني لطفرات الجينات الورمية الأولية RET (Massoll and Mazzaferri ، 2004). يعتبر فحص البلازما كالسيتونين علامة حساسة ومحددة لوجود MTC ويوفر تقديرًا دقيقًا لعبء الورم. يوفر الاختبار الجيني لطفرات الجينات الورمية الأولية لـ RET تشخيصًا دقيقًا لحاملات الجينات في أفراد الأسرة المعرضين للخطر ويوفر أفضل فرصة للشفاء من MTC عن طريق استئصال الغدة الدرقية الكلي الوقائي واستئصال العقد اللمفية (Massoll and Mazzaferri ، 2004). تشير التقديرات إلى أن الاحتمال هو 0.18٪ بالنسبة إلى الدرجة الأولى بالنسبة لوراثة جين RET الطافر من فرد لديه MTC متقطع بدون طفرة RET في السلالة الجرثومية (Massoll and Mazzaferri ، 2004).

إن طفرات السلالة الجرثومية في الجينات النووية التي تشفر إنزيمات الميتوكوندريا قد تورطت في الأورام الوراثية (Eng et al. ، 2003). على سبيل المثال ، ترتبط طفرات السلالة الجرثومية غير المتجانسة في إنزيم الميتوكوندريا المشفر وراثيًا (فومارات هيدراتاز) بالاستعداد الوراثي لسرطان الخلايا الكلوية الحليمي والورم العضلي الأملس (Tomlinson et al. آل ، 1994). ترتبط طفرات السلالة الجرثومية في وحدات إنزيم الميتوكوندريا المشفر وراثيًا (SDH) وحدات SDHD و SDHC و SDHB (معقد السلسلة التنفسية للميتوكوندريا II) بالاستعداد الوراثي لورم القواتم وورم المستقتمات ، وكلاهما ينشأ من خلايا الكرومافين العصبية. Astuti وآخرون ، 2001 Benn et al. ، 2003). على الرغم من أن خلايا الغدة الدرقية C مشتقة من خلايا القمة العصبية وأن كلا من MTC وورم القواتم جزء من MEN2A ، لم يتم الإبلاغ عن طفرة mtDNA في الأدبيات. في هذه الدراسة ، قمنا بفحص 26 عينة من MTC وخط خلية واحد من MTC لطفرة mtDNA عن طريق تحليل التسلسل لمنطقة الترميز بأكملها لـ mtDNA.


مناقشة

استنادًا إلى مجموعة من ثماني دراسات تشير إلى ملاءمة الطفرات البديلة ، قمنا بتقييم احتمالات الفرضية القائلة بأن تحفظ البدائل عبر حسابات الانتقال لتكرارها المتزايد في التطور. حتى الدراسات الصغيرة تكشف عن أنماط يمكن التنبؤ بها من قابلية تبادل الأحماض الأمينية ، ومعظمها لديها القوة الكافية للتمييز بين المحافظ الثنائي مقابل الجذري. ومع ذلك ، فإن نفس الدراسات عادة لا تظهر تحفظًا كبيرًا في التحولات. بشكل عام ، فإن فرصة أن تكون الطفرة الانتقالية أكثر ملاءمة من الانقلاب هي 53٪ (95٪ CI 50 إلى 56). حجم التأثير هذا ليس كبيرًا مقارنةً بمعظم المتنبئين البيوكيميائيين ، وهو ليس كبيرًا بما يكفي لشرح التحيز متعدد الأضعاف تجاه بدائل الانتقال التي لوحظت في الدراسات التطورية.

إن اكتشاف أن تحفظ التحولات هو تأثير ضعيف إلى حد ما يزيد من احتمالات التفسير الطفري البديل ، حيث يكون المعدل الذي يتم فيه إدخال الأليلات الجديدة عن طريق الطفرات الانتقالية أعلى بعدة أضعاف من التحولات ، وهذا التحيز يهيئ التغيير التطوري إلى يحدث عبر الانتقالات (للحصول على شرح عام ، انظر Stoltzfus and Yampolsky 2009).

على الرغم من أن هذه الفكرة قد تكون مألوفة ، إلا أنها تتعلق بقضية جوهرية وغير محلولة في علم الوراثة التطورية ، وهي المدى الذي يحدث فيه التطور في الطبيعة في نظام "تجمع الجينات" الذي يفترضه مهندسو التركيب الحديث ، في نوع نظام يحركه الطفرات يفترضه دعاة الطفرات الأوائل وأنصار التطور الجزيئي في وقت لاحق ، أو شيء ما بينهما (McCandlish and Stoltzfus 2014). تشير فكرة الطفرة والاختيار كقوى متعارضة إلى أن تحيز الطفرة سيكون مؤثرًا فقط عندما يكون الاختيار غائبًا ، وبالتالي غالبًا ما يتم تفسير الفرضيات التي تستدعي تحيز الطفرة على أنها نماذج محايدة (كما لاحظ Yampolsky و Stoltzfus 2001). من المفترض أن هذا هو السبب في أن الباحثين اتبعوا تفسيرات انتقائية للتحول: تحيز التحول بين تغيرات الأحماض الأمينية ، حتى أثناء قبول التفسير الطفري للتغييرات غير المشفرة في الجينات نفسها: يُفترض أن البروتينات "قيد الانتقاء" وبالتالي ليست عرضة للطفرة انحياز، نزعة. ومع ذلك ، فإن هذه الطريقة في تصوير الطفرة والاختيار كقوى متعارضة لا يمكن تبريرها إلا في ظل الظروف الخاصة لنظام تجمع الجينات. خارج هذا النظام ، يمكن أن يساهم كل من الطفرة والاختيار في التوجيه أو الاتجاه في التطور (Yampolsky and Stoltzfus 2001 McCandlish and Stoltzfus 2014).

تثير النتائج المعروضة هنا أيضًا التساؤل حول كيف أصبح من المفترض على نطاق واسع أن التحولات متحفظة. في دراسة استقصائية للأدبيات ، وجدنا أنه عندما يُعزى التحفظ المزعوم للتحولات إلى مصدر ما ، غالبًا ما يكون المصدر هو Zhang (2000) ، أو الأعمال المبكرة مثل Fitch (1967) ، Grantham (1974) ، أو Vogel and كوبون (1977). لا يعالج Grantham (1974) هذه المشكلة بشكل صريح ، لكن الحساب المستند إلى الشفرة الجينية يُظهر أن متوسط ​​مسافة Grantham للبدائل بوساطة الانتقال أقل من تلك الخاصة بعمليات الاستبدال ، على سبيل المثال ، كما هو موضح في الجدول 2 من Xia et al (1998 ). غالبًا ما يُستشهد بالدراسة التي أجراها Vogel و Kopun كدليل على فرضية التحولات المحافظة ، لأنها تقدم حسابًا ، لثلاثة مقاييس بيوكيميائية مختلفة ، يشير إلى أن التحولات أكثر تحفظًا.

هذه الدراسات السابقة غير حاسمة لسببين عامين. الأول هو أنه لم يتم الإبلاغ عن حجم تأثير كافٍ لتفسير التحيز التطوري. في الواقع ، فضل Vogel و Kopun تفسيرًا طفريًا للتحيز التطوري على أساس أن حجم تأثير التحفظات في التحولات يبدو صغيرًا جدًا (انظر الفرضية 3 في الصفحة 179). تحليل Zhang (2000) لثلاثة محافظات محتملة: الفروق الجذرية وجدت أن التمييز القائم على Miyata et al (1979) ينتج أكبر حجم للتأثير التطوري ، وهو تأثير مزدوج ، أي أن البدائل الجذرية هي تقريبًا نصف احتمال تتراكم نسبة إلى التوقعات الفارغة. ومع ذلك ، على الرغم من أن تأثير التحفظ مضاعف ، فإن الرابط المبلغ عنه بين التحولات والتحفظ ضعيف. وفقًا لـ Zhang (2000) ، فإن فرصة أن يكون الانتقال متحفظًا وفقًا لمقياس مياتا هو 35٪ ، مقارنة بـ 33٪ لعمليات التحويل ، وهو فرق نسبي يبلغ 6٪ فقط (أي 2/33 = 0.06). قد يكون التحفظ في مياتا تأثيرًا تطوريًا مزدوجًا ، ولكن إذا كانت التحولات أكثر محافظة بنسبة 6٪ فقط من مياتا مقارنة بالانتقالات ، فسيكون التحيز العام أقل بكثير من الضعف.

ثانيًا ، لا يفلت أي من هذه الأعمال من نوع الدائرة المنطقية التي أشار إليها دي جوليو (2001) ، انظر أيضًا Yampolsky و Stoltzfus (2005) ، حيث يتم استدعاء مقياس للميول التطورية للدفاع عن تأثيرات الانتقاء بدلاً من الطفرة ، متجاهلاً احتمال أن يكون نمط التطور نفسه متأثرًا بآثار الطفرات. هذا شكل غير مباشر (وبالتالي من المفترض أنه غير مقصود) من مغالطة بانجلوسيان ، أي أنه من المغالطة رسمياً القول بأن التحولات أفضل لمجرد أنها تحدث في كثير من الأحيان ، دون الاستفسار عن سبب حدوثها في كثير من الأحيان.

لا يتم تجنب الاستدارة باستدعاء العوامل البيوكيميائية. تستند المؤشرات المركبة الشائعة للمسافة "الكيميائية الحيوية" التي أنشأها جرانثام (1974) ومياتا وآخرون (1979) إلى اختيار العوامل البيوكيميائية التي تتناسب جيدًا مع الأنماط التطورية المرصودة من مقارنات البروتين السابقة. وبالمثل ، فإن جميع المقاييس البيوكيميائية الثلاثة المستخدمة من قبل Vogel و Kopun (1977) تستند إلى ملاءمة مقارنات البروتين. تم اقتراح مشكلة هذا النهج في الشكل 4 ، والذي يوضح مدى تحفظ التحولات للمؤشرات البيوكيميائية في قاعدة بيانات AAindex (Kawashima and Kanehisa 2000). حوالي 3 من 5 تجعل التحولات تبدو متحفظة ، بينما تجعلها 2/5 الأخرى تبدو جذرية.

ميزة التحولات التي تنطوي عليها العوامل البيوكيميائية المختلفة. تم استخدام 245 عاملًا كيميائيًا حيويًا من AAindex لحساب مقياس التشابه الزوجي للأحماض الأمينية التي تشير إلى تشابهها الكيميائي الحيوي ، ثم تم استخدام هذه التدابير لتقييم ما إذا كانت التحولات أكثر تحفظًا من عمليات الاستبدال. AUC هي فرصة أن يكون للاستبدال بسبب الانتقال درجة تشابه أعلى من الانقلاب المختار عشوائيًا (حيث يعتمد أخذ العينات العشوائية للتحولات والاستعراضات على مجموعة المسوخات الفعلية من الدراسات الثماني). يشير التوزيع الناتج إلى أن التحولات أكثر تحفظًا وفقًا لحوالي 3/5 من العوامل البيوكيميائية (AUC & gt 0.5) ، وأقل تحفظًا وفقًا ل 2/5 الأخرى من العوامل (AUC & lt 0.5).

ميزة التحولات التي تنطوي عليها العوامل البيوكيميائية المختلفة. تم استخدام 245 عاملًا كيميائيًا حيويًا من AAindex لحساب مقياس التشابه الزوجي للأحماض الأمينية التي تشير إلى تشابهها الكيميائي الحيوي ، ثم تم استخدام هذه التدابير لتقييم ما إذا كانت التحولات أكثر تحفظًا من عمليات الاستبدال. AUC هي فرصة أن يكون للاستبدال بسبب الانتقال درجة تشابه أعلى من الانقلاب المختار عشوائيًا (حيث يعتمد أخذ العينات العشوائية للتحولات والاستعراضات على مجموعة المسوخات الفعلية من الدراسات الثماني). يشير التوزيع الناتج إلى أن التحولات أكثر تحفظًا وفقًا لحوالي 3/5 من العوامل البيوكيميائية (AUC & gt 0.5) ، وأقل تحفظًا وفقًا ل 2/5 الأخرى من العوامل (AUC & lt 0.5).

كما يشير الشكل 2 ، هذا ليس لأن المؤشرات البيوكيميائية هي بشكل عام مؤشرات سيئة للتبادل. بدلاً من ذلك ، من بين العديد من المتنبئين الأقوياء بشكل معتدل ، هناك متنبئون يجعلون التحولات تبدو مواتية ، والبعض الآخر يجعل عمليات الاستبدال تبدو مواتية. وبالتالي ، فإن تحويل الأنماط التطورية إلى واصفات كيميائية حيوية قبل إعادة تطبيقها على تحليل الأنماط التطورية لا يسمح للمرء بالهروب من دائرية منطقية: يمكن استدعاء بعض العوامل البيوكيميائية لتبرير تحفظ التحولات ، في حين يمكن استدعاء البعض الآخر لتبرير تحفظ استعالات.


نتائج

Cox1 قاعدة بيانات مرجعية

أنشأنا قاعدة بيانات مرجعية من 624 محاذاة ، وجزئية ، وطول 351 نقطة أساس cox1 التسلسلات. تضمنت قاعدة البيانات مزيجًا من التسلسلات من الأنواع المستهدفة (378 تسلسلًا من 149 نوعًا) ، والأنواع المصاحبة (226 تسلسلًا من 139 نوعًا) ، والأنواع النموذجية (20 تسلسلًا من 20 نوعًا). كانت الأنواع المستهدفة تهدف إلى تتبع التلوث المتبادل بين العينات. تم إدخال الأنواع المصاحبة كعناصر تحكم سلبية. تم إدخال أنواع نموذجية للبحث عن التلوث بواسطة الكائنات المختبرية القياسية. في قواعد البيانات المرجعية الخاصة بنا ، لم يتم تمثيل 31 نوعًا من الأنواع المستهدفة على الإطلاق ، وتم تمثيل 98 نوعًا واحدًا cox1 متتالية ، وتم تمثيل ستة بأكثر من عشرة cox1 التسلسل ، مما يعني أن قدرتنا على اكتشاف حدوث نوع معين في عينة معينة تختلف باختلاف الأنواع.

أنماط التلوث بين الأنواع

تمت محاذاة قراءات التسلسل القصير من كل من 446 عينة (أفراد) من 116 نوعًا مع مرجعنا cox1 قاعدة بيانات باستخدام BWA. تم تسجيل عدد مرات الوصول إلى كل تسلسل مرجعي وقسمته على عدد الملايين من القراءات للعينة المدروسة. لكل عينة ، حسبنا انتشار cox1 يضرب إلى تسلسل مرجعي من الأنواع المتوقعة ، وانتشار cox1 يضرب إلى تسلسل مرجعي من نوع غير متوقع - أي نوع يختلف عن الأنواع المتوقعة بنسبة & gt5٪ من cox1 تشعب. لم يتم احتساب الضربات إلى نوع مختلف ولكن & lt5٪ متباينة عن النوع المتوقع.

يوضح الشكل 2 نظرة عامة على نمط التلوث في مجموعة البيانات واسعة النطاق هذه. يوضح الشكل 2 أ التوزيع عبر العينات لانتشار المتوقع (الرمادي) مقابل غير المتوقع (الأحمر) cox1 يقرأ ، بينما يرسم الشكل 2 ب هذين المتغيرين. متوسط ​​الانتشار عبر العينات المتوقع cox1 القراءة كانت 674 cox1 يقرأ لكل مليون. انتشار المتوقع cox1 كانت القراءة منخفضة في بعض الأحيان: كانت & lt10 لكل مليون في 86 عينة ، وصفرًا في 52 عينة ، منها 13 من الأنواع التي تم تمثيلها في مرجعنا cox1 قاعدة البيانات. هذا أمر مثير للدهشة ، بالنظر إلى ذلك cox1 يعتبر جينًا عالي التعبير بشكل عام. يمكن تفسير هذه النتيجة من خلال التمثيل غير الكافي / غير المناسب للأنواع في قاعدة البيانات المرجعية لهذه العينات المعينة. قد يكون أيضًا في بعض نصوص الميتوكوندريا الأصناف التي تفتقر إلى ذيل بولي أ (أو استخدامها كإشارة تدهور ، كما هو الحال في النباتات [39]) ، وبالتالي تم استبعادها في مرحلة النسخ الرجعي في بروتوكولنا.

النمط العام للتلوث بين الأنواع. أ توزيع بين العينات لانتشار القراءات تعيين إلى أ cox1 مرجع من المتوقع (رمادي) أو غير متوقع (أحمر) محيط. يتم تعريف الانتشار على أنه عدد cox1 يقرأ لكل مليون قراءة. ب العلاقة بين انتشار cox1 يقرأ التعيين إلى المتوقع (x-المحور) مقابل غير متوقع (ذ-المحور) الأنواع ، مرة أخرى لكل مليون قراءة. كل نقطة يمثل عينة. خط عادي: نسبة غير متوقعة إلى المتوقع cox1 يقرأ واحد. الخطوط المنقطة: نسبة غير متوقعة إلى المتوقع cox1 القراءة هي 0.1 (على التوالي ، 0.01). عينات من الأنواع غير الممثلة في منطقتنا cox1 لا تظهر قاعدة البيانات المرجعية

وجدنا إصابة واحدة على الأقل لنوع غير متوقع في 353 عينة من 446 عينة. انتشار غير متوقع cox1 كانت الضربات & gt50 لكل مليون في 22 عينة ، و & gt500 لكل مليون في سبع عينات. نوع واحد ، قمل الخشب أرماديليديوم فولجاري، تأثر بشكل خاص بالنتائج غير المتوقعة - أظهر ستة أفراد من كل عشرة & gt50 لكل مليون نتيجة غير متوقعة. اثنا عشر عينة كان معدل انتشار الضربات المتوقعة لها هو & gt100 لكل مليون كانت نسبة النتائج غير المتوقعة إلى المتوقعة & gt 0.1 ، وعينتان ، GA24O (دودة الأرض اللوبوفورا كلوروتيكا L1) و GA17L (روبيان ملحي ارتيميا تبتيانا) ، لديها نسبة و GT1.0. باختصار ، من المتوقع cox1 هيمنت القراءات بشكل واضح ولكن قراءات الملوثات كانت شائعة ووصلت إلى معدل انتشار مرتفع في عدد كبير من العينات.

الغالبية العظمى (99.54٪) من 385،597 غير متوقعة cox1 قراءات نشأت من الأنواع المستهدفة. تم تخصيص 0.11٪ فقط من الضربات غير المتوقعة للأنواع المصاحبة ، و 0.35٪ للأنواع النموذجية. كان الانتشار المنخفض للأنواع المصاحبة متوقعًا وأكد ذلك غير متوقع cox1 تنتج الضربات بشكل فريد تقريبًا من التلوث. فيما يتعلق بالأنواع النموذجية ، اكتشفنا الإنسان cox1 يقرأ في عشر عينات من تسعة أنواع متميزة ، ولكن دائمًا بمعدل انتشار منخفض جدًا - العدد الإجمالي للقراءات التي تصيب الإنسان cox1 كان التسلسل 92. موس العضلات و بوس توروس كانت أكثر انتشارًا من حيث إجمالي القراءات (507 و 447 على التوالي) ، ولكنها تتعلق بعدد أقل من العينات (خمسة وثلاثة) والأنواع (ثلاثة وثلاثة على التوالي).

من بين 446 عينة تم تحليلها ، تضمنت 353 عينة قراءة واحدة على الأقل لرسم خرائط لأنواع غير متوقعة - أي أظهرت أدلة على التلوث بين الأنواع. من بين هؤلاء ، تم تلوث 205 من نوعين على الأقل ، واكتشفنا ما يصل إلى ثمانية أنواع من الملوثات في عينات GA08R (Glanville fritillary ميليتيا سينكسيا) و GA34L (البعوض Culex hortensis). عند جمع الأنواع الملوثة عبر العينات ، وجدنا أن مجموعة البيانات قد تأثرت بما لا يقل عن 782 حدثًا متميزًا للتلوث بين الأنواع. هذا تقدير أقل من الواقع ، بسبب عدم اكتمال قاعدة البيانات المرجعية الخاصة بنا ، وعدم قدرتنا على اكتشاف التلوث بين الأنواع وثيقة الصلة ، وإمكانية حدوث أحداث متعددة لتلوث عينة معينة من قبل نوع معين. عدد المتوقع cox1 يقرأ ، غير متوقع cox1 يقرأ ، وتتوفر أنواع الملوثات لكل عينة في ملف إضافي 2: الجدول S2. وبالعكس ، فإن 94 نوعًا من 180 نوعًا قمنا بمعالجتها في هذا المشروع قد تلوثت عينة واحدة على الأقل من نوع آخر. من بين هذه الأنواع ، تلوثت أربعة أنواع بأكثر من 15 عينة مميزة ، وواحد ، البطريق الملك Aptenodytes patagonicus، عينات ملوثة من 11 نوعًا مختلفًا (ملف إضافي 4: الشكل S1). وجدنا أن متوسط ​​انتشار المتوقع cox1 قراءات أحد الأنواع كانت مرتبطة بشكل كبير بعدد الأفراد الملوثين (ص = 0.35, ص & lt 10 3) وبإجمالي عدد قراءات الملوثات التي ساهمت بها (ص = 0.45, ص & lt 10 4 ، عدد قراءات الملوثات المحولة لوغاريتميًا).

عينات مشكوك فيها

أسفرت عينتان عن أنماط غير متوقعة. عينة GA36K ، مخصصة للأنواع Mytilus trossulus (بلح البحر) ، أسفرت عن واحدة cox1 قراءة التي تم تعيينها إلى ملف م. trossulus المرجع ، ولكن GT18000 cox1 يقرأ تعيين تسلسل من أي منهما M. edulis أو م. galloprovincialis، نوعان متزاوجان من بلح البحر الأوروبي (الشكل 2 ب ، النقطة اليسرى العلوية). على النقيض من ذلك ، 99٪ من cox1 يقرأ من الآخر م. trossulus العينة التي حللناها ، GA36L ، المعينة إلى ملف م. trossulus المرجعي. تم جمع عينة GA36K في سياتل ، واشنطن ، الولايات المتحدة الأمريكية ، وهي ولاية تم فيها توثيق التجمعات الغازية لبلح البحر الأوروبي [40 ، 41]. لذلك ، ربما تكون عينة GA36K ناتجة عن خطأ في تحديد الهوية أو انعكاس M. galloprovincialis / edulis إدخال mtDNA إلى م. trossulus.

وبالمثل ، عينة GA08F ، المخصصة لجلانفيل فريتيلاري ميليتيا سينكسيا (Lepidoptera) ، لم تسفر عن واحدة cox1 قراءة التي تم تعيينها إلى ملف م. سينكسيا مرجع ، لكن & gt26000 cox1 يقرأ تعيينها إلى مرجع من fritillary الأسباني Euphydryas desfontainii. هذا النوع يختلف تمامًا عن م. سينكسيا، شكليًا وجزيئيًا (cox1 divergence & gt25٪) ، لذلك يبدو أن إدخال mtDNA والتعريف الخاطئ به غير محتمل في هذه الحالة. وفقًا لسجلاتنا ، جاءت عينة GA08F من ألاند ، فنلندا ، مكان حيث E. desfontainii لا يحدث. ومع ذلك ، قمنا بأخذ عينة E. desfontainii، معا مع م. سينكسيافي المغرب. لذلك ، ربما تكون المشكلة ناتجة عن تسمية خاطئة للعينة. من المحتمل جدًا أن تنتمي عينة GA08F إلى E. desfontainii وكان مخطئًا لـ م. سينكسيا فرد في تحليلاتنا المنشورة. ومع ذلك ، تحققنا من أن نتائجنا الرئيسية قوية في التعامل مع هذه المشكلات (انظر الفقرة الأخيرة من قسم "النتائج").

تحليل البيانات الوصفية المختبرية

أنشأنا مصفوفة التلوث بين الأنواع م في أي خلية م اي جاي تحتوي على صفر في حالة عدم وجود دليل على تلوث الأنواع ي حسب الأنواع أنا، واحد في حالة الكشف عن تلوث للأنواع ي حسب الأنواع أنا، والبيانات المفقودة إذا كانت الأنواع أنا و ي كانت & lt5٪ متباينة cox1- من ناحية أخرى ، كان من المفترض أن يكون اكتشاف التلوث غير موثوق به. هنا ، قراءة واحدة من أي فرد من الأنواع أنا ضرب تسلسل مرجعي من الأنواع ي اعتبرت كافية لإثبات وقوع حدث تلوث أنا بواسطة ي. أدى طلب ما لا يقل عن عشر قراءات غير متوقعة ، بدلاً من قراءة واحدة فقط ، إلى نتائج مماثلة من الناحية النوعية. 39 عينة من الأنواع غير ممثلة في مرجعنا cox1 تم هنا تجاهل قاعدة البيانات ، بحيث كان حجم العينة 407 في هذا التحليل. العدد الإجمالي للوحدات في م كان 362 ، وكان العدد الإجمالي لأزواج الأنواع المتباينة بدرجة كافية بحيث كان اكتشاف التلوث ممكنًا هو 27251 ، بحيث تم تحديد نسبة أزواج الأنواع التي تم اكتشاف حدث تلوث لها ص = 0.0133.

ركزنا على خمسة تنبئ باحتمالية ارتباط نوعين بالتلوث ، وهما lab_overlap و same_technician و same_shipment و same_flowcellcell و same_lane. لحساب متغير lab_overlap ، حددنا أولاً فترة المعالجة لأي نوع معين على أنها الفترة من تاريخ الدخول إلى مختبرنا حتى تاريخ آخر شحنة إلى مركز التسلسل. بالنسبة لأي زوج معين من الأنواع ، تم تعريف lab_overlap على أنه الطول ، بالأيام ، للتقاطع بين فترات معالجة النوعين. كان متغير same_technician عبارة عن متغير منطقي تم ضبطه على واحد إذا تم التعامل مع عينة واحدة على الأقل من كل من النوعين المعتبرين من قبل نفس الشخص في مختبرنا ، والصفر بطريقة أخرى. وبالمثل ، تشير متغيرات نفس الشحن ، ونفس الخلية ، ونفس المسار إلى ما إذا كان قد تم شحن عينة واحدة على الأقل من كل من النوعين المعتبرين في نفس اليوم إلى نفس مركز التسلسل ، أو التسلسل على نفس خلية التدفق / نفس المسار ، على التوالي.

حسبنا متوسط ​​قيمة هذه المتغيرات عبر جميع أزواج الأنواع التي تم توثيق حدث تلوث لها (الشكل 3 ، أشرطة عمودية حمراء) ، وقارناها بالتوزيعات الفارغة التي تم الحصول عليها عن طريق خلط الأصفار وتلك الموجودة في مصفوفة التلوث (الشكل 3). 3 ، الرسوم البيانية البيضاء ، 1000 مكررات). بتعبير أدق ، تم تعيين كل خلية في مصفوفة عشوائية واحدة ذات احتمال ص، أو صفر مع احتمال (1 - ص) ، مع ترك البيانات المفقودة دون تغيير ، حيث ص = 0.0133 كان الاحتمال العام للتلوث (انظر أعلاه). اكتشفنا تأثيرًا قويًا وهامًا لكل من المتغيرات الخمسة: مقارنة بمتوسط ​​زوج الأنواع ، تميل الأنواع الملوثة لبعضها البعض إلى التداخل لفترة أطول في مختبرنا ، ليتم التعامل معها بواسطة نفس الفني ، وإرسالها إلى نفس اليوم والمتسلسل في نفس التدفق. كان تأثير تسلسل المتغيرات المرتبطة بالمركز قوياً بشكل خاص. على سبيل المثال ، كان احتمال ربط نوعين تم شحنهما معًا بحدث تلوث 0.13 ، أي أكثر من عشرة أضعاف الاحتمال غير المشروط. كان نمط المسار نفسه مشابهًا جدًا لـ same_flowcell ولا يظهر في الشكل 3.

تأثير البيانات الوصفية المختبرية على احتمالية التلوث بين الأنواع. يتم عرض أربعة إحصائيات: lab_overlap (أعلى اليسار) ، same_technician (فوق على اليمين) ، same_shipment (أسفل اليسار) ، same_flowcell (أسفل اليمين). x-المحور: متوسط ​​قيمة كل إحصائية. خط أحمر عمودي: مجموعة البيانات الفعلية. ذ-المحور: عدد مجموعات البيانات العشوائية (من 1000). الرسوم البيانية البيضاء: التوزيع المتوقع بافتراض الاحتمال العشوائي للتلوث. الرسوم البيانية الزرقاء: التوزيع المتوقع على افتراض أن التلوث يعتمد على نفس الشحن. الرسوم البيانية الخضراء: التوزيع المتوقع على افتراض أن التلوث يعتمد على lab_overlap و same_technician

كانت المتغيرات الخمسة التي تم تحليلها مرتبطة بشكل كبير مع بعضها البعض. حاولنا فصل آثارها ، وتمييز تأثير مختبرنا بشكل خاص عن تأثير مراكز التسلسل. لهذا الهدف ، قمنا بمقارنة القيمة الملحوظة لـ lab_overlap و same_technician بالتوزيعات الفارغة التي تم الحصول عليها عن طريق إعادة التوزيع. م بطريقة تتحكم في تأثيرات نفس الشحن (الشكل 3 ، الرسم البياني العلوي ، الأزرق). في هذا التحليل ، كل (أنا, ي) خلية مصفوفة عشوائية واحدة مع احتمال ص اي جاي، أو صفر مع احتمال (1 - ص اي جاي) ، مرة أخرى مع ترك البيانات المفقودة دون تغيير ، حيث ص اي جاي كان احتمال التلوث بمعرفة نفس الشحن (أنا, ي). تم الحصول عليها عن طريق حساب نسبة الواحد في م مشروطة بالقيم 0 أو 1 من أجل same_shipment. وبالمثل ، تم إنشاء التوزيعات الفارغة من نفس الشحنة ونفس التدفق الشرطي على lab_overlap و same_technician (الشكل 3 ، الرسم البياني السفلي ، الأخضر). كانت تأثيرات المتغيرات الخمسة لا تزال مهمة في تحليلات التحكم هذه: تم اكتشاف تأثير مختبري عند التحكم في تسلسل المتغيرات المرتبطة بالمركز وتم اكتشاف تأثير مركز التسلسل عند التحكم في المتغيرات المرتبطة بالمختبر.

لتحليل هذا التأثير بشكل أعمق ، أنشأنا متغيرين اصطناعيين يلخصان تأثير المختبر (LAB) ومركز التسلسل (CENTER) ، على التوالي. كان متغير LAB موجبًا عندما كان same_technician صحيحًا وكان lab_overlap & gt200 يوم ، ولكنه سلبي بخلاف ذلك. كان متغير CENTER سالبًا لأزواج الأنواع التي يتم شحنها في تواريخ مميزة ، ولكنها إيجابية بخلاف ذلك. فيما يتعلق بأزواج الأنواع التي تم إرسالها معًا ، قمنا بتمييز الأزواج المتسلسلة على خلايا تدفق مميزة (CENTER +) ، ونفس خلايا التدفق ولكن الممرات المميزة (CENTER ++) ، ونفس الممر (CENTER +++). في هذا التحليل ، ركزنا على 97 نوعًا تتوفر لها معلومات عن تواريخ الشحن وخلايا التدفق وأرقام الممرات لجميع الأفراد. بقدر ما يتعلق الأمر بالأنواع المرسلة في تواريخ مميزة (CENTER-) ، كان احتمال التلوث منخفضًا جدًا بغض النظر عن LAB (الجدول 1 ، السطر الأول). يبدو أن هذا لا يتوافق مع فرضية وجود مستوى كبير من التلوث في مختبرنا. في المقابل ، كان احتمال وجود نوعين تم شحنهما في نفس اليوم مرتبطين بحدث تلوث يصل إلى 0.2 ، ويزيد بشكل أكبر في حالة خلية التدفق المشتركة والممر المشترك (الجدول 1 ، الأسطر 2 إلى 4) ، والوصول إلى القيم و GT0 .5.

بشكل مفاجئ ، اكتشفنا تفاعلًا قويًا وهامًا بين متغيري LAB و CENTER (الجدول 1). تم شحن نوعين في نفس اليوم (CENTER +) ، متداخلين في مختبرنا ، وتم التعامل معهما بواسطة نفس الفني (LAB +) مما أدى إلى زيادة احتمالية التلوث بشكل كبير. نقترح أن هذا هو تأثير مستحث ناتج عن حقيقة أن الأنابيب الموجودة في الصناديق المشحونة قد تم طلبها من قبل فني ، بحيث يُفترض أن العينات التي تمت معالجتها بواسطة نفس الفني في مختبرنا من المرجح أن تتم معالجتها معًا عن طريق مراكز التسلسل ، وبالتالي تلوث كل منها آخر. لاختبار هذه الفرضية ، قمنا بأخذ عينات فرعية من الأنواع بحيث يتم الاحتفاظ بنوع واحد لكل فني لكل شحنة ، بحيث لا يكون من الممكن حدوث أي تأثير محرض للشحنة نفسها على نفس الفني. وجدنا ثمانية أحداث تلوث بين 24 نوعًا من العينة الفرعية. لا يزال هناك تأثير كبير من نفس الشحن على احتمالية التلوث في هذه العينة الفرعية ، ولكن لم يتم اكتشاف أي تأثير لـ lab_overlap أو same_technician (ملف إضافي 5: الشكل S2) ، مما يشير إلى أن تأثير LAB المشروط على CENTER + المبلغ عنه في الجدول 1 كان تأثيرًا مستحثًا. لذلك تشير هذه التحليلات إلى أن الغالبية العظمى من أحداث التلوث بين الأنواع التي اكتشفناها حدثت في مراكز التسلسل. لم تتغير النتائج نوعيًا عند استخدام حد 10٪ ، بدلاً من 5٪ ، للحد الأدنى cox1 الاختلاف بين الأنواع الملوثة والملوثة (ملف إضافي 6: الجدول S3).

التلوث المختبري: تحليل مفصل

تم الكشف عن ثمانية أحداث تلوث بين الأنواع التي لم يتم شحنها في نفس التاريخ. من بين هؤلاء ، أربعة متورطون في Glanville fritillary م. سينكسيا. هذا هو النوع الوحيد في مجموعة البيانات الخاصة بنا التي تضمنت عينات كانت بيانات تاريخ الشحن الخاصة بها مفقودة (GA08B إلى GA08F ، ملف إضافي 2: الجدول S2). الأنواع الثلاثة الملوثة أو الملوثة م. سينكسيا لكنها تفتقر إلى تاريخ شحنة مشترك موثق مع م. سينكسيا - الأرنب الأيبيرية Lepus granatensisأرنب الجبل L. تيميدوس والزقدي Ciona intestinalis ج - تم شحنها في نفس اليوم ، 26 مايو 2010. لذلك يبدو أنه من الممكن ، ناهيك عن احتمال إرسال عينات GA08B إلى GA08F للتسلسل في 26 مايو 2010 ، وحدث هذا التلوث في مركز التسلسل في هذا حالة أيضا.

إلى جانب هذه الحالات الأربع ، كان هناك حدث واحد تم اكتشافه من التلوث بين الأنواع التي لم يتم شحنها في نفس التاريخ يتعلق بجورجونيان إيونيكيلا كافوليني وبلح البحر الأزرق الأوروبي م. galloprovincialis. E. كافوليني، ومع ذلك ، يشارك تاريخ الشحن (23 يناير 2013) مع M. edulis، الأنواع الأخرى من بلح البحر الأوروبي ، والتي تهجين مع م. galloprovincialis - النوعان لهما أنماط فردانية متشابهة جدًا في مرجعنا cox1 قاعدة البيانات. كشف فحص دقيق للبيانات أن واحد E. كافوليني العينة ، GA31L ، المتضررة من التلوث من م. galloprovincialis هو واحد E. كافوليني العينة التي تم شحنها في 23 يناير 2013. ثمانية cox1 يقرأ من هذه العينة المعينة إلى M. edulis مرجع واثنان تعيينهما إلى ملف م. galloprovincialis المرجعي. في الختام ، يمكن تحديد ثلاثة أحداث فقط للتلوث بين الأنواع من أصل 782 بشكل لا لبس فيه لمختبرنا: تلوث سلحفاة الأحواض الأوروبية Emys Orbicularis بواسطة الزقدي Ciona intestinalis أ وفرس البحر قرن آمون قرن آمون و H. guttulatus من قبل بعضهم البعض.

التلوث داخل الأنواع

تشير التحليلات المذكورة أعلاه إلى وجود تلوث كبير في هذا المشروع ، ويتضمن في المقام الأول عينات تم شحنها معًا. هذا أمر مقلق لأن العينات المأخوذة من أفراد متميزين من نفس النوع ، والتي يكون التلوث فيها أكثر إشكالية ويصعب اكتشافها ، كانت تُرسل عادةً معًا. لتحديد مقدار التلوث داخل الأنواع ، قمنا بفحص الانتشار باعتباره الحالة الثانوية ("الأخطاء") في الأنماط الجينية متماثلة اللواقح للأليلات المنفصلة في العينة. ركزنا أولاً على الرباعيات المتجانسة (أي المواضع التي كان فيها عدد القراءة للحالة الرئيسية & gt40 وكان عدد القراءة للحالة الثانوية يساوي 1) التي حدثت في مواضع أحادية الموازية ، قررنا ص، مصفوفة الخطأ في حالة عدم وجود تلوث. تم إجراء ذلك بشكل منفصل لكل نوع من 39 نوعًا من العينة التي تم فيها ترتيب أربعة أفراد على الأقل. لاحظ أنه في هذه الدراسة لم نستخدم معلومات الجدائل ، لذلك لم نتمكن من التمييز بين أخطاء X → Y و X * → Y * ، حيث X * هو مكمل للقاعدة X.

كشفت مصفوفات الأخطاء سمتين رئيسيتين. أولاً ، كانت أخطاء A → C أو T → G أكثر تكرارًا من الأخطاء الثلاثة الأخرى من نوع التحويل ، وهي A → T أو T → A أو C → G أو G → C و C → A أو G → T. تباينت نسبة A → C أو T → G إلى أخطاء أخرى من نوع التحويل بين 0.29 و 0.79 بين الأنواع (تصحيح لتكوين القاعدة) ، عندما يكون من المتوقع نسبة 0.67 تحت خطأ عشوائي. وهذا يتوافق مع تحيزات الخطأ الموثقة لتكنولوجيا Illumina [42 ، 43]. ثانيًا ، أخطاء من النوع الانتقالي ، C → T أو G → A و T → C أو A → G ، كانت عادةً أكثر من المتوقع. تباينت نسبة الأخطاء من نوع الانتقال إلى نوع التحويل من 0.47 إلى 1.14 بين الأنواع (التصحيح للتكوين الأساسي ، الوسيط = 0.79) ، عندما تكون النسبة المتوقعة 0.5 تحت الخطأ العشوائي ، و lt0.5 وفقًا لـ [43]. مع العلم أن بوليميرات الحمض النووي عادةً ما تولد نوعًا انتقاليًا أكثر من أخطاء نوع التحويل ، تشير هذه النتيجة إلى أن جزءًا صغيرًا من أخطاء التسلسل التي تؤثر على بياناتنا قد تم إدخالها قبل التسلسل ، ويفترض في خطوة PCR أثناء إنشاء المكتبة.

ثم درسنا رباعيًا متجانسًا يحدث في مواضع biallelic ، حيث يفصل الأليلين بتردد كبير. هنا ، نظرنا فقط في 33 نوعًا تم العثور فيها على ما لا يقل عن 50 رباعيًا من هذا القبيل. سألنا عما إذا كانت الحالة الصغرى في مثل هذه المجموعات الرباعية المتجانسة تميل إلى التوافق مع أليل الفصل الآخر في كثير من الأحيان أكثر مما كان متوقعًا بناءً على ص. وجدنا أن الانتشار النسبي للأليل المنفصل الآخر كان أعلى من قيمته المتوقعة في جميع الأنواع الـ 33. تراوح مؤشر تسرب الأليل ، λ ، من 0.19 إلى 8.5, عندما يكون λ = 0 متوقعًا في حالة عدم وجود تلوث. لذلك يشير هذا التحليل إلى أن التلوث داخل الأنواع منتشر على نطاق واسع في مجموعة البيانات الخاصة بنا وربما يؤثر على جميع الأنواع المتسلسلة.

قمنا بالتحقيق في تأثير البيانات الوصفية المختبرية ، وخاصة تاريخ الشحن إلى مراكز التسلسل ، على انتشار التلوث داخل الأنواع. تحقيقًا لهذه الغاية ، ركزنا على 12 نوعًا من مجموعة البيانات الخاصة بنا والتي لم يتم فيها شحن جميع العينات في نفس اليوم - أي في أغلب الأحيان في تاريخين مختلفين ، وما يصل إلى أربعة تواريخ في الحلمة الزرقاء باروس كيروليوس. في هذه الأنواع ، قمنا بقياس λ '، مؤشر تسرب الأليل بين العينات المرسلة في تواريخ مختلفة. تم تحقيق ذلك فقط من خلال النظر في رباعيات متجانسة تحدث في المواضع التي كانت ثنائية البيلي عبر عينة كاملة من الأفراد ، ولكن أحادية الموازي في العينة الفرعية للأفراد التي تم شحنها في نفس اليوم مع الشخص البؤري (ملف إضافي 7: الشكل S3). لا يمكن إجراء هذا التحليل الأنواع حسب الأنواع بسبب العدد الصغير من رباعيات homo ذات الصلة لكل نوع. لذلك قمنا بتجميع رباعيات homo عبر الأنواع الاثني عشر ، وما زلنا نحسب مصفوفات الخطأ الخاصة بالأنواع ص، وحصل على مؤشر تسرب الأليل بين العينات المرسلة في تواريخ مختلفة λ '= 0.59. كان هذا الرقم ضعفيًا مقارنة بالمؤشر المحسوب أعلاه ، أي بغض النظر عن تاريخ الشحن ، والذي كان بالنسبة لهذه الأنواع المجمعة الاثني عشر λ = 1.21 ، مما يدل على تأثير نفس الشحن على انتشار التلوث داخل الأنواع.

استدعاء SNP مدركًا للتلوث

لتقييم قوة نتائجنا المنشورة لمشكلة التلوث داخل الأنواع ، قمنا بإعادة تسمية SNPs والأنماط الجينية باستخدام طريقة معدلة لحساب تسرب الأليل بين الأفراد. بالمقارنة مع طريقة استدعاء SNP الأصلية ، تمت إضافة معلمة γ ، والتي تمثل احتمال أن تنشأ القراءة من فرد آخر من العينة. تم استخدام ثلاث قيم عشوائية لـ: 0.05 و 0.1 و 0.2. تم تطبيق استدعاء SNP المدرك للتلوث على 39 نوعًا من عينتنا والتي كان يتوفر فيها أربعة أفراد على الأقل. تم حساب الإحصائيات الجينومية للسكان الكلاسيكية من مجموعة البيانات هذه باستخدام نفس خط الأنابيب كما في [18]. لتوفير الوقت الحسابي ، تم تطبيق استدعاء SNP على مجموعات بيانات مخفضة تتكون من مليون موقع بالضبط لكل نوع ، بدلاً من 1.8–27 مليون موضع في مجموعات البيانات الكاملة.

وجدنا أن عدد يسمى SNPs وتقدير πس، انخفض التنوع الجيني في مواقع مترادفة مع زيادة (الشكل 4 أ). كان هذا متوقعًا: يؤدي التلوث بشكل زائف إلى زيادة تغاير الزيجوت عن طريق تحريك الأليلات حولها. كان التحيز النسبي كبيرًا - متوسط ​​نسبة المصححة إلى غير المصححةس كان 0.90 عندما كان γ 0.1 ، و 0.81 عندما كان 0.2. ومع ذلك ، كان التحيز النسبي ثابتًا إلى حد ما عبر الأنواع ، وأصغر بكثير من الاختلافات بين الأنواع في πس، مما يشير إلى أن تحليلاتنا المقارنة المنشورة لـس عبر الأنواع [17 ، 19 ، 21 ، 22] قوية للتلوث داخل الأنواع. لقد تحققنا من أن العلاقة التي أبلغ عنها Romiguier et al. [21] بينس وظلت سمات تاريخ حياة الأنواع صالحة بعد السيطرة على التلوث.وجدنا أن معامل الارتباط بين تحويل السجل πس وطول العمر الذي تم تحويله إلى سجل متشابه جدًا في جميع التحليلات الأربعة ، أي بين 0.517 و 0.524 ، يتم الحصول على أكثر المعامل سلبية عندما γ = 0.1. وبالمثل ، فإن العلاقة بين π المحولة اللوغاريتميس وكان حجم الانتشار المحول اللوغاريتمي [21] قويًا جدًا للتغيرات في γ (معامل الارتباط بين 0.772 و 0.758 ، القيمة الدنيا عندما = 0).

متانة تقديرات الجينوم السكاني لاستدعاء تعدد أشكال النوكليوتيدات المفرد الواعي للتلوث (SNP). أ التنوع المرادف πس ب نسبة التنوع غير المرادف إلى المرادف ، πن/ πس ج Fهو - هي د Tajima's D ، SNPs المترادفة فقط. كل نقطة يمثل نوعا. x-المحور: التقديرات التي تم الحصول عليها بافتراض عدم وجود تلوث. ذ-المحور: التقديرات التي تم الحصول عليها من استدعاء SNP الواعي بالتلوث. نقاط سوداء: γ = 0.05 النقاط الزرقاء: γ = 0.1 نقط حمراء: γ = 0.2 تنوع مرادف πS فوق على اليمين: πن/ πس نسبة أسفل اليسار: Fهو - هي أسفل اليمين: Tajima's D ، مرادف SNP فقط

نسبة التنوع غير المرادف إلى المرادف ، πن/ πس، تم تعديله بشكل طفيف فقط عندما قمنا بالتحكم في التلوث (الشكل 4 ب) ، كان التحيز النسبي المتوسط ​​قريبًا من 0.96 لجميع القيم الإيجابية الثلاثة لـ. المرادف (الشكل 4 د) وغير المترادف Tajima's D ، وهو إحصاء يقيس رحيل توزيع تردد أليل ثانوي من التوحيد القياسي ، تأثر أيضًا بشكل معتدل. تشير هاتان النتيجتان إلى أن الاستنتاجات المنشورة تستند إلى πن/ πس ومن المفترض أن تكون أطياف تردد الموقع [18 ، 27] قوية بما يكفي للتلوث داخل الأنواع.

يقع طراز Fهو - هي الإحصائيات تقيس فائض الزيجوت الفردي مقارنة بتوقعات هاردي واينبرغ. ايجابية Fهو - هي متوقع في حالات زواج الأقارب و / أو البنية التحتية السكانية. يوضح الشكل 4 ج أن F الخاص بناهو - هي التقدير حساس بشكل خاص لقضايا التلوث. أدى التحكم في التلوث إلى زيادة كبيرة في Fهو - هي في جميع الأنواع التي تم تحليلها ، مما يعكس حقيقة أن التلوث داخل الأنواع يميل إلى زيادة تغاير الزيجوت الفردي. في تحليلنا غير المصحح (γ = 0) ، تقدير سلبي لمتوسط ​​الجينوم Fهو - هي تم الحصول عليها في تسعة أنواع [21]. هذه نتيجة غير متوقعة ، بالنظر إلى أن العمليات التي تؤدي إلى فائض الزيجوت المتغاير ، مثل موازنة الانتقاء ، من المفترض أن تقتصر على جزء صغير من الجينوم [44]. في تحليلاتنا الواعية للتلوث ، تظهر قيمة F سالبةهو - هي تم الحصول عليها في أربعة أنواع فقط ، واثنين ، وواحد عندما تم ضبط على 0.05 و 0.1 و 0.2 على التوالي ، مما يشير إلى أن التلوث داخل الأنواع قد يفسر ، جزئيًا على الأقل ، تقريرنا غير المتوقع سابقًا للتقديرات السلبية لـ Fهو - هي [21]. حصاد النمل مسور بربروس لم يتم تضمينه في هذا التحليل لأن متوسط ​​الجينوم F.هو - هي سلبي للغاية في هذا النوع نتيجة لنظام التزاوج الخاص به ، مثل أن الأفراد العاملين متغاير الزيجوت بشكل كبير [45].

لم نعلق على Fهو - هي التقديرات في تحليلاتنا المنشورة ، باستثناء [19] ، حيث نقص البنية التحتية السكانية التي يمكن اكتشافها (أي ، انخفاض Fهو - هي) في سلحفاة غالاباغوس العملاقة Chelonoidis nigra قدمت أدلة ضد تعريف ما يصل إلى 12 نوعا في هذا التصنيف [46]. تم تأكيد هذه النتيجة هنا: جيم نيجرا هو أحد النوعين اللذين لا يزالان يظهران F سلبيًا قليلاًهو - هي تقدير بعد التصحيح للتلوث. ومع ذلك ، فقد نشرنا تحليلين لتقييم انتشار التهجين وتدفق الجينات بين الأنواع أو المجموعات المتباينة [20 ، 28 ، 30]. يجب تأكيد هذه النتائج عن طريق إعادة إنتاج التحليلات باستخدام البيانات المصححة للتلوث.

قارنا لكل نوع احتمالية القيم الأربعة المدروسة لـ. كان الحد الأقصى المحتمل γ ، والذي أطلقنا عليه γ * ، 0 في عشرة أنواع ، و 0.05 في 15 نوعًا ، و 0.1 في خمسة أنواع ، و 0.2 في تسعة أنواع. اكتشفنا تأثيرًا قويًا لتنوع الأنواع على γ *: الوسيط πس كان 0.034 بين الأنواع التي كانت γ * 0 ، ولكن 0.003 بين الأنواع التي كان γ * 0.2. كان هذا غير متوقع وربما يعكس وجود عوامل تربك اكتشاف التلوث (انظر القسم 3 من المناقشة "تلوث النمذجة").

أخيرًا ، أعدنا إنتاج تحليلات Romiguier et al. (2014) [21] ، وهو ما يمثل عيّنات GA36K و GA08F المشكوك فيها. كانت العلاقات المنشورة بين التنوع الجيني وسمات تاريخ حياة الأنواع قوية إلى حد استبعاد م. trossulus و م. سينكسيا: معامل الارتباط بين πس وحجم الانتشار لم يتغير تقريبًا مقارنة بالتحليل غير المصحح (0.766 مقابل 0.771) ، في حين أن معامل الارتباط بين πس وطول العمر زاد بشكل طفيف (0.594 مقابل 0.569) ، كما كان الحال بالنسبة للارتباطات بين πن/ πس الصفات وتاريخ الحياة. أعدنا حساب إحصاءات الجينوميات السكانية في م. سينكسيا بعد استبعاد GA08F الفردية ، أي استنادًا إلى تسعة أفراد فقط بدلاً من عشرة. أدى استبعاد GA08F إلى انخفاض كبير في متوسط ​​الجينوم πس (0.025 مقابل 0.034) ، πن (0.0027 مقابل 0.0032) ، و Fهو - هي (0.38 مقابل 0.52). ومع ذلك ، فإن معاملات الارتباط مع سمات تاريخ الحياة لم تتأثر بهذا التصحيح.


معلومات الكاتب

الانتماءات

معهد ميركين للتقنيات التحويلية في الرعاية الصحية ، معهد برود في هارفارد ومعهد ماساتشوستس للتكنولوجيا ، كامبريدج ، ماساتشوستس ، الولايات المتحدة الأمريكية

أندرو في أنزالون ، بيتون ب. راندولف ، جيسي آر ديفيس ، ألكسندر إيه سوزا ، لوك دبليو كوبلان ، جوناثان إم ليفي ، بيتر جي تشين ، كريستوفر ويلسون ، جريجوري أ.نيوبي ، أديتيا راغورام ، ديفيد آر ليو

قسم الكيمياء والبيولوجيا الكيميائية ، جامعة هارفارد ، كامبريدج ، ماساتشوستس ، الولايات المتحدة الأمريكية

أندرو في أنزالون ، بيتون ب. راندولف ، جيسي آر ديفيس ، ألكسندر إيه سوزا ، لوك دبليو كوبلان ، جوناثان إم ليفي ، بيتر جي تشين ، كريستوفر ويلسون ، جريجوري أ.نيوبي ، أديتيا راغورام ، ديفيد آر ليو

معهد هوارد هيوز الطبي ، جامعة هارفارد ، كامبريدج ، ماساتشوستس ، الولايات المتحدة الأمريكية

أندرو في أنزالون ، بيتون ب. راندولف ، جيسي آر ديفيس ، ألكسندر أ.سوسا ، لوك دبليو كوبلان ، جوناثان إم ليفي ، بيتر جي تشين ، كريستوفر ويلسون ، جريجوري أ.نيوبي ، أديتيا راغورام وأمبير ديفيد آر ليو

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

مساهمات

A.V.A. صمم البحث وأجرى التجارب وحلل البيانات وكتب المخطوطة. P.B.R. ، J.R.D. ، A.A.S. ، و G.A.N. إجراء تجارب على الخلايا البشرية وتحليل البيانات. L.W.K. و J.M.L. إجراء تجارب الخلايا العصبية. ص. و CW قاما بتحليل تجارب RNA-seq. أ. تحليل بيانات ClinVar. L صمم البحث وأشرف عليه وكتب المخطوطة.

المؤلف المراسل


G> T التحويل مقابل. T> G التحويل؟ - مادة الاحياء

نواصل دراستنا لخصائص الشفرات الدائرية ثلاثي النوكليوتيدات [1 & # x2013 5] ، والأكواد الخالية من الفواصل ثلاثي النوكليوتيدات [1 ، 6] ، والرموز الدائرية القوية ثلاثي النوكليوتيدات [7] ، والرمز الدائري المشترك ثلاثي النوكليوتيدات X 0 المحدد في الجينات [8] ] (انظر أيضًا التحليل الإحصائي الأخير بواسطة [9]) والذي يمكن أن يكون رمز ترجمة [10]. ثلاثي النوكليوتيد هو كلمة من ثلاثة أحرف (triletter) على الأبجدية الجينية . المجموعة المكونة من 64 ثلاثي نيوكليوتيدات عبارة عن رمز (يسمى الشفرة الوراثية) ، وبشكل أكثر دقة رمز موحد ولكن ليس رمزًا دائريًا (انظر الملاحظة 2). في الخمسين عامًا الماضية ، كانت الرموز والرموز الخالية من الفواصل والرموز الدائرية كائنات رياضية تمت دراستها في علم الأحياء النظري ، وذلك أساسًا لفهم بنية وأصل الكود الجيني بالإضافة إلى إطار القراءة (بناء) الجينات ، من أجل مثال ، [11 & # x2013 13]. من أجل الحصول على معنى بديهي لهذه المفاهيم ، تتم كتابة الرموز على خط مستقيم بينما تتم كتابة الرموز الخالية من الفواصل والرموز الدائرية على دائرة ، ولكن في كلتا الحالتين ، يلزم وجود إمكانية فك تشفير فريدة. تنتمي الرموز الدائرية فقط إلى بعض المجموعات الفرعية من مجموعة ثلاثي النوكليوتيد البالغ عددها 64 بينما الرموز الخالية من الفاصلة هي مجموعات فرعية أكثر تقييدًا من الرموز الدائرية [1].

قبل اكتشاف الشفرة الجينية ، كريك وآخرون. [11] اقترح حدًا أقصى للكود الخالي من الفواصل من 20 ثلاثي نيوكليوتيد لترميز الأحماض الأمينية العشرين. تبين أن هذا الرمز الخالي من الفاصلة غير صالح (انظر ، على سبيل المثال ، [14]). في عام 1996 ، تم تحديد رمز دائري أقصى X 0 من 20 ثلاثي نيوكليوتيد إحصائيًا على مجموعة جينية كبيرة من حقيقيات النوى وأيضًا على مجموعة جينية كبيرة من بدائيات النوى [8] (1) X 0 = . يحتوي هذا الرمز X 0 على خصائص رياضية رائعة حيث إنه رمز دائري C 3 مكمل ذاتيًا (انظر ما يلي). منذ عام 1996 ، تمت دراسة خصائصه بالتفصيل من قبل مؤلفين مختلفين ، على سبيل المثال ، [9، 15 & # x2013 21]. يعتبر التحول والاستعراض الأول والثاني من عمليات التطور الجزيئي الكلاسيكية ، على سبيل المثال ، [22]. باستخدام خوارزمية تعتمد على القلادة ، نقوم هنا بإجراء تحليل كمبيوتر شامل لعمليات التطور الثلاث هذه في الكود X 0. يتم تحديد بعض النتائج الجديدة بالرمز X 0 عن طريق تحليل الكمبيوتر على وجه الخصوص (1) التحويل الأول في الموضع الثاني لأي مجموعة فرعية من ثلاثي النوكليوتيدات لـ X 0 يولد أكواد دائرية ثلاثية النوكليوتيدات والتي تكون دائمًا C 3 و (2) التحويل الثاني على الثلاثة مواضع أي مجموعة فرعية من ثلاثي النوكليوتيدات لـ X 0 لا ينتج عنها رموز دائرية ثلاثية النوكليوتيدات.

يمكن العثور على المفاهيم الكلاسيكية لنظرية اللغة ورموزها في [23 ، 24]. دع & # x1D49C 4 = تدل على الأبجدية الجينية ، مرتبة حسب المعجم من قبل A & # x3c C & # x3c G & # x3c T. يتم الإشارة إلى مجموعة الكلمات (كلمات غير فارغة ، على التوالي) في & # x1D49C 4 بواسطة & # x1D49C 4 & # x2a (& # x1D49C 4 + ، على التوالي). مجموعة الكلمات المكونة من 16 كلمة بطول 2 (ثنائي النوكليوتيدات أو مخففات) في & # x1D49C 4 يُرمز إليها بـ & # x1D49C 4 2 = . مجموعة الكلمات المكونة من 64 كلمة من الطول 3 (ثلاثي النوكليوتيدات أو الحروف الثلاثية) في & # x1D49C 4 يُرمز إليها بـ & # x1D49C 4 3 = .

المجموعة الفرعية X & # x2282 & # x1D49C 4 + هي رمز على & # x1D49C 4 إذا كان لكل x 1 ، & # x2026 ، xn ، x 1 & # x2032 ، & # x2026 ، xm & # x2032 & # x2208 X ، & # x2009 n ، m & # x2265 1 ، الشرط x 1 & # x22ef xn = x 1 & # x2032 & # x22ef xm & # x2032 يعني n = m و xi = xi & # x2032 لـ i = 1 ، & # x2026 ، ن.

أي مجموعة فرعية غير فارغة من & # x1D49C 4 3 هي رمز يسمى هنا رمز ثلاثي النوكليوتيد.

يكون رمز ثلاثي النوكليوتيدات X & # x2282 & # x1D49C 4 3 دائريًا إذا ، لكل x 1 ، & # x2026 ، xn ، x 1 & # x2032 ، & # x2026 ، xm & # x2032 & # x2208 X ، & # x2009 n ، m & # x2265 1، & # x2009 & # x2009 p & # x2208 & # x1D49C 4 & # x2a، & # x2009 s & # x2208 & # x1D49C 4 + ، الشروط sx 2 & # x22ef xnp = x 1 & # تشير x2032 & # x22ef xm & # x2032 و x 1 = ps إلى n = m و p = & # x3b5 (كلمة فارغة) و xi = xi & # x2032 لـ i = 1، & # x2026، n.

يشار إلى رمز دائري ثلاثي النوكليوتيد C.

& # x1D49C 4 3 ليس رمزًا دائريًا ثلاثي النوكليوتيدات.

لنفترض أن l 1، l 2، & # x2026، ln - 1، ln تكون أحرفًا في & # x1D49C 4، d 1، d 2، & # x2026، dn - 1، dn diletters in & # x1D49C 4 2، and n an عدد صحيح مرضي n & # x2265 2.

نقول أن التسلسل المرتب l 1، d 1، l 2، d 2، & # x2026، dn - 1، ln، dn، ln + 1 هو (n + 1) LDCN (Letter Diletter Continued Necklace) لمجموعة فرعية X & # x2282 & # x1D49C 4 3 if (2) l 1 d 1، l 2 d 2، & # x2026، lndn & # x2208 X، d 1 l 2، d 2 l 3، & # x2026، dn - 1 ln، dnln + 1 & # x2208 X.

فقط عدد قليل من أكواد ثلاثي النوكليوتيدات تكون دائرية. اقتراحان يعتمدان على مفهوم القلادة يسمحان بتحديد ما إذا كان رمز ثلاثي النوكليوتيد دائريًا أم لا [2 ، 18].

X & # x2009 & # x2009 هو رمز دائري ثلاثي النوكليوتيدات

نقول أن التسلسل المرتب l 1، d 1، l 2، d 2، & # x2026، dn - 1، ln، dn، ln + 1 هو (n + 1) LDCCN (Letter Diletter Continued Closed Necklace) لـ a المجموعة الفرعية X & # x2282 & # x1D49C 4 3 if (3) l 1 d 1، l 2 d 2، & # x2026، lndn & # x2208 X، d 1 l 2، d 2 l 3، & # x2026، dn - 1 ln، dnl 1 & # x2208 X.

X & # x2009 & # x2009 هو رمز دائري ثلاثي النوكليوتيدات

الكود الدائري ثلاثي النوكليوتيدات X & # x2282 & # x1D49C 4 3 هو الحد الأقصى إذا ، لكل x & # x2208 & # x1D49C 4 3 ، x & # x2209 X ، X & # x222a ليس رمزًا دائريًا ثلاثي النوكليوتيدات.

يسمى الكود الدائري ثلاثي النوكليوتيدات الذي يحتوي بالضبط على عناصر k بالرمز الدائري k-trinucleotide.

الحد الأقصى للشفرة الدائرية المكونة من 20 ترينيوكليوتيد حيث لا يمكن أن يحتوي أي رمز دائري ثلاثي النوكليوتيد على أكثر من 20 كلمة.

لوحظ الحد الأقصى من الكود الدائري ثلاثي النوكليوتيدات MC.

الكود الدائري المكون من 20 ترينوكليوتيد هو الحد الأقصى والأقصى.

نذكر خريطتين وراثيتين كلاسيكيتين: التقليب التكميلي والدائري.

يتم تحديد الخريطة الجينية التكميلية & # x1D49E: & # x1D49C 4 + & # x2192 & # x1D49C 4 + بواسطة (4) & # x1D49E (A) = T، & # x2003 & # x2003 & # x1D49E (C) = G ، & # x1D49E (G) = C، & # x2003 & # x2003 & # x1D49E (T) = A وللجميع u ، v & # x2208 & # x1D49C 4 + بواسطة (5) & # x1D49E (uv) = & # x1D49E (v) & # x1D49E (u).

& # x1D49E (A C G) = C G T. ترتبط هذه الخريطة & # x1D49E بخاصية الحلزون المزدوج التكميلي والمضاد المتوازي (خيط DNA واحد موجه كيميائيًا في اتجاه 5 & # x2032-3 & # x2032 وحبل DNA الآخر في المقابل 3 & # x2032-5 & # اتجاه x2032).

تم تمديد الخريطة التكميلية & # x1D49E على ثلاثي النوكليوتيد x بشكل طبيعي إلى رمز ثلاثي النوكليوتيد X كما يلي: (6) & # x1D49E (X) = .

الخريطة الجينية للتبديل الدائري & # x1D4AB: & # x2009 & # x1D49C 4 3 & # x2192 & # x1D49C 4 3 تتناوب بشكل دائري ثلاثي النوكليوتيد l 1 l 2 l 3، l 1، l 2، l 3 & # x2208 & # x1D49C 4 ، على النحو التالي: (7) & # x1D4AB (l 1 l 2 l 3) = l 2 l 3 l 1.

تم تمديد خريطة التقليب الدائري & # x1D4AB على ثلاثي النوكليوتيد x بشكل طبيعي إلى رمز ثلاثي النوكليوتيد X كما يلي: (8) & # x1D4AB (X) = .

يُشار إلى التكرار k th لـ & # x1D4AB بواسطة & # x1D4AB k.

رموز ثلاثي النوكليوتيدات & # x1D4AB (X) و & # x1D4AB 2 (X) هي الفئات المترافقة لكود ثلاثي النوكليوتيدات X.

الكود الدائري ثلاثي النوكليوتيدات X مكمل ذاتيًا إذا ، لكل x & # x2208 X ، & # x1D49E (x) & # x2208 X.

لوحظ وجود رمز دائري ثلاثي النوكليوتيدات ذاتي التكميل SC.

لا يمكن أن يكون الكود الدائري k-trinucleotide لـ k odd مكملًا ذاتيًا.

الكود الدائري X ثلاثي النوكليوتيد هو C 3 إذا كان X ، & # x1D4AB (X) ، و & # x1D4AB 2 (X) عبارة عن أكواد دائرية ثلاثية النوكليوتيدات.

يُشار إلى الكود الدائري X C 3 ثلاثي النوكليوتيدات C 3.

الكود الدائري X ثلاثي النوكليوتيد هو الحد الأقصى للتكامل الذاتي C 3 إذا كان X هو الحد الأقصى ، X = & # x1D49E (X) (مكمل ذاتي) ، و & # x1D4AB (X) و & # x1D4AB 2 (X) عبارة عن شفرات دائرية ثلاثية النوكليوتيدات مرضي & # x1D49E (& # x1D4AB (X)) = & # x1D4AB 2 (X).

يشار إلى الشفرة الدائرية القصوى ذات التكملة الذاتية C 3 في MS C 3.

المجموعة X 0 من 20 ثلاثي النوكليوتيدات التي تم تحديدها في مجموعات الجينات لكل من حقيقيات النوى وبدائيات النوى هي رمز دائري بحد أقصى C 3 مكمل ذاتيًا MS C 3 [8] أي أن X 0 هي الحد الأقصى ، X 0 = & # x1D49E (X 0 ) ، & # x1D4AB (X 0) = X 1 ، و & # x1D4AB 2 (X 0) = X 2 عبارة عن أكواد دائرية ثلاثية النوكليوتيدات ، و & # x1D49E (X 1) = X 2.

نتذكر ثلاث خرائط جينية للتطور الكلاسيكي: الانتقال والاستعراضات الأول والثاني ، على سبيل المثال ، [22] ونوسع تعريفاتها إلى مواقع ثلاثي النوكليوتيد.

تم تحديد الخريطة الجينية للتطور الانتقالي & # x1D4AF: & # x1D49C 4 + & # x2192 & # x1D49C 4 + بواسطة (9) & # x1D4AF (A) = G ، & # x2003 & # x2003 & # x1D4AF (C) = T، & # x1D4AF (G) = A، & # x2003 & # x2003 & # x1D4AF (T) = C.

يمكن تطبيق خريطة الانتقال & # x1D4AF على الحرف l في مواضع مختلفة من ثلاثي النوكليوتيد x = l 1 l 2 l 3: & # x1D4AF i ، i & # x2208 <1،2 ، 3> ، هو الانتقال على الموضع i لـ x ، & # x1D4AF i ، j ، i ، j & # x2208 <1،2 ، 3> مع i & # x3c j ، هو الانتقال على الموضعين i و j لـ x ، و & # x1D4AF 1 ، 2 ، 3 هو الانتقال على المواضع الثلاثة لـ x.

& # x1D4AF 1 (ACG) = GCG، & # x1D4AF 2 (ACG) = ATG، & # x1D4AF 3 (ACG) = ACA، & # x1D4AF 1،2 (ACG) = GTG، & # x1D4AF 1،3 (ACG) ) = GCA، & # x1D4AF 2،3 (ACG) = ATA و & # x1D4AF 1،2، 3 (ACG) = GTA.

تمتد أيضًا خرائط الانتقال & # x1D4AF i ، & # x2009 & # x2009 & # x1D4AF i، j، & # x2009 & # x2009 & # x1D4AF 1،2، 3 على ثلاثي النوكليوتيدات x إلى رمز ثلاثي النوكليوتيد X ، في بطريقة مشابهة للخرائط الجينية & # x1D49E و & # x1D4AB.

يتم تحديد الخريطة الجينية للتحول I التطور & # x1D4B1 I: & # x1D49C 4 + & # x2192 & # x1D49C 4 + بواسطة (10) & # x1D4B1 I (A) = T ، & # x2003 & # x2003 & # x1D4B1 I (C) = G ، & # x1D4B1 I (G) = C ، & # x2003 & # x2003 & # x1D4B1 I (T) = A.

يمكن أيضًا تطبيق خريطة التحويل I & # x1D4B1 I على حرف l في مواضع مختلفة من ثلاثي النوكليوتيد x = l 1 l 2 l 3: & # x1D4B1 I i، i & # x2208 <1،2، 3> ، هو التحويل I على الموضع i من x ، & # x1D4B1 I i، j، i، j & # x2208 <1،2، 3> مع i & # x3c j ، هو التحويل الأول في الموضعين i و j x و & # x1D4B1 I 1،2 ، 3 هو التحويل الأول في المواضع الثلاثة لـ x.

& # x1D4B1 I 1 (ACG) = TCG، & # x1D4B1 I 2 (ACG) = AGG، & # x1D4B1 I 3 (ACG) = ACC، & # x1D4B1 I 1،2 (ACG) = TGG، & # x1D4B1 I 1،3 (ACG) = TCC، & # x1D4B1 I 2،3 (ACG) = AGC، & # x1D4B1 I 1،2، 3 (ACG) = TGC.

خرائط التحويل I & # x1D4B1 I i، & # x2009 & # x2009 & # x1D4B1 I i، j، & # x2009 & # x2009 & # x1D4B1 I 1،2، 3 على ثلاثي النوكليوتيدات x ممتدة أيضًا إلى كود ثلاثي النوكليوتيدات X ، بطريقة مشابهة للخرائط الجينية & # x1D49E و & # x1D4AB.

الخريطة الجينية للتطور Transversion II & # x1D4B1 II: & # x1D49C 4 + & # x2192 & # x1D49C 4 + محددة بواسطة (11) & # x1D4B1 II (A) = C ، & # x2003 & # x2003 & # x1D4B1 II (C) = A ، & # x1D4B1 II (G) = T ، & # x2003 & # x2003 & # x1D4B1 II (T) = G.

يمكن أيضًا تطبيق خريطة التحويل II & # x1D4B1 II على الحرف l في مواضع مختلفة من ثلاثي النوكليوتيد x = l 1 l 2 l 3: & # x1D4B1 II i، i & # x2208 <1،2، 3>، is التحويل الثاني على الموضع i من x ، & # x1D4B1 II i ، j ، i ، j & # x2208 <1،2 ، 3> مع i & # x3c j ، هو التحويل الثاني على الموضعين i و j من x و & # x1D4B1 II 1،2 ، 3 هي التحويل الثاني على المواضع الثلاثة لـ x.

& # x1D4B1 II 1 (ACG) = CCG، & # x1D4B1 II 2 (ACG) = AAG، & # x1D4B1 II 3 (ACG) = ACT، & # x1D4B1 II 1،2 (ACG) = CAG، & # x1D4B1 II 1،3 (ACG) = CCT، & # x1D4B1 II 2،3 (ACG) = AAT، & # x1D4B1 II 1،2، 3 (ACG) = CAT.

خرائط Transversion II & # x1D4B1 II i، & # x2009 & # x2009 & # x1D4B1 II i، j، & # x2009 & # x2009 & # x1D4B1 II 1،2، 3 على ثلاثي النوكليوتيدات x تمتد أيضًا إلى كود ثلاثي النوكليوتيدات X ، بطريقة مشابهة للخرائط الجينية & # x1D49E و & # x1D4AB.

يتم تحديد الخرائط الجينية للتطور في ثلاثي النوكليوتيدات من الشفرة الدائرية ثلاثية النوكليوتيدات بواسطة & # x1D4AF (l) للانتقال ، & # x1D4B1 I (l) للتحويل الأول ، و & # x1D4B1 II (l) للتحويل II.

الخريطة الجينية للتطور ، أي & # x1D4AF (l) ، & # x1D4B1 I (l) ، و & # x1D4B1 II (l) ، في ثلاثي النوكليوتيدات من الشفرة الدائرية الشائعة للنيوكليوتيدات X 0 تؤدي إلى S (l) = (20 لتر) أكواد ثلاثي النوكليوتيدات والتي يحتمل أن تكون دائرية. يعطي الجدول 1 هذه الأرقام S (l).

الرقم S (l) = (20 لترًا) من أكواد ثلاثي النوكليوتيدات بعد الخريطة الجينية للتطور (الانتقال & # x1D4AF (l) ، الانقلاب الأول & # x1D4B1 I (l) ، والانقلاب II & # x1D4B1 II (l)) في l ثلاثي النوكليوتيدات من الكود الدائري المشترك ثلاثي النوكليوتيدات X 0.

استنادًا إلى الاقتراح 6 الذي يسمح باختبار ما إذا كان كود ثلاثي النوكليوتيد دائريًا أم لا (الخوارزمية غير مفصلة ، انظر ، على سبيل المثال ، [2]) ، تسمح تحليلات الكمبيوتر لعدد كبير من أكواد ثلاثي النوكليوتيدات بتحديد الخصائص الجديدة هنا باستخدام الشفرة الدائرية الشائعة لثلاثي النوكليوتيدات X 0 لوحظ في الجينات قيد التطور عن طريق الانتقال والانعكاس.

3.1. خريطة الانتقال 3.1.1. خريطة الانتقال & # x1D4AF i النتيجة 1 (الجدول 2).

بالنسبة إلى l = 1 ، & # x2026 ، 20 (12) c (& # x1D4AF 1 (l)) = c (& # x1D4AF 3 (l)) ، mc (& # x1D4AF 1 (l)) = mc (& # x1D4AF 3 (l)) ، sc (& # x1D4AF 1 (l)) = sc (& # x1D4AF 3 (l)) ، c 3 (& # x1D4AF 1 (l)) = c 3 (& # x1D4AF 3 (l )) ، ms c 3 (& # x1D4AF 1 (l)) = ms c 3 (& # x1D4AF 3 (l)). كما هو متوقع ، تختلف قوائم الرموز الدائرية ثلاثي النوكليوتيدات C المرتبطة بـ c (& # x1D4AF 1 (l)) و c (& # x1D4AF 3 (l)) عن l = 1 ، & # x2026 ، 13 (غير معروض). لا يوجد كود ثلاثي النوكليوتيدات دائري بعد عدد معين من الانتقالات & # x1D4AF i في ثلاثي النوكليوتيدات للشفرة الدائرية الشائعة لثلاثي النوكليوتيدات X 0. على وجه التحديد ، من أجل l = 14 ، & # x2026 ، 20 (13) c (& # x1D4AF 1 (l)) = c (& # x1D4AF 3 (l)) = 0 وللحالة l = 10 ، & # x2026 ، 20 ( 14) ج (& # x1D4AF 2 (ل)) = 0. يولد الانتقال & # x1D4AF i عددًا أقصى من الرموز الدائرية ثلاثي النوكليوتيدات C لـ (15) max & # x2003 & # x2003 & # x2009 & # x2009 = c (& # x1D4AF 1 (7)) = c (& # x1D4AF 3 (7)) = 1436 والحد الأقصى لعدد C 3 self- الرموز الدائرية القصوى التكميلية MS C 3 لـ (16) & # x2009 & # x2009 max & # x2003 & # x2003 = ms c 3 (& # x1D4AF 1 (6)) = ms c 3 (& # x1D4AF 3 (6)) = 20.

خريطة الانتقال & # x1D4AF i (l) في ثلاثي النوكليوتيدات للرمز الدائري المشترك ثلاثي النوكليوتيدات X 0. رقم c (& # x1D4AF i (l)) من الرموز الدائرية C ، رقم mc (& # x1D4AF i (l)) من الرموز الدائرية القصوى MC ، رقم sc (& # x1D4AF i (l)) من الرموز الدائرية التكميلية الذاتية SC ، رقم c 3 (& # x1D4AF i (l)) من الرموز الدائرية C 3 ، ورقم ms c 3 (& # x1D4AF i (l)) من الرموز الدائرية القصوى المتممة ذاتيًا C 3 MS C 3.

من أجل l = 1، & # x2026، 20 (17) c (& # x1D4AF 1،2 (l)) = c (& # x1D4AF 2،3 (l))، mc (& # x1D4AF 1،2 (l) ) = mc (& # x1D4AF 2،3 (l))، sc (& # x1D4AF 1،2 (l)) = sc (& # x1D4AF 2،3 (l))، c 3 (& # x1D4AF 1،2 (l)) = c 3 (& # x1D4AF 2،3 (l)) ، ms c 3 (& # x1D4AF 1،2 (l)) = ms c 3 (& # x1D4AF 2،3 (l)). تختلف قوائم الرموز الدائرية ثلاثي النوكليوتيدات C المرتبطة بـ c (& # x1D4AF 1،2 (l)) و c (& # x1D4AF 2،3 (l)) عن l = 1 ، & # x2026 ، 14 (غير معروض) . لا يوجد كود ثلاثي النوكليوتيدات دائري بعد عدد معين من الانتقالات & # x1D4AF i، j في ثلاثي النوكليوتيدات للشفرة الدائرية الشائعة لثلاثي النوكليوتيدات X 0. على وجه التحديد ، لـ l = 15 ، & # x2026 ، 20 (18) c (& # x1D4AF 1،2 (l)) = c (& # x1D4AF 2،3 (l)) = 0 وللحالة l = 12 ، & # x2026 ، 20 (19) ج (& # x1D4AF 1،3 (ل)) = 0. يولد الانتقال & # x1D4AF i، j أقصى عدد من الرموز الدائرية ثلاثي النوكليوتيدات C لـ (20) max & # x2003 & # x2003 = c (& # x1D4AF 1،3 (6)) = 598 وحد أقصى من الرموز الدائرية القصوى التكميلية ذاتيًا C 3 MS C 3 لـ (21) كحد أقصى & # x2003 & # x2003 = ms c 3 (& # x1D4AF 1،3 (4)) = مللي ثانية ج 3 (& # x1D4AF 1،3 (6)) = 10. الأرقام c 3 (& # x1D4AF 1،2 (l)) = c 3 (& # x1D4AF 2،3 (l)) للرموز الدائرية C 3 لها وظيفة نمو معينة (22) c 3 (& # x1D4AF 1 ، 2 (14)) = c 3 (& # x1D4AF 2،3 (14)) = 1، c 3 (& # x1D4AF 1،2 (l)) = c 3 (& # x1D4AF 2،3 (l)) = 0 & # x2003 لـ & # x2009 & # x2009 l = 10، & # x2026، 13.

خريطة الانتقال & # x1D4AF i، j (l) في ثلاثي النوكليوتيدات من الكود الدائري المشترك ثلاثي النوكليوتيدات X 0. رقم c (& # x1D4AF i، j (l)) للرموز الدائرية C ، رقم mc (& # x1D4AF i، j (l)) من الرموز الدائرية القصوى MC ، رقم sc (& # x1D4AF i ، j (l)) من الرموز الدائرية التكميلية الذاتية SC ، رقم c 3 (& # x1D4AF i ، j (l)) من الرموز الدائرية C 3 ، ورقم ms c 3 (& # x1D4AF i ، j (l)) من C 3 مكمل ذاتيًا الرموز الدائرية القصوى MS C 3.

يولد الانتقال & # x1D4AF 1،2 ، 3 دائمًا أكواد دائرية ثلاثية النوكليوتيد. في الواقع ، بالنسبة إلى l = 1، & # x2026، 20 (23) c (& # x1D4AF 1،2، 3 (l)) & # x3e 0. تختلف قوائم الرموز الدائرية ثلاثي النوكليوتيدات C المرتبطة بـ c (& # x1D4AF 1،2، 3 (l)) و c (& # x1D4AF 1،2، 3 (20 - l)) عن l = 1، & # x2026 ، 9 (غير معروض). يولد الانتقال & # x1D4AF 1،2 ، 3 عددًا أقصى من الرموز الدائرية ثلاثي النوكليوتيد C لـ (24) كحد أقصى & # x2003 & # x2003 = c (& # x1D4AF 1،2، 3 (8)) = c (& # x1D4AF 1،2، 3 (12)) = 72 والحد الأقصى لعدد C 3 self- الرموز الدائرية القصوى التكميلية MS C 3 لـ (25) & # x2009 & # x2009 max & # x2003 & # x2003 = مللي ثانية c 3 (& # x1D4AF 1،2، 3 (4)) = مللي ثانية ج 3 (& # x1D4AF 1،2 ، 3 (16)) = 6.

خريطة الانتقال & # x1D4AF 1،2 ، 3 (l) في ثلاثي النوكليوتيدات للشفرة الدائرية الشائعة لثلاثي النوكليوتيدات X 0. رقم c (& # x1D4AF 1،2 ، 3 (l)) للرموز الدائرية C ، رقم mc (& # x1D4AF 1،2 ، 3 (l)) من الرموز الدائرية القصوى MC ، رقم sc (& # x1D4AF 1،2 ، 3 (ل)) من الرموز الدائرية التكميلية الذاتية SC ، رقم c 3 (& # x1D4AF 1،2 ، 3 (l)) من الرموز الدائرية C 3 ، ورقم ms c 3 (& # x1D4AF 1،2 ، 3 (ل)) من الرموز الدائرية القصوى التكميلية ذاتيًا C 3 MS C 3.

من أجل l = 1 ، & # x2026 ، 20 (26) c (& # x1D4B1 I 1 (l)) = c (& # x1D4B1 I 3 (l)) ، mc (& # x1D4B1 I 1 (l)) = mc (& # x1D4B1 I 3 (l)) ، sc (& # x1D4B1 I 1 (l)) = sc (& # x1D4B1 I 3 (l)) ، c 3 (& # x1D4B1 I 1 (l)) = c 3 (& # x1D4B1 I 3 (l)) ، ms c 3 (& # x1D4B1 I 1 (l)) = ms c 3 (& # x1D4B1 I 3 (l)). تختلف قوائم الرموز الدائرية ثلاثي النوكليوتيدات C المرتبطة بـ c (& # x1D4B1 I 1 (l)) و c (& # x1D4B1 I 3 (l)) عن l = 1 ، & # x2026 ، 9 (غير معروض). لا يوجد كود ثلاثي النوكليوتيدات دائري بعد عدد معين من التحولات I & # x1D4B1 I i في ثلاثي النوكليوتيدات للشفرة الدائرية الشائعة لثلاثي النوكليوتيدات X 0. على وجه التحديد ، من أجل l = 10 ، & # x2026 ، 20 (27) c (& # x1D4B1 I 1 (l)) = c (& # x1D4B1 I 3 (l)) = 0 ول = 18،19،20 ( 28) ج (& # x1D4B1 I 2 (ل)) = 0. يولد التحويل I & # x1D4B1 I i أقصى عدد من الرموز الدائرية ثلاثي النوكليوتيدات C لـ (29) max & # x2003 & # x2003 = c (& # x1D4B1 I 2 (9)) = 24310 وعدد أقصى من الرموز الدائرية C 3 ذاتية التكميل بحد أقصى MS C 3 لـ (30) كحد أقصى & # x2003 & # x2003 = ms c 3 ( & # x1D4B1 I 2 (8)) = 70. خاصية رمز ملحوظة وجدت فقط مع التحويل I & # x1D4B1 I 2 هي ، لـ l = 1 ، & # x2026 ، 20 ، (31) c (& # x1D4B1 I 2 (l)) = c 3 (& # x1D4B1 I 2 (ل)) ، علاوة على ذلك ، بعد تحليل مفصل للكمبيوتر ، قوائم الرموز الدائرية ثلاثي النوكليوتيد C و C 3 المرتبطة بـ c (& # x1D4B1 I 2 (l)) و c 3 (& # x1D4B1 I 2 (l)) ، على التوالي ، متطابقة لـ l = 1 ، & # x2026 ، 17.

رسم خريطة التحويل & # x1D4B1 I i (l) في ثلاثي النوكليوتيدات للشفرة الدائرية ثلاثية النوكليوتيدات الشائعة X 0. رقم c (& # x1D4B1 I i (l)) للرموز الدائرية C ، رقم mc (& # x1D4B1 I i (l)) من الرموز الدائرية القصوى MC ، رقم sc (& # x1D4B1 I i (l)) من self- الرموز الدائرية التكميلية SC ، الرقم c 3 (& # x1D4B1 I i (l)) من الرموز الدائرية C 3 ، والرقم ms c 3 (& # x1D4B1 I i (l)) من الرموز الدائرية القصوى المتممة ذاتيًا C 3 MS C 3.

من أجل l = 1 ، & # x2026 ، 20 (32) c (& # x1D4B1 I 1،2 (l)) = c (& # x1D4B1 I 2،3 (l)) ، mc (& # x1D4B1 I 1،2 (ل)) = mc (& # x1D4B1 I 2،3 (l)) ، sc (& # x1D4B1 I 1،2 (l)) = sc (& # x1D4B1 I 2،3 (l)) ، c 3 ( & # x1D4B1 I 1،2 (l)) = c 3 (& # x1D4B1 I 2،3 (l))، ms c 3 (& # x1D4B1 I 1،2 (l)) = ms c 3 (& # x1D4B1 أنا 2،3 (ل)). تختلف قوائم الرموز الدائرية ثلاثي النوكليوتيدات C المرتبطة بـ c (& # x1D4B1 I 1،2 (l)) و c (& # x1D4B1 I 2،3 (l)) عن l = 1 ، & # x2026 ، 12 (لا معروض). لا يوجد كود ثلاثي النوكليوتيدات دائري بعد عدد معين من التحولات I & # x1D4B1 I i ، j في ثلاثي النوكليوتيدات للشفرة الدائرية ثلاثية النوكليوتيدات الشائعة X 0. على وجه التحديد ، من أجل l = 13 ، & # x2026 ، 20 (33) c (& # x1D4B1 I 1،2 (l)) = c (& # x1D4B1 I 2،3 (l)) = 0 ولـ l = 19 ، 20 (34) ج (& # x1D4B1 I 1،3 (ل)) = 0. يولد التحويل I & # x1D4B1 I i، j أقصى عدد من الرموز الدائرية ثلاثي النوكليوتيدات C لـ (35) max & # x2003 & # x2003 = c (& # x1D4B1 I 1،2 (6)) = c (& # x1D4B1 I 2،3 (6)) = 630 وأقصى عدد من الرموز الدائرية القصوى المتممة ذاتيًا C 3 MS C 3 لـ (36) كحد أقصى & # x2003 & # x2003 = ms c 3 (& # x1D4B1 I 1، 2 (4)) = مللي ثانية ج 3 (& # x1D4B1 I 2،3 (4)) = 6. الأرقام sc (& # x1D4B1 I 1،3 (l)) للرموز الدائرية التكميلية الذاتية SC لها وظيفة نمو معينة (37) sc (& # x1D4B1 I 1،3 (l)) = 1 & # x2003 لـ & # x2009 & # x2009 l = 12،14،16،18 ، sc (& # x1D4B1 I 1،3 (l)) = 0 & # x2003 لـ & # x2009 & # x2009 l = 8،10. الأرقام c 3 (& # x1D4B1 I 1،3 (l)) للرموز الدائرية C 3 لها وظيفة نمو معينة (38) c 3 (& # x1D4B1 I 1،3 (l)) = 1 & # x2003 لـ & # x2009 & # x2009 l = 16،18، c 3 (& # x1D4B1 I 1،3 (17)) = 2، c 3 (& # x1D4B1 I 1،3 (l)) = 0 & # x2003 لـ & # x2009 & # x2009 l = 7 ، & # x2026 ، 15.

ترسم خريطة التحويل & # x1D4B1 I i، j (l) في ثلاثي النوكليوتيدات للرمز الدائري ثلاثي النوكليوتيدات المشترك X 0. رقم c (& # x1D4B1 I i، j (l)) للرموز الدائرية C ، رقم mc (& # x1D4B1 I i، j (l)) من الرموز الدائرية القصوى MC ، رقم sc (& # x1D4B1 I i ، j ( ل)) من الرموز الدائرية التكميلية الذاتية SC ، رقم c 3 (& # x1D4B1 I i، j (l)) من الرموز الدائرية C 3 ، ورقم ms c 3 (& # x1D4B1 I i، j (l)) من C 3 أكواد دائرية قصوى ذاتية التكميل MS C 3.

يولد التحويل I & # x1D4B1 I 1،2 ، 3 دائمًا أكواد دائرية ثلاثية النوكليوتيدات. في الواقع ، بالنسبة إلى l = 1 ، & # x2026 ، 20 (39) c (& # x1D4B1 I 1،2 ، 3 (l)) & # x3e 0. تختلف قوائم الرموز الدائرية ثلاثي النوكليوتيدات C المرتبطة بـ c (& # x1D4B1 I 1،2، 3 (l)) و c (& # x1D4B1 I 1،2، 3 (20 - l)) عن l = 1 ، & # x2026 ، 9 (غير معروض). يولد التحويل I & # x1D4B1 I 1،2 ، 3 أقصى عدد من الرموز الدائرية ثلاثي النوكليوتيدات C لـ (40) max = c (& # x1D4B1 I 1،2، 3 (10)) = 66 وعدد أقصى من الرموز الدائرية التكميلية ذاتيًا C 3 MS C 3 لـ (41) كحد أقصى & # x2003 & # x2003 = ms c 3 (& # x1D4B1 I 1،2، 3 (4) ) = مللي ثانية ج 3 (& # x1D4B1 I 1 ، 2 ، 3 (16)) = 9.

مخطط التحويل الأول & # x1D4B1 I 1،2 ، 3 (لتر) في ثلاثي النوكليوتيدات من الكود الدائري المشترك ثلاثي النوكليوتيدات X 0. رقم c (& # x1D4B1 I 1،2 ، 3 (l)) من الرموز الدائرية C ، رقم mc (& # x1D4B1 I 1،2 ، 3 (l)) من الرموز الدائرية القصوى MC ، رقم sc (& # x1D4B1 I 1 ، 2 ، 3 (ل)) من الرموز الدائرية التكميلية الذاتية SC ، رقم c 3 (& # x1D4B1 I 1،2 ، 3 (l)) من الرموز الدائرية C 3 ، ورقم ms c 3 (& # x1D4B1 I 1 ، 2 ، 3 (ل)) من أكواد دائرية قصوى مكملة ذاتية لـ C 3 MS C 3.

من أجل l = 1 ، & # x2026 ، 20 (42) c (& # x1D4B1 II 1 (l)) = c (& # x1D4B1 II 3 (l)) ، mc (& # x1D4B1 II 1 (l)) = mc (& # x1D4B1 II 3 (l)) ، sc (& # x1D4B1 II 1 (l)) = sc (& # x1D4B1 II 3 (l)) ، c 3 (& # x1D4B1 II 1 (l)) = c 3 (& # x1D4B1 II 3 (l)) ، ms c 3 (& # x1D4B1 II 1 (l)) = ms c 3 (& # x1D4B1 II 3 (l)). تختلف قوائم الرموز الدائرية ثلاثي النوكليوتيدات C المرتبطة بـ c (& # x1D4B1 II 1 (l)) و c (& # x1D4B1 II 3 (l)) عن l = 1 ، & # x2026 ، 8 (غير معروض). لا يوجد كود ثلاثي النوكليوتيدات دائري بعد عدد معين من التحولات II & # x1D4B1 II i في ثلاثي النوكليوتيدات للشفرة الدائرية الشائعة لثلاثي النوكليوتيدات X 0. على وجه التحديد ، من أجل l = 9 ، & # x2026 ، 20 (43) c (& # x1D4B1 II 1 (l)) = c (& # x1D4B1 II 3 (l)) = 0 و l = 12 ، & # x2026 ، 20 (44) ج (& # x1D4B1 II 2 (ل)) = 0. يولد Transversion II & # x1D4B1 II i عددًا أقصى من الرموز الدائرية ثلاثي النوكليوتيدات C لـ (45) max & # x2003 & # x2003 = c (& # x1D4B1 II 2 (5)) = 176 وعدد أقصى من الرموز الدائرية C 3 ذاتية التكميل القصوى MS C 3 لـ (46) كحد أقصى & # x2003 & # x2003 = ms c 3 ( & # x1D4B1 II 2 (4)) = 6.

خريطة Transversion II & # x1D4B1 II i (l) في ثلاثي النوكليوتيدات من الكود الدائري المشترك ثلاثي النوكليوتيدات X 0. رقم c (& # x1D4B1 II i (l)) للرموز الدائرية C ، رقم mc (& # x1D4B1 II i (l)) من الرموز الدائرية القصوى MC ، رقم sc (& # x1D4B1 II i (l)) من self- الرموز الدائرية التكميلية SC ، الرقم c 3 (& # x1D4B1 II i (l)) من الرموز الدائرية C 3 ، والرقم ms c 3 (& # x1D4B1 II i (l)) من الرموز الدائرية القصوى المتممة ذاتيًا C 3 MS C 3.

من أجل l = 1 ، & # x2026 ، 20 (47) c (& # x1D4B1 II 1،2 (l)) = c (& # x1D4B1 II 2،3 (l)) ، mc (& # x1D4B1 II 1،2 (l)) = mc (& # x1D4B1 II 2،3 (l)) ، sc (& # x1D4B1 II 1،2 (l)) = sc (& # x1D4B1 II 2،3 (l)) ، c 3 ( & # x1D4B1 II 1،2 (l)) = c 3 (& # x1D4B1 II 2،3 (l))، ms c 3 (& # x1D4B1 II 1،2 (l)) = ms c 3 (& # x1D4B1 الثاني 2،3 (ل)). تختلف قوائم الرموز الدائرية ثلاثي النوكليوتيدات C المرتبطة بـ c (& # x1D4B1 II 1،2 (l)) و c (& # x1D4B1 II 2،3 (l)) عن l = 1، & # x2026، 5،13 ، 14 (غير معروض). إن توزيع أكواد ثلاثي النوكليوتيدات غير الدائري تحت عمليات التحويل II & # x1D4B1 II i ، j في ثلاثي النوكليوتيدات في الشفرة الدائرية للنيوكليوتيدات الشائعة X 0 أمر غير معتاد للغاية.في الواقع ، بالنسبة إلى l = 6 ، & # x2026 ، 12،15 ، & # x2026 ، 20 (48) c (& # x1D4B1 II 1،2 (l)) = c (& # x1D4B1 II 2،3 (l)) = 0 ومن أجل l = 15، & # x2026، 20 (49) c (& # x1D4B1 II 1،3 (l)) = 0. يولد التحويل II & # x1D4B1 II i، j أقصى عدد من الرموز الدائرية ثلاثي النوكليوتيدات C لـ (50) max & # x2003 & # x2003 = c (& # x1D4B1 II 1،3 (6)) = 662 وعدد أقصى من الرموز الدائرية القصوى المتممة ذاتيًا C 3 MS C 3 لـ (51) كحد أقصى & # x2003 & # x2003 = ms c 3 (& # x1D4B1 II 1،3 (4)) = 6. الأرقام c (& # x1D4B1 II 1،2 (l)) = c (& # x1D4B1 II 2،3 (l)) للرموز الدائرية C لها وظيفة نمو معينة (52) c (& # x1D4B1 II 1،2 (l)) = c (& # x1D4B1 II 2،3 (l)) = 1 & # x2003 لـ & # x2009 & # x2009 l = 13،14، c (& # x1D4B1 II 1،2 (l)) = c (& # x1D4B1 II 2،3 (l)) = 0 & # x2003 لـ & # x2009 & # x2009 l = 6، & # x2026، 12.

خريطة Transversion II & # x1D4B1 II i ، j (l) في ثلاثي النوكليوتيد للشفرة الدائرية ثلاثية النوكليوتيدات الشائعة X 0. رقم c (& # x1D4B1 II i، j (l)) للرموز الدائرية C ، رقم mc (& # x1D4B1 II i، j (l)) من الرموز الدائرية القصوى MC ، رقم sc (& # x1D4B1 II i ، j ( ل)) من الرموز الدائرية التكميلية الذاتية SC ، رقم c 3 (& # x1D4B1 II i ، j (l)) من الرموز الدائرية C 3 ، ورقم ms c 3 (& # x1D4B1 II i ، j (l)) من C 3 أكواد دائرية قصوى ذاتية التكميل MS C 3.

بالنسبة إلى l = 1، & # x2026، 19 (53) c (& # x1D4B1 II 1،2، 3 (l)) = 0 ومن الواضح أن ثوابت الحرف c (& # x1D4B1 II 1،2، 3 (20 )) = 1 كما في الجدولين 4 و 7.

يمكن تقسيم الكود الدائري المشترك ثلاثي النوكليوتيدات X 0 وفقًا للخرائط & # x1D4B1 II 1،2 و 3 و & # x1D4AB و & # x1D4AB 2 كما هو موضح في الجدول 10.

دع القسم P i = ، i & # x2208 <1، & # x2026، 10> ، يتكون من اثنين من ثلاثي النوكليوتيدات x ، x & # x2032 & # x2208 X 0. بالنسبة إلى l = 1 ، فإن أي تحويل II لثلاثي النوكليوتيد x & # x2208 P i يولد ثلاثي النوكليوتيد y وهو ثلاثي النوكليوتيد المخفف لثلاثي النوكليوتيد الآخر x & # x2032 & # x2208 P i. لذلك ، فإن أي تحويل II لثلاثي النوكليوتيد x & # x2208 X 0 يؤدي إلى رمز ثلاثي النوكليوتيد غير دائري. بالنسبة إلى 2 & # x2264 l & # x2264 19 ، يحتاج الإثبات إلى تحليل الكمبيوتر للقلادة للحالات غير البديهية عندما تحدث عمليتان مستعرضتان II مع اثنين من ثلاثي النوكليوتيدات في نفس الأقسام.

من المدهش جدًا ، بالنسبة للخرائط الثلاث للانتقال ، المستعرضات الأول والثاني ، & # x1D4AF i (l) ، & # x1D4B1 I i (l) ، & # x1D4B1 II i (l) ، i & # x2208 <1،2 ، 3>، & # x1D4AF i، j (l)، & # x1D4B1 I i، j (l)، & # x1D4B1 II i، j (l)، i، j & # x2208 <1،2، 3> مع i & # x3c j و & # x1D4AF 1،2، 3 (l) (ليس من أجل & # x1D4B1 I 1،2، 3 (l) and & # x1D4B1 II 1،2، 3 (l)) ، الأرقام ms c 3 من الشفرات الدائرية القصوى المتممة ذاتيًا MS C 3 للقيم الزوجية الأولى لـ l تتبع سلسلة من المعاملات ذات الحدين. لـ & # x1D4AF i (l) ، & # x1D4B1 I i (l) ، و & # x1D4B1 II i (l) ، i & # x2208 <1،2 ، 3> ، & # x1D4AF 1،2 (l) ، & # x1D4AF 2،3 (l) و & # x1D4B1 II i، j (l)، i، j & # x2208 <1،2، 3> مع i & # x3c j ، الأرقام mc للحد الأقصى من الرموز الدائرية MC للقيم الزوجية الأولى لـ l تتبع سلسلة من المعاملات ذات الحدين. بالنسبة إلى & # x1D4AF 1،2 ، 3 (l) ، فإن الأرقام c 3 من الرموز الدائرية C 3 للقيم l و (20 - l) مع l = 1 ، & # x2026 ، 8 تتبع سلسلة من المعاملات ذات الحدين. هذه الخصائص ذات الحدين مع بعض أرقام الرموز الدائرية للخرائط الثلاثة للانتقال ، لا يوجد تفسير اندماجي للخطين الأول والثاني حتى الآن.

يُظهر تحليل الكمبيوتر الشامل للانتقال والاستعراضات الأول والثاني في الكود الدائري الأقصى المكمّل ذاتيًا C 3 X 0 بعض النتائج الجديدة على وجه الخصوص (i) الانقلاب I & # x1D4B1 I 2 (l) في الموضع الثاني لأي مجموعة فرعية من تولد ثلاثي النوكليوتيدات لـ X 0 أكواد دائرية ثلاثية النوكليوتيدات والتي تكون دائمًا C 3 و (2) التحويل الثاني & # x1D4B1 II 1،2 ، 3 على المواضع الثلاثة لأي مجموعة فرعية من ثلاثي النوكليوتيدات لـ X 0 لا ينتج عنها رموز دائرية ثلاثية النوكليوتيدات. بالإضافة إلى التقسيم الذاتي التكميلي الكلاسيكي (تعريف 20) لـ X 0 المعروف منذ عام 1996 ، قسم جديد من X 0 يعتمد على خريطة التحويل II & # x1D4B1 II 1،2 ، 3 (التعريف 33) وخرائط التقليب الدائري & # x1D4AB و & # x1D4AB 2 (التعريف 18) محددان هنا أيضًا. تمد هذه النتائج هنا نظريتنا عن الشفرة الدائرية في الجينات إلى تطورها في ظل التحول والانعكاس.


دعم المعلومات

أرقام الانضمام

تسلسلات قاعدة بيانات EMBL (http://www.ebi.ac.uk/embl) المستخدمة في هذه المقالة ضمن أرقام التعريف التالية هي: بيديستريس و Italopodisma sp. الميتوكوندريا الحمض النووي (AF085501-AF085505) وNumts (AF085508-AF085524، AF085526-AF085538، AF085575-AF085578، AF085539-AF085545، AF085547-AF085550، AF085552-AF085574، EF088292-EF088294، EF088296-EF088309، EF088313، وEF088319-EF088323) ل الجينات الزائفة rDNA (AM183587 ، AM183588 ، AM183591 – AM183594 ، AM183596 – AM183608 ، AM183610 – AM183613 ، AM183616 – AM183624 ، و AM238436 – AM238438) من أجل بارابوديزما ميكادو (AF085506) ل الجراد المهاجر (X80245) و Drosophila sp. (AF012030 – AF012035 ، AF012037 – AF012052 ، U62715 – U62731 ، U65653).


مراجع

ستاماتويانوبولوس جي ، جروسفيلد إف (2001) تبديل الهيموجلوبين. في: Stamatoyannopoulos G ، Majerus P ، Perlmutter R ، Varmus H (eds) الأساس الجزيئي لأمراض الدم ، الطبعة الثالثة. سوندرز ، فيلادلفيا ، ص 135 - 182

Wijgerde M ، Grosveld F ، Fraser P (1995) الاستقرار المعقد للنسخ وديناميات الكروماتين في الجسم الحي. الطبيعة 377: 209-213 ، دوى: 10.1038 / 377209a0

Bollekens JA ، Forget BG (1991) Deltabeta thalassemia والاستمرار الوراثي للهيموجلوبين الجنيني. هيماتول أونكول كلين نورث آم 5: 399-422

Swank RA ، Stamatoyannopoulos G (1998) إعادة تنشيط الجينات الجنينية. Curr Opin Genet Dev 8: 366-370 ، دوى: 10.1016 / S0959-437X (98) 80095-6

Hardison RC ، Chui DH ، Giardine B ، Reimer C ، Patrinos GP ، Anagnou N ، Miller W ، Wajcman H (2002) HbVar: قاعدة بيانات علائقية لمتغيرات الهيموغلوبين البشري وطفرات الثلاسيميا في خادم الجينات الغلوبين. هموم موتات 19: 225-233 ، دوى: 10.1002 / humu.10044

Gelinas R ، Endlich B ، Pfeiffer C ، Yagi M ، Stamatoyannopoulos G (1985) G to A في صندوق CCAAT البعيد لجين A gamma-globin في الثبات الوراثي اليوناني للهيموجلوبين الجنيني. الطبيعة 313: 323-325 ، دوى: 10.1038 / 313323a0

Berry M ، Grosveld F ، Dillon N (1992) طفرة نقطة واحدة هي سبب الشكل اليوناني للثبات الوراثي للهيموجلوبين الجنيني. الطبيعة 358: 499-502 ، دوى: 10.1038 / 358499a0

Patrinos GP ، Loutradi-Anagnostou A ، Papadakis MN (1995) يرتبط تعدد أشكال الحمض النووي الجديد لجين Agamma globin (Agamma-588 A & gtG) بتعدد الأشكال XmnI (Ggamma-158 C & gtT). الهيموغلوبين 19: 419-423 ، دوى: 10.3109 / 03630269509005835

Patrinos GP، Kollia P، Loutradi-Anagnostou A، Loukopoulos D، Papadakis MN (1998) ينتج النوع الكريتي من الثبات الوراثي غير المتأثر للهيموجلوبين الجنيني [Agamma-158 C & gtT] من حدثين مستقلين للتحويل الجيني. هوم جينيه 102: 629-634 ، دوى: 10.1007 / s004390050753

Losekoot M ، Fodde R ، Hartveld CL ، van Heeren H ، Giordano PC ، Bernini LF (1990) تغيير طبيعة الرحلان الكهربائي للهلام المتدرج والتسلسل المباشر للحمض النووي الجيني المتضخم PCR: نهج تشخيصي سريع وموثوق لبيتا ثلاسيميا. Br J Haematol 76: 269–274، doi: 10.1111 / j.1365-2141.1990.tb07883.x

Papadakis MN ، Papapanagiotou E ، Loutradi-Anagnostou A (1997) طريقة المسح لتحديد عدم التجانس الجزيئي لجين دلتا-غلوبين ، خاصة في دلتا الثلاسيميا: الكشف عن ثلاث طفرات جديدة في منطقة المروج للجين. Hum Mutat 9: 465–472، doi: 10.1002 / (SICI) 1098-1004 (1997) 9: 5 & lt465 :: AID-HUMU14 & gt3.0.CO2-0

Tan AS، Quah TC، Low PS، Chong SS (2001) مقايسة تفاعل البوليميراز المتسلسل المتعدد الحذف السريع والموثوق به للثلاسيميا ألفا. الدم 98: 250-251 ، دوى: 10.1182 / دم. V98.1.250

Patrinos GP ، van Baal S ، Petersen MB ، Papadakis MN (2005) قاعدة بيانات الطفرات الوطنية الهيلينية: قاعدة بيانات نموذجية للطفرات التي تؤدي إلى اضطرابات وراثية في السكان الهيلينيين. هوم موتات 25: 327-333 ، دوى: 10.1002 / humu.20157

Papachatzopoulou A، Kaimakis P، Pourfarzad F، Menounos PG، Evangelakou P، Kollia P، Grosveld FG، Patrinos GP (2007) زيادة التعبير الجيني جاما-غلوبين في مرضى الثلاسيميا بيتا يرتبط بطفرة في 3′HS1. Am J Hematol 82: 1005–1009، doi: 10.1002 / ajh.20979

Luo HY، Mang D، Patrinos GP، Pourfarzad F، Wuc CJY، Eung SH، Rosenfield CG، Daoust PR، Braun A، Grosveld FG، Steinberg MH، Chui DHK (2004) A new single nucleotide polymorphism (SNP)، T & gtG، in قد يترافق موقع GATA عند النيوكليوتيدات −567 5 إلى جين Ggamma-globin مع ارتفاع Hb F. الدم 104: 145a – 146a

Chen Z، Luo HY، Basran RK، Hsu TH، Mang DW، Nuntakarn L، Rosenfield CG، Patrinos GP، Hardison RC، Steinberg MH، Chui DH (2008) A-to-G transversion at nucleotide −567 upstream of HBG2 in يرتبط شكل ربط GATA-1 بارتفاع الهيموجلوبين F. Mol Cell Biol 28: 4386–4393 ، دوى: 10.1128 / MCB.00071-08

Huisman TH، Harris H، Gravely M، Schroeder WA، Shelton JR، Shelton JB، Evans L (1977) التغايرية الكيميائية للهيموجلوبين الجنيني عند الرضع الطبيعيين والبالغين. Mol Cell Biochem 17: 45-55 ، دوى: 10.1007 / BF01732554

Ronchi AE، Bottardi S، Mazzucchelli C، Ottolenghi S، Santoro C (1995) الارتباط التفاضلي لعوامل النسخ NFE3 و CP1 / NFY لصناديق CCAAT البشرية و epsilon-globin. J Biol Chem 270: 21934-21941، دوى: 10.1074 / jbc.270.37.21934

Tasiopoulou M ، Boussiou M ، Sinopoulou K ، Moraitis G ، Loutradi-Anagnostou A ، Karababa P (2008) (G) gamma-196 C- & gtT ، (A) gamma-201 C- & gtT: طفرتان جديدتان في منطقة المروج لـ جينات جاما-غلوبين المرتبطة بالاستمرار الوراثي غير العضلي للهيموجلوبين الجنيني في اليونان. خلايا الدم Mol Dis 40: 320–322 ، دوى: 10.1016 / j.bcmd.2007.10.007

Patrinos GP ، Giardine B ، Riemer C ، Miller W ، Chui DH ، Anagnou NP ، Wajcman H ، Hardison RC (2004) تحسينات في هبفار متغيرات الهيموغلوبين البشري وطفرات الثلاسيميا لدراسات تباين السكان والتسلسل. الأحماض النووية الدقة 32: D537 – D541 ، دوى: 10.1093 / nar / gkh006

van Baal S، Kaimakis P، Phommarinh M، Koumbi D، Cuppens H، Riccardino F، Macek M Jr، Scriver CR، Patrinos GP (2007) FINDbase: قاعدة بيانات علائقية تسجل ترددات العيوب الجينية التي تؤدي إلى اضطرابات وراثية في جميع أنحاء العالم. الأحماض النووية الدقة 35: D690-D695 ، دوى: 10.1093 / nar / gkl934

Papadakis MN ، Patrinos GP ، Tsaftaridis P ، Loutradi-Anagnostou A (2002) دراسة مقارنة للاستمرار الوراثي اليوناني غير المحذوف للهيموغلوبين الجنيني ومركب بيتا ثلاسيميا متغاير الزيجوت. J Mol Med 80: 243–247، doi: 10.1007 / s00109-001-0312-4

Kollia P ، Kalamaras A ، Chassanidis C ، Samara M ، Vamvakopoulos NK ، Radmilovic M ، Pavlovic S ، Papadakis MN ، Patrinos GP (2008) تغاير الزيجوت المركب للنوع الكريتي من الثبات الوراثي غير المحذوف للهيموغلوبين الجنيني أو بيتا يؤكد سابين الدور الوظيفي لطفرة Agamma-158 C & gtT في نسخ جين جاما-غلوبين. خلايا الدم Mol Dis 41: 263-264

Ronchi A، Berry M، Raguz S، Imam A، Yannoutsos N، Ottolenghi S، Grosveld F، Dillon N (1996) دور منطقة مربع CCAAT المضاعفة في تنظيم جين جاما-غلوبين والاستمرار الوراثي للهيموجلوبين الجنيني. EMBO J 15: 143–149

Indrak K، Indrakova J، Kutlar F، Pospisilova D، Sulovska I، Baysal E، Huisman THJ (1991) تغاير الزيجوت المركب لثلاسيميا بيتا 0 (أكواد تغيير الإطارات 38/39 درجة مئوية) ونوع سويسري غير محذوف من HPFH (A & gtC) في NT −110 ، Ggamma) في عائلة تشيكوسلوفاكية. آن هيماتول 63: 111-115 ، دوى: 10.1007 / BF01707283

Patrinos GP، de Krom M، de Boer E، Langeveld A، Imam AM، Strouboulis J، de Laat W، Grosveld FG (2004) مطلوب تفاعلات متعددة بين المناطق التنظيمية لتحقيق الاستقرار في مركز كروماتين نشط. جينات ديف 18: 1495-1509 ، دوى: 10.1101 / جاد.289704


أساليب

أرابيدوبسيس خطوط معدلة وراثيا

تم تقييم ترددات طفرة النقطة باستخدام المعدلة وراثيا A. thaliana (كولومبيا الانضمام) خطوط 693 و 699 و 747 و M4. في الأسطر 693 و 699 و 747 ، تم تقديم رموز الإيقاف في GUS ORF في ثلاثة مواضع مختلفة 112G → T., 166G → T. و 118أ → ت، على التوالي (الشكل 1 أ) تم توفير هذه الخطوط المعدلة وراثيًا بواسطة إيغور كوفالتشوك (جامعة ليثبريدج ، كندا) [32]. تم توفير الخط M4 بواسطة Anna Depicker (جامعة غينت ، بلجيكا) [33]. في السطر M4 ، هناك طفرة في سوء الإحساس في GUS يتم إدخال الجين حيث تتحول القاعدة T إلى C في موضع 1390 (الشكل 1 أ). تم تسجيل عمليات إعادة التركيب الجسدية المتجانسة باستخدام الخطين 651 و R2L1 ، حيث يتم عكس ركائز إعادة التركيب بشكل متكرر لمقطع مبتور. GUS الجين (الشكل 1 ب). تم إهداء الخط 651 (النمط البيئي C24) من قبل باربرا هون (معهد فريدريش ميشر ، سويسرا) [34]. حصلنا على الخط R2L1 (نوع كولومبيا البيئي) [35] ، وكذلك الخط G10 (النمط البيئي لكولومبيا) [36] من فرانسوا بيلزيل (جامعة لافال ، كندا). يحتوي الخط G10 على ساتل دقيق (امتداد 10 جيغا) داخل GUS ORF (الشكل 1 ج). ال العلامة 1 تم توفير الخط بواسطة Nigel Crawford (جامعة كاليفورنيا ، كاليفورنيا) [37]. أجريت جميع التجارب على شتلات متماثلة اللواقح.

سلالات بكتيرية

أجريت العدوى باستخدام النوع البري A. الورم سلالة Ach5 (يشار إليها باسم VOT في الجسم الرئيسي للورقة) ، ومشتقاتها (الجدول 1) ، وكذلك مع بكتريا قولونية. ال أجروباكتريوم تم توفير سلالات Ach5 و LBA4404 (يشار إليها باسم VXX في متن الورقة) بواسطة K. Veluthambi (جامعة مادوراي كاماراج ، الهند) [51]. LBA4404 هو مشتق من Ach5 مع بلازميد Ti المنزوع السلاح pAL4404 وبالتالي ، فإنه يحتوي فقط على فير و أوري مناطق بلازميد Ti ، ولكن ليس الجينات المسرطنة و T-DNA [52]. لقد أنشأنا LBA4404 (pCAMBIA2300) (يشار إليها باسم VXT) عن طريق كهربة LBA4404 باستخدام المتجه الثنائي pCAMBIA2300. حصلنا على السلالة LBA4002 (المشار إليها باسم XXX) من Paul J. Hooykaas (جامعة Leiden ، هولندا). LBA4002 هو مشتق Ach5 بدون تي بلازميد [53]. كل ال أجروباكتريوم نمت سلالات على وسائط Luria-Bertani (LB) عند 28 درجة مئوية. نمت السلالة LBA4404 (pCAMBIA2300) على وسائط تحتوي على 100 مجم / لتر كاناميسين. بكتريا قولونية (سلالة ، DH5α) نمت في وسط LB عند 37 درجة مئوية. تم الحصول على البكتيريا المقتولة بالحرارة عن طريق تسخين المزرعة عند 70 درجة مئوية لمدة 30 دقيقة [39] وتم التحقق من الأشكال المقتولة بالحرارة عن طريق طلاءها مرة أخرى في وسط مناسب. قبل الإصابة ، تم زراعة البكتيريا في وسط LB السائل باستخدام المضادات الحيوية المناسبة وتم طرد المعلق (0.6 إلى 0.9 كثافة بصرية عند 600 نانومتر) عند 1100 X جم لمدة 10 دقائق وغسلها بكمية متساوية من وسط الإنبات السائل ثلاث مرات للتخلص من الآثار. من LB.

ظروف نمو النبات وطريقة الإصابة

أرابيدوبسيس تم تعقيم البذور السطحي بـ 500 ميكرولتر من 70٪ إيثانول ، وشطفها بالماء المعقم ومعالجتها بـ 0.5٪ مبيض لمدة دقيقتين. بعد ذلك ، تم غسل البذور أربع مرات بماء معقم. إصابة أرابيدوبسيس تم إجراء الشتلات وفقًا لبروتوكول Li et al. [54] مع الحد الأدنى من التعديل. تم طلاء البذور على وسط الإنبات (وسائط Murashige و Skoog (MS) المعقمة مع 3 ٪ سكروز ، ودرجة الحموضة 5.7). تمت مزامنة إنبات البذور عن طريق الاحتفاظ بألواح MS بالبذور في الظلام ، عند 4 درجات مئوية لمدة 48 ساعة. ثم تم نقل الألواح إلى غرفة نمو (بيرسيفال ، الولايات المتحدة الأمريكية) ، ذات كثافة إضاءة موحدة تبلغ 8000 وحدة لوكس تحت ضوء 16 ساعة / 8 ساعات دورة مظلمة. تم الحفاظ على درجة الحرارة عند 22 درجة مئوية طوال التجارب وتم ضبط الرطوبة عند 80٪. بعد يومين ، تم شطف الشتلات في وسط إنبات سائل يحتوي على البكتيريا وزرعها بشكل مشترك على وسط إنبات لفترة زمنية مناسبة (0.5 ساعة إلى 48 ساعة). عوملت شتلات المقارنة بطريقة مماثلة لتلك المصابة باستثناء أن الوسط السائل كان خالي من البكتيريا. تم بعد ذلك تعقيم سطح الشتلات المصابة وكذلك مجموعة الشاهد بوسائط MS سائلة تحتوي على 250 ملجم / لتر من سيفوتاكسيم و 0.05٪ خليط نباتي (Biogenuix Medsystem Pvt. Ltd. ، نيودلهي ، الهند). تم إسقاط هذه الشتلات برفق على وسط إنبات يحتوي على 250 مجم / لتر من سيفوتاكسيم و 0.05 ٪ خليط نباتي باستخدام ماصة واسعة الفم. تم الحفاظ على تباعد موحد بين الشتلات لجميع التجارب. تم حفظ هذه اللوحات في غرفة نمو النبات في نفس الظروف المذكورة أعلاه لمدة أسبوعين ثم استخدامها لتلطيخ كيميائي نسجي GUS.

Β-Glucuronidase (GUS) تلطيخ كيميائي نسجي

تم إجراء تلطيخ GUS الكيميائي وفقًا لبروتوكول جيفرسون [55]. يحتوي محلول التلوين (100 ملي محلول فوسفات الصوديوم [pH 7.0]) على 1 ملي مولار 5-برومو-4-كلورو -3-إندوليل جلوكورونيد (X-Gluc) (Biosynth ، سويسرا) ، 0.1٪ Triton X-100 و 50 ميكروغرام / مل كاناميسين. تمت إضافة محلول تلطيخ GUS (10 مل) إلى ستة أطباق تحتوي على ما يقرب من 50 نباتًا لكل بئر. تم اختراق هذه اللوحات بالفراغ لمدة 10 دقائق واحتضانها عند 37 درجة مئوية لمدة 48 ساعة. بعد ذلك تم تبييض هذه النباتات بنسبة 70 ٪ من الإيثانول. تم حساب البقع الزرقاء (الشكل 1 هـ) التي تعكس انعكاسات الطفرة باستخدام مجهر ضوئي (لايكا KL300).

تقدير ترددات الطفرات

تم إجراء كل تجربة في ثلاث نسخ وتم أخذ حوالي 400-500 نبتة لكل معاملة. بالنسبة للدراسات التي تشمل ولايات ميكرونيزيا الموحدة ، تم أخذ حوالي 200-250 نبتة. تم التعبير عن ترددات الطفرات على أنها متوسط ​​عدد البقع التي لوحظت لكل نبات [33]. تمت مقارنة ترددات الطفرات للنباتات المصابة وترددات الطفرات التلقائية للنباتات الضابطة.تم اختبار مجموعات بيانات تكرار الطفرات من أجل الحالة الطبيعية [56] والمساواة في التباينات [57 ، 58] ، وتعرضت أيضًا إلى طريقة واحدة لتحليل التباين (ANOVA ، α = 0.05) لتحديد التأثيرات المهمة (ص & lt 0.05) ، إن وجدت. تم استخدام اختبار Duncan للمدى المتعدد [58-60] عندما كشفت ANOVA عن اختلافات كبيرة (ص & lt 0.05). تم إجراء جميع التحليلات الإحصائية باستخدام برنامج STATISTICA الإصدار 8 (Stat Soft Inc.). تم رسم مجموعات البيانات في برنامج MS Office - Excel (Microsoft Inc.).