معلومة

هل يمكن أن تكون قيمة التوريث أكبر من 1؟

هل يمكن أن تكون قيمة التوريث أكبر من 1؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

يبدو أن قابلية التوريث التي تُعرَّف على أنها تباين جيني مقسومًا على التباين الكلي محدودة بين 0 و 1. ومع ذلك ، أرى طريقة لحساب التوريث في هذه الصفحة (http://www.radford.edu/~rsheehy/Gen_flash/Tutorials/Linear_Regression/) reg-tut.htm) مع: 2 * Covxy / Varx. ومع ذلك ، يمكن أن تكون النتيجة المحسوبة بهذه الطريقة أكبر من 1. ما الذي أفتقده؟


هل يمكن أن تكون قيمة التوريث أكبر من 1؟ - مادة الاحياء

عادةً ما تُظهر السمة متعددة الجينات قدرًا كبيرًا من التباين الظاهري في مجموعة سكانية. بعض هذا الاختلاف وراثي ، VG ، بسبب الفئات الوراثية المختلفة في السكان وإلى الهيمنة والتأثيرات المعرفية. بعض الاختلاف هو التأثير البيئي على الجينات ، VE. (قد يكون هناك أيضًا تباين في تفاعل الجينات والبيئة ، سنفترض في الوقت الحالي أن هذا هو 0). وبالتالي ، هناك مكونان رئيسيان من إجمالي التباين الظاهري الملحوظ في عينة ، وهما عنصران مضافان:

VP (إجمالي التباين الظاهري) = VG (التباين الجيني) + VE (التباين البيئي)

لطالما اهتم العلماء وغيرهم بأساليب قياس هذه الكميات. VP هو إجمالي التباين الإحصائي للسمة في المجتمع ويمكن حسابه إحصائيًا من بيانات السكان. ومع ذلك ، ليس من السهل تحديد VG و VE حتى عند الحصول على القيم المقدرة ، ودقتها موضع شك وتتعلق فقط بالسكان في ذلك الوقت ، في تلك البيئة الواحدة. من المحتمل أن تتغير القيم إذا تغيرت البيئة أو إذا تم قياس عينة مختلفة (من مجموعة سكانية مختلفة) لتلك السمة. نظرًا لأنه لا يمكن تقسيم الفرد إلى مكونات وراثية مقابل مكونات بيئية للسمة ، يتم استخدام مقاييس التباين في عينات السكان ، على الرغم من الحاجة إلى معالجة هذه التدابير بقدر كبير من الحذر.

& # 9 يتم تعريف قابلية التوريث لسمة ، H ، على أنها جزء من التباين الكلي لتلك السمة الوراثية.

لاحظ أن H هو جزء التباين الوراثي ، فهو ليس جزءًا من السمة يتم تحديده وراثيًا. (لا يمكن قياس ذلك). لاحظ أنه إذا لم يكن هناك اختلاف جيني (كل الأفراد لديهم نفس النمط الجيني) ، فإن VG = 0 ، و H = 0. وعلى العكس ، إذا لم يكن هناك تغير بيئي (كل فرد يخضع لتأثيرات بيئية متطابقة) ، فإن VE = 0 و H = 1. هذه هي الحدود النظرية لقيمة H. بالطبع ، هناك دائمًا بعض VG وبعض VE لأي سمة متعددة الجينات ، لذلك تقع H في مكان ما بين 0 و 1.

& # 9 من المهم للغاية تفسير قيمة H بشكل صحيح. تعتبر قيمة H البالغة 0.5 أو أكثر سمة ذات قابلية وراثية عالية - معظم التباين في السمة وراثي. هذا لا يشبه القول بأن السمة يتم تحديدها في الغالب وراثيًا ، فقد لا تتأثر السمة كثيرًا بالجينات على الإطلاق ، ولكن لا يزال هناك تنوع في الأنماط الجينية في السكان وليس هناك الكثير من التباين البيئي. وبالتالي ، يخرج VG أعلى من VE ، مما يعطي قيمة H عالية. على العكس من ذلك ، تعتبر قيمة H التي تقل عن 0.2 قيمة منخفضة للتوريث ، مما يعني أن معظم التباين في السمة بيئي. مرة أخرى ، يتم الحكم على التباين ، وليس بالضرورة السمة نفسها. يمكن أن تكون البيئة لا تؤثر على السمة كثيرًا ، ولكن إذا لم يكن هناك تقريبًا اختلاف جيني في السكان لهذه السمة ، فما زال VE الصغير يمثل معظم التباين ، مما يعطي قيمة H منخفضة.

& # 9 نظرًا لأن التأثيرات البيئية متنوعة جدًا من مجتمع إلى آخر ، فإن قيم H تنطبق فقط على السكان الذين يتم قياسهم في وقت القياس. لا ينبغي أبدًا تمديدها لمقارنة السكان ، ما لم تكن بيئات السكان متطابقة. مع البشر ، على سبيل المثال ، من المستحيل ادعاء ذلك. عندما يقول شخص ما أن H = 0.8 بالنسبة لمعدل الذكاء البشري ، وبالتالي ، يتم تحديد معدل الذكاء في الغالب وراثيًا ، وبالتالي ، فإن أي اختلافات بين السكان (الأعراق) في معدل الذكاء تستند إلى الجينات ، فإن هذا الشخص يرتكب ثلاثة أخطاء على الأقل من خلال تقديم هذا الادعاء:

1) H = 0.8 هي القيمة التي تم الحصول عليها لعينات من سكان القوقاز وهي تنطبق فقط على السكان المعينين الذين تم أخذ عيناتهم في الاختبار. لم يتم اختبار الأمريكيين الأفارقة على نطاق واسع مثل القوقازيين. إذا كان على المرء أن يقارن بينهما ، فسيتعين على المرء أن يفترض تأثيرات بيئية متطابقة على معدل الذكاء للأمريكيين من أصل أفريقي كما هو الحال بالنسبة للقوقازيين. من الواضح أن الأمريكيين الأفارقة والقوقازيين الأمريكيين لديهم حقائق ثقافية واجتماعية واقتصادية مختلفة في الولايات المتحدة.المسألة إذن هي ما إذا كانت الاختلافات الثقافية والاجتماعية والاقتصادية بين الأمريكيين الأفارقة والقوقازيين غير منطقية بقدر ما تؤثر على درجات معدل الذكاء - ربما لا.

2) H = 0.8 هي في الواقع قيمة عالية ، لكنها تعني فقط أن هناك تنوعًا جينيًا واسعًا (مقارنة بالتنوع البيئي). لا ينبغي أبدًا تفسير هذا على أنه يعني بالضرورة وجود مكون وراثي كبير لتحديد معدل الذكاء نفسه.

3) توجد بالفعل اختلافات في متوسط ​​معدل الذكاء بين الأمريكيين الأفارقة والقوقازيين. ومع ذلك ، فإن القول بأن هذه الاختلافات وراثية هو أمر غير صحيح علميًا. لا يمكن للمرء استخدام القيمة H لعينة سكانية واحدة ومقارنتها بعينة سكانية أخرى ما لم تكن تلك المجموعة السكانية الأخرى تحت تأثيرات بيئية متطابقة.

& # 9 علميًا ، لا توجد بيانات ومعرفة كافية بما يحدد معدل الذكاء للتوصل إلى أي استنتاجات نهائية. من المحتمل أن يكون هناك مصطلح VGE مهم - التفاعل بين الجينات والبيئة - بحيث في الواقع VP = VG + VE + VGE. قد يكون VGE أكبر من VG أو VE وحده - من يدري؟

& # 9 ستكون النظرة الجينية لتحديد معدل الذكاء شيئًا على النحو التالي: تحدد جينات كل فرد نطاقًا من قيم معدل الذكاء المحتملة ، ولكن حيث يتم تحقيق معدل الذكاء ضمن هذا النطاق (الحدود العليا والدنيا) يعتمد على العوامل البيئية. وبالتالي ، فإن وجهة النظر الجينية هي أن (1) يختلف الأشخاص في أساسهم الجيني لمعدل الذكاء - الجميع ليسوا متساوين - لأنه لا يوجد شخصان متطابقان وراثيًا ، (2) البيئة تحدد معدل الذكاء ضمن نطاق إمكانات كل شخص ، و ( 3) من المحتمل أن تستجيب أنماط وراثية مختلفة (أفراد) لبيئات مختلفة - لا توجد بيئة واحدة أفضل لجميع الأنماط الجينية (VGE).

& # 9 يمكن للمرء الحصول على فكرة تقريبية عن مدى التورط الجيني في سمة من خلال مقارنة قيم التوافق لتلك السمة بين توائم MZ و DZ. ضع في اعتبارك ، على سبيل المثال ، داء السكري. تبلغ نسبة توافق التوأم MZ 47٪ مقابل 9.7٪ لتوائم DZ. تظهر مقارنة التوائم MZ مع DZ أساسًا وراثيًا ، ولكنها تظهر أيضًا دورًا بيئيًا ، حيث أن 47٪ أقل من 100٪. على النقيض من ذلك ، فإن التوائم MZ و DZ لها نفس القيمة المطابقة للوفاة من العدوى الحادة إذا كانت MZ = توافق DZ ، إذن هناك القليل من الأساس الجيني لهذه السمة ، إن وجد.

& # 9 للحصول على قيمة H ، نحتاج إلى قيم V (التباين) لتوصيلها بـ H = VG / VE. ضع في اعتبارك سمة "الارتفاع". قم بقياس ارتفاع V لتوائم MZ. نظرًا لأن هذه متطابقة وراثيًا ، VMZ = VE = كل التباين البيئي. إذا استخدمنا توائم DZ من نفس الجنس ، فيمكننا (ربما) أن نفترض أن لديهم نفس VE مثل التوائم MZ ، لذلك لدينا قيمة لـ VE.

& # 9 قيمة التباين لتوائم DZ تقلل من إجمالي عدد السكان VG ، لأن التوائم DZ تشترك في نصف جيناتها ، وبالتالي فهي ليست متغيرة وراثيًا مثل الأعضاء الآخرين من السكان. لذلك ، ضاعف متغير التوائم DZ لتوسيعه ليشمل السكان ككل. لاحظ أيضًا أن VDZ = 1 / 2VG + VE ، لذلك VDZ - VE = 1/2 VG ، أو VG = 2 (VDZ - VE).

الآن افتراضنا أنه يمكننا استخدام VMZ مع بدء تشغيل VE ، ونحصل على VG = 2 (VDZ - VMZ). وبالتالي ، يتم حساب قيمة H من قيم VDZ و VMZ المقاسة مثل H = 2 (VDZ - VMZ) / VP.

تخضع قيم H المحسوبة على هذا النحو للعديد من الأخطاء ، خاصة بسبب افتراض VMZ = VE: قد يكون VE لـ DZ ، في الواقع ، أعلى من VE لـ MZ.

& # 9 بالعودة إلى معدل الذكاء ، قام الباحثون ، بهذه الطريقة ، بحساب H ليكون في مكان ما حول 0.6 - 0.8. تشير دراسات أخرى تستخدم معاملات الارتباط أيضًا إلى قيم H كبيرة. يُظهر التوائم MZ الذين تمت تربيتهم معًا معامل ارتباط قدره 0.85 (توقع 1.00 إذا تم تحديده وراثيًا تمامًا). التوائم MZ التي تمت تربيتها على حدة تعطي قيمة 0.65 (أقل من 0.85) ، مما يدل على المكون البيئي. تعطي الأشقاء التي تمت تربيتها على حدة قيمة 0.25 ، مما يُظهر مكونًا وراثيًا. وبالتالي ، تُظهر البيانات كلاً من المكونات الجينية والبيئية المشاركة في تحديد معدل الذكاء.


التوريث 101: ما هو "التوريث"؟

عندما يصل مولود جديد ، غالبًا ما تكون هناك محادثة حول من يشبه الطفل في الأسرة. "كم هو رائع ، لديه أنف أبيه!" "انظر ، لديها شعر الجدة سو الأحمر!" "إنه يشبه العم روبرت عندما كان طفلاً!" غالبًا ما تستمر هذه التعليقات مع نمو الطفل. "لقد حصلت على ذكاء والدتها." "لقد حصل على مظهر جده الجميل." "كل موهبتها الموسيقية تأتي من جانب والدها في الأسرة."

يميل الأطفال إلى التشبه بوالديهم وإخوتهم وبدرجة أقل أسرهم الممتدة. يمكنك أن تخمن جيدًا كم يبلغ طول الطفل عن طريق حساب متوسط ​​ارتفاع والديه. تمتد أوجه التشابه هذه بين أفراد الأسرة إلى ما هو أبعد من الطول إلى عدد كبير جدًا من السمات [1].

لماذا هذه الصفات تعمل في العائلات؟ أحد الاحتمالات هو أنهم يتشاركون في بيئة. ربما يقوم الآباء بتربية أطفالهم عمدًا ليكونوا مثلهم. ربما يوجد "شيء ما في الماء" ، كما يقول التعبير القديم. بالإضافة إلى أن بعضًا منها قد يكون وراثيًا ، فالنتيجة النهائية للحمض النووي تنتقل إلى كل طفل من الوالدين البيولوجيين عند الحمل. سيساعد هذا في تفسير سبب تشابه الطفل المتبنى مع والديه البيولوجيين في بعض الصفات أكثر من الوالدين بالتبني ، أو لماذا يتشابه التوائم مع بعضهم البعض أكثر من الأشقاء.

عندما يمكن نقل سمة من خلال علم الوراثة فإننا نسميها "قابلة للتوريث" ، لأنها موروثة من والديك البيولوجيين. يتم تحديد بعض السمات الوراثية ، مثل فصيلة الدم أو مرض فقر الدم المنجلي ، تمامًا عن طريق الوراثة بهذه الطريقة. ومع ذلك ، فإن معظم السمات موروثة جزئيًا فقط. ربما تكون قد سمعت الكثير من الحكايات عن الأصدقاء أو أفراد الأسرة الذين يختلفون بشكل غير عادي عن عائلاتهم. العم الذي يبلغ طوله 6 بوصات من أي شخص آخر في العائلة. منفتح في أسرة مليئة بالانطوائيين. هذه الصفات قابلة للتوريث ، لكنها قد تتأثر بشراء مجموعة من العوامل البيئية أيضًا.

"التوريث" ، إذن ، هو وسيلة لوصف كم الثمن سمة مرتبطة بعلم الوراثة. سنترك السؤال عن كيفية تقديرنا للتوريث (والعديد من التفاصيل الفنية الأخرى) إلى مشاركة لاحقة. بدلاً من ذلك ، دعنا نركز أولاً على ماهية التوريث ، وما هو ليس كذلك (أي المفاهيم الخاطئة الشائعة) ، ولماذا هو شيء نحن مهتمون بدراسته.

ما هو التوريث:

أولاً ، تعريف شبه رسمي: التوريث هو نسبة التباين في سمة تفسرها المتغيرات الجينية الموروثة [2]. بعبارة أخرى ، إنها طريقة لقياس مدى قدرة الاختلافات في الحمض النووي للأشخاص على تفسير الاختلافات في سماتهم. يمكن أن يكون التوريث بين 0 (لا تشرح الوراثة شيئًا عن السمة) و 1 (علم الوراثة يشرح كل شيء). على سبيل المثال ، تبلغ قابلية التوريث في الطول حوالي 0.80 ، والتوريث لساعات النوم في الليلة هو 0.15-0.20 [3].

يقدّر التوريث مدى قدرتنا على توقع سمة من علم الوراثة (إذا فهمنا تمامًا جميع التأثيرات الجينية ذات الصلة). وبالمثل ، فإنه يخبرنا أيضًا عن مدى قدرتنا على توقع السمات فيك بناءً على تلك السمة في والديك. في الواقع ، إن إجراء هذا التنبؤ من الحمض النووي الخاص بك سيتطلب معرفة دقيقة لتأثير كل متغير جيني ، وهو بعيد جدًا جدًا عن كونه حقيقة. لكن التوريث يضع حدًا أعلى لمدى جودة هذا التنبؤ عندما نتعلم المزيد عن جينات هذه السمة.

يقيس التوريث مدى أهمية علم الوراثة للسمة. يشير التوريث المرتفع ، بالقرب من 1 ، إلى أن الجينات تفسر الكثير من التباين في سمة ما بين مختلف الأشخاص ، حيث تشير التوريث المنخفض ، بالقرب من الصفر ، إلى أن معظم الاختلافات ليست وراثية. فقط لأن السمة لها قابلية وراثية عالية لا يعني بالضرورة أن هناك بعض الجينات المحددة التي تسببها بشكل مباشر بطريقة بيولوجية واضحة ، ولكن هذا يعني أن المساهمة الكلية للتأثيرات السببية المباشرة وغير المباشرة والارتباطات الأخرى بين متغيرات الحمض النووي المحددة و السمة كافية لتكون مفيدة [4].

التوريث هو ملك للسكان وليس للفرد. عندما يتم وصف قابلية التوريث في سمة ما ، فإنها تعكس مدى التباين في السكان نتيجة لعوامل وراثية. فهو لا "يفسر" سبب إصابة الفرد بمرض ما.

التوريث خاص بكيفية قياس السمة. الصفات التي يصعب قياسها ، وبالتالي بها المزيد من أخطاء القياس العشوائية ، ستكون أقل قابلية للتوريث (نظرًا لأن خطأ القياس العشوائي ليس وراثيًا). يمكن أن يتسبب هذا أيضًا في اختلافات في التوريث تعتمد على من يقيس السمة (على سبيل المثال ، الإبلاغ عن شيء عن نفسك مقابل التشخيصات من الطبيب مقابل القياسات البدنية) ، أو بين القياس المبسط والسمات المقصودة (على سبيل المثال ، وراثة أخذ بروزاك مقابل التوريث. من الاكتئاب).

التوريث خاص بمن تم قياس السمة. نظرًا لأن التوريث يتضمن التباين الكلي للسمات في السكان ، فمن المهم في أي مجموعة تقارن التأثيرات الجينية. قد تكون قابلية توريث السمة في الأفراد من بلد معين ، والعرق ، ومجموعة الأعمار / سنوات الميلاد ، و / أو الوضع الاجتماعي والاقتصادي (من بين ميزات أخرى) هي نفسها أو لا تكون مماثلة لتوريث تلك السمة في مجموعة سكانية مختلفة لها فئة مختلفة. الخلفية الوراثية ويتعرض لبيئة مختلفة.

ما ليس التوريث:

التوريث ليس قدرا. فقط لأن السمة قابلة للتوريث وموجودة في والديك لا يعني أنك مقدر أن تتمتع بهذه السمة. قد يكون الأمر أكثر احتمالا ، لكنه ليس حتميا.

الوراثة ليست ثابتة. نظرًا لأن التوريث يعكس التوازن بين تأثيرات العوامل الجينية والبيئية ، إذا قمت بتغيير البيئة يمكنك تغيير توريث السمة.

لا يقيس التوريث قدرتنا على التأثير في السمة. لون الشعر متوارث للغاية ، ولكن يمكنك صبغ شعرك بأي لون تريده (بما في ذلك الألوان التي لا يمكنك أن ترثها). مؤشر كتلة الجسم موروث ، لكن هذا لا يعني أن النظام الغذائي والتمارين الرياضية لا يمكن أن يكون لهما تأثير. بعبارة أخرى ، التوريث ليس بيانًا نهائيًا عن قوة "الطبيعة مقابل التنشئة".

لا تعني الوراثة العالية أن اختلافات المجموعة وراثية. هناك تاريخ مقلق في نسب الاختلافات الجماعية الملحوظة ، مثل التفاوتات العرقية المبلغ عنها في درجات معدل الذكاء ، إلى علم الوراثة. كما لوحظ أعلاه ، فإن التوريث خاص باختيار القياس ، والسكان ، والبيئة ، كما أن توريث السمة ليس ثابتًا. ونتيجة لذلك ، لا يصح استخدام القدرة على التوريث المقدرة للسمة كدليل على الاختلافات "المتأصلة" بين المجموعات السكانية.

لماذا التوريث مهم؟

تقدير قابلية التوريث لسمة (في مجموعة سكانية معينة) هو نقطة انطلاق لفهم هذه السمة ، بدلاً من الهدف النهائي. وهذا ينطبق بشكل أكبر على نسخة التوريث التي قدرناها في البنك الحيوي بالمملكة المتحدة ، والتي تمثل جزءًا فقط من إجمالي التباين الجيني المحتمل الذي يؤثر على سمة ما.

بالنسبة لعلماء الوراثة وعلماء الأحياء ، تعد الوراثة مؤشرًا على السمات التي ستكون مفيدة للدراسة. من خلال توفير مقياس لمدى ارتباط السمة بالجينات بدلاً من العوامل الأخرى ، فإنها تخبرنا إلى أي مدى يجب مراعاة علم الوراثة إذا أردنا معرفة المزيد عن أسباب هذه السمة.

في مجال الرعاية الصحية ، توفر وراثة المقاييس الجسدية (مؤشر كتلة الجسم وضغط الدم وما إلى ذلك) والاضطرابات نظرة ثاقبة حول مقدار التاريخ العائلي الذي يمكن أن يتنبأ بنتائج المريض ، وكيف يمكن أن تصبح الاختبارات الجينية مفيدة للتنبؤ بمخاطر المرض ونتائج العلاج.

يُعد تقدير التوريث أمرًا مهمًا أيضًا في العلوم الاجتماعية ، حيث تشير الأبحاث الحالية إلى أن العديد من جوانب الحياة - من الشخصية إلى التعليم إلى جدول النوم إلى عدد الأطفال لديك - يمكن توريثها قليلاً على الأقل. يمكن أن يشير تحديد التوريث في هذه السمات إلى مجالات يرتبط فيها حمضنا النووي ، غالبًا بطرق معقدة وغير مباشرة ، بالنتائج الاجتماعية.

وبالنسبة لنا جميعًا ، فإن معرفة توريث سماتنا يوفر فهمًا أكثر قليلاً لدور حمضنا النووي في تشكيل هويتنا. علم الوراثة ليس أبدًا بسيطًا مثل "الطبيعة مقابل التنشئة" ، ولكن دراسة وراثة السمات البشرية على الأقل تقدم لمحة عن كيفية تفاعل هذه القوى وتوجه الطريق نحو ما قد نكون قادرين على تعلمه من جيناتنا في المستقبل.


القياسات الشكلية الحديثة للحشرات المهمة طبيا

16.3.3 التوريث

يعتمد التوريث على التباين الجيني المرتبط بالسمات قيد الدراسة ، ثم يعتمد على السكان قيد الدراسة. لا يمكن الاستغناء عن قياسه لتفسير الاختلاف المتري الطبيعي ، ولكنه يمكن أن يوفر معلومات قيمة حول تكيف السمات المترية. في الحشرات ، عادةً ما تحتوي الصفات المورفولوجية على أعلى قيم التوريث مقارنة بفئات السمات الأخرى مثل تاريخ الحياة ، ربما لأن الأولى أقل اهتمامًا باللياقة البدنية.

تسمح التقنيات الهندسية بتقديرات منفصلة لحجم وشكل التوريث. قد يُظهر الحجم في الحشرات قيمًا متسقة للتوريث (Daly ، 1992 Lehmann et al. ، 2006) ، بحيث يمكن اختيارها تجريبيًا لتشكيل مجموعات سكانية فرعية مميزة جينيًا للحجم (Anderson، 1973 Partridge et al.، 1994). أنتجت الدراسات المختلفة التي تفحص التوريث عبر البيئة لشكل الجناح في Diptera قابلية وراثية عالية ومستقرة ، وصلت إلى 60 ٪ أو أكثر (Roff and Mousseau ، 1987 Bitner-Mathé and Klaczko ، 1999 Gilchrist and Partridge ، 2001 Hoffman and Shirriffs ، 2002). تشير القيم المتسقة لتوارث الأشكال إلى أن جزءًا كبيرًا من الاختلاف المورفومتري الملاحظ بين المجموعات الطبيعية من الحشرات (Camara et al. ، 2006. Henry et al. ، 2010 Morales et al. ، 2010) قد يكون بسبب التأثيرات المضافة للجينات.

في الزهره. مصرية، يبدو أن الشكل أكثر قابلية للتوريث من الحجم. عند مقارنة حجم وشكل التوريث عبر البيئة على نفس السكان في الزهره. مصرية، تم العثور على قيم أعلى بكثير للشكل (الشكل 16.2) مقارنة بالحجم ، مما يوفر أدلة غير مباشرة لمصادر جينية مختلفة للتباين (Morales et al. ، بيانات غير منشورة).

الشكل 16.2. الزهره. مصرية: انحدار الالتواءات النسبية الأولى (RW1) لبنات المختبرات على RW1 للأمهات المناظرات اللواتي تم جمعهن ميدانيًا في دراسة عبر البيئة لتوريث شكل الجناح في 18 معلمًا (Morales et al. ، بيانات غير منشورة). المختبر F1 ، عينات من الإناث تم الحصول عليها بعد عبور العينات التي تم جمعها ميدانيًا.


ما الذي يسبب التوجه الجنسي: الطبيعة والتنشئة

التوجه الجنسي هو & # 8220 نمط دائم من الانجذاب العاطفي والرومانسي و / أو الجنسي للرجال أو النساء أو كلا الجنسين. & # 8221 1 في شرح أسباب التوجه الجنسي ، يجب التأكيد على أنه لا يمكن لأحد أن يختار أن يكون مثليًا أو ثنائي الجنس أو من جنسين مختلفين. يتم تحديد التوجه الجنسي من خلال عاملين رئيسيين: الطبيعة والتنشئة. تشير الطبيعة إلى الجينات وعلم الأحياء ، بينما تشمل التنشئة التأثيرات البيئية والاجتماعية & # 8220. & # 8221 2

أحد عوامل الطبيعة في التوجه الجنسي هو الجينات.تم تأكيد ذلك في الدراسات العلمية التي تقيس التوريث: & # 8220 مقدار التباين الظاهري (الذي يمكن ملاحظته) في مجتمع يُعزى إلى الاختلافات الجينية الفردية. & # 8221 3 على سبيل المثال ، إذا كانت مجموعة من الأفراد يتلقون جميعًا تغذية جيدة (حصة بيئة مماثلة) ، فإن الاختلافات في الطول ستكون بسبب الاختلافات الجينية. 4 الارتفاع هو سمة وراثية للغاية.

يتم قياس التوريث كإحصاء. يتم التعبير عنها & # 8220 كنسب (مثل 60.) & # 8221 ، و & # 8220 القيمة القصوى التي يمكن أن تحصل عليها هي 1.00. & # 8221 5 إذا كان التوريث 1.00 ، & # 8220 ، فإن كل التباين في المجتمع يرجع إلى الاختلافات أو الاختلاف بين الأنماط الجينية. & # 8221 6 إذا كان التوريث 0.00 ، إذن & # 8220 كل الاختلافات في السكان تأتي من الاختلافات في البيئات التي يعاني منها الأفراد. & # 8221 7 لا يمكن قياس التوريث لشخص فردي ، ولكن & # 8220 فقط لمجموعة معينة تعيش في بيئة معينة & # 8221 و & # 8220 فقط للاختلافات داخل مجموعة. & # 8221 8

يتم تقدير التوريث من خلال الدراسات المزدوجة. أجرت دراسة سويدية عام 2010 ، باستخدام بيانات من السجل التوأم السويدي ، & # 8220 أكبر دراسة توأم قائمة على السكان على الإطلاق لتقدير تأثير التأثيرات الجينية والبيئية على السلوك الجنسي من نفس الجنس. & # 8221 9 بالنسبة للتوائم الذكور الذين لديهم & # 8220 أي شريك من نفس الجنس مدى الحياة & # 8221 ، كانت تقديرات التوريث 39٪. 10 بالنسبة للتوائم الإناث ، تم تفسير & # 822018-19٪ فقط من السلوكيات الجنسية من نفس الجنس بالعوامل الوراثية. & # 8221 11 وجدت الدراسة أن الجينات لعبت دورًا أكبر بكثير في التوجه الجنسي من نفس الجنس للرجال مقارنة بالنساء.

العامل الثاني في التوجه الجنسي هو التنشئة. وجدت الدراسة السويدية أنه بالنسبة لتوائم الذكور ، شكلت العوامل البيئية الفريدة 61٪ من السلوك الجنسي المثلي. 12 بالنسبة للتوائم الإناث ، شكلت العوامل البيئية الفريدة 64-66٪ من السلوك الجنسي المثلي ، و16-17٪ كانت بسبب التأثيرات البيئية المشتركة. 13 لكل من التوائم الذكور والإناث ، لعبت التنشئة دورًا أكبر بكثير من الطبيعة في تحديد التوجه الجنسي للشخص.

إنه أيضًا إجماع الأطباء النفسيين وعلماء النفس على أن التنشئة عامل مهم في التوجه الجنسي. وفقًا للكلية الملكية للأطباء النفسيين ، يتم تحديد التوجه الجنسي # 8220 من خلال مجموعة من العوامل البيئية البيولوجية وما بعد الولادة. & # 8221 14 وبالمثل ، تنص الجمعية الأمريكية لعلم النفس ، & # 8220 لا يوجد إجماع بين العلماء حول الأسباب الدقيقة ل يطور الفرد توجهًا مغايرًا للجنس أو ثنائي الميول الجنسية أو مثلي الجنس أو السحاقيات & # 8230 لم تظهر أي نتائج تسمح للعلماء باستنتاج أن التوجه الجنسي يتحدد بواسطة أي عامل أو عوامل معينة. يعتقد الكثيرون أن الطبيعة والتنشئة يلعبان أدوارًا معقدة. & # 8221 15


صفة وراثية مقابل صفة وراثية

عندما يخبرك شخص ما أن 80٪ من الطول يمكن توريثه ، فهل هذا يعني: أ) 80٪ من سبب كونك طولك يرجع إلى الجينات ب) 80٪ من التباين داخل السكان في سمة الطول يرجع إلى تباين الجينات الجواب بالطبع ب. لسوء الحظ ، في السنوات الخمس التي كنت أدوّن فيها ، كان من الصعب تحديد مفهوم التوريث ، ولا بد لي بانتظام من إقناع القراء الذين يخلطون بين المصطلح و. أي أنهم يفترضون أنه إذا قلت أن السمة هي في الغالب قابلة للتوريث ، فإنني أعني أن تطورها هو في الغالب وظيفة الجينات. في الواقع ليس هذا خطأ فحسب ، بل إنه غير متماسك. التوريث هو معالجة الارتباط على مستوى السكان بين تباين النمط الظاهري والاختلاف الوراثي. بعبارة أخرى ، إلى أي مدى يمكن أن يعمل التباين الجيني كبديل للتنوع الظاهري؟ ما هي نسبة التباين الظاهري التي يمكن تفسيرها من خلال التباين الوراثي؟ المصطلحات الأساسية هنا هي مستوى السكان والاختلاف (أو من الناحية الفنية ، التباين). نحن لا نتحدث عادة عن الأفراد ونقتصر مناقشتنا على السمات التي تختلف داخل السكان.


نتائج

في هذا القسم ، نستخدم البيانات التجريبية والمحاكاة لنموذج اللعبة لإظهار أن معظم تقديرات التوريث المستعارة من علم الوراثة الكمي الكلاسيكي معرضة لتحيز كبير ، لأنها تتجاهل التغيير في التشابه بين شركاء الإرسال الناجم عن الداخل أو ينمذجته بشكل غير دقيق. - تطور المضيف للممرض. استنادًا إلى محاكاة نموذج اللعبة ، نحدد الارتباط داخل الصف في أقرب أزواج النشوء والتطور (CPPs) والوراثة التطورية ، H OU 2 (t ¯) ⁠ ، المقاسة بنموذج Ornstein – Uhlenbeck المختلط (POUMM) (Mitov and Stadler 2016 Blanquart et al. 2017) كأكثر التقديرات موثوقية لوراثة سمة الممرض. بناءً على تطبيق هذه المقدرات على مجموعة كبيرة من فيروس العوز المناعي البشري ، فإننا نؤسس حدًا أدنى للإرث lg (spVL).

من خلال بقية المقال ، نستخدم الرمز داي جاي للدلالة على المسافة التطورية بين نصيحتين ، أنا و ي، على شجرة الإرسال (الشكل 1). داي جاي يلخص المسافة التطورية الإجمالية بين مضيفين مصابين في لحظة قياس قيمة السمة ويتم قياسها بالبدائل لكل موقع للأشجار الحقيقية والوحدات الزمنية العشوائية للأشجار المحاكاة. نبدأ تقريرنا بنتيجة من بيانات فيروس نقص المناعة البشرية التي توضح أهمية التطور داخل المضيف لتقدير التوريث.

يتناقص ارتباط lg (spVL) في أزواج النشوء والتطور لفيروس العوز المناعي البشري مع داي جاي

استخدمنا تحليل التباين أحادي الاتجاه (ANOVA ، صأ) وعلاقة سبيرمان (صSp) لتقدير الارتباط في أزواج النشوء والتطور (PP) المستخرجة من شجرة انتقال تم نشرها مؤخرًا لـ 8483 مريضًا بفيروس نقص المناعة البشرية (Hodcroft et al. 2014). كما هو محدد في Shirreff et al. (2013) ، تمثل أزواج النشوء والتطور أزواجًا من النصائح في شجرة النقل الأقرب بشكل متبادل لبعضها البعض من خلال مسافة النشوء والتطور (داي جاي) ( رسم بياني 1). لقد طلبنا PPs بواسطة داي جاي وقسمهم إلى عشر طبقات متساوية الحجم (عشري) ، وتقييم الارتباط بين قيم سمات الزوج (صأ و صSp) في كل طبقة. يتم عرض تقديرات النقاط وفواصل الثقة 95٪ (CI) بنقاط سوداء وأرجوانية وأشرطة خطأ في الشكل 3. تشير الأشرطة الأفقية المتقطعة إلى 95٪ CI لـ صأ تقييمها على جميع أزواج النشوء والتطور. على الرغم من بعض المخالفات ، هناك نمط واضح من الانحلال في الارتباط - طبقات إلى اليسار (صغيرة داي جاي) تميل إلى أن تكون أعلى صأ القيم من الطبقات إلى اليمين (كبير داي جاي). قيم صأ تتطابق بشكل وثيق مع القيم من مقدرات الارتباط الأخرى ، مثل DR (ب) ومنتج بيرسون يعني الارتباط (ص) (النتائج غير معروضة). أجرينا انحدارات المربعات الصغرى العادية (OLS) للقيم r A و D k و r Sp و D k على متوسط ​​مسافة النشوء والتطور ، d i j ، k ¯ ⁠ ، في كل طبقة ، k = 1 ، ... ، 10 ⁠. كانت منحدرات كلا الانحدار سلبية بشكل ملحوظ (ص& lt0.05) وتظهر كخطوط سوداء وأرجوانية في الشكل 3. تم الحصول على منحدرات مماثلة عند استخدام طبقات أخرى من البيانات (الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت).

الارتباط بين قيم lg (spVL) في أزواج النشوء والتطور لفيروس العوز المناعي البشري. تظهر عينة من 1917 PPs مع قياسات lg (spVL) من مرضى فيروس نقص المناعة البشرية انخفاضًا في الارتباط (ICC) بين قيم السمات الزوجية كدالة لمسافة النشوء والتطور الزوجي داي جاي. يتم وصف تقديرات النقاط و 95٪ من مجالات الموثوقية في عشر طبقات متساوية الحجم (عشري) كنقاط وأشرطة خطأ موضوعة عند المتوسط داي جاي لكل طبقة ، d i j ¯ ⁠. تشير النقاط السوداء والأرجوانية مع أشرطة الخطأ إلى المقدرة صأ و صSp في البيانات الحقيقية. تشير الأشرطة الأفقية المتقطعة إلى 95٪ CI لـ صأ تقييمها على جميع أزواج النشوء والتطور. يشير الخط المائل باللونين الأسود والأرجواني إلى الانحدار الخطي للمربعات الصغرى لـ صأ و صSp في d i j ¯ ⁠. تشير النقاط البني والأخضر مع أشرطة الخطأ إلى القيم المقدرة لـ صأ تم الحصول عليها بعد استبدال قيم السمات الحقيقية على الشجرة بقيم تمت محاكاتها تحت أقصى احتمال ملائم لطرق PMM وطريقة POUMM ، على التوالي (متوسط ​​و 95٪ CI مقدرة من 100 مكررة). يُظهر الخط البني والأخضر الارتباط المتوقع بين أزواج الرؤوس على مسافة داي جاي، على النحو النموذجي تحت ML-fit من PMM و POUMM (مكافئ. 2 و 3). تصور المنطقة ذات اللون البني الفاتح والأخضر الفاتح الفواصل الزمنية للكثافة الخلفية العالية بنسبة 95٪ (HPD) المستنبطة من التوافق البايزي للنموذجين (المواد والطرق).

الارتباط بين قيم lg (spVL) في أزواج النشوء والتطور لفيروس العوز المناعي البشري. تظهر عينة من 1917 PPs مع قياسات lg (spVL) من مرضى فيروس نقص المناعة البشرية انخفاضًا في الارتباط (ICC) بين قيم السمات الزوجية كدالة لمسافة النشوء والتطور الزوجي داي جاي. يتم وصف تقديرات النقاط و 95٪ من مجالات الموثوقية في عشر طبقات متساوية الحجم (عشري) كنقاط وأشرطة خطأ موضوعة عند المتوسط داي جاي لكل طبقة ، d i j ¯ ⁠. تشير النقاط السوداء والأرجوانية مع أشرطة الخطأ إلى المقدرة صأ و صSp في البيانات الحقيقية. تشير الأشرطة الأفقية المتقطعة إلى 95٪ CI لـ صأ تقييمها على جميع أزواج النشوء والتطور. يشير الخط المائل الأسود والأرجواني إلى الانحدار الخطي للمربعات الصغرى لـ صأ و صSp في d i j ¯ ⁠. تشير النقاط البني والأخضر مع أشرطة الخطأ إلى القيم المقدرة لـ صأ تم الحصول عليها بعد استبدال قيم السمات الحقيقية على الشجرة بقيم تمت محاكاتها تحت أقصى احتمال ملائم لطرق PMM وطريقة POUMM ، على التوالي (متوسط ​​و 95٪ CI مقدرة من 100 مكررة). يظهر الخط البني والأخضر العلاقة المتوقعة بين أزواج الرؤوس على مسافة داي جاي، على النحو النموذجي تحت ML-fit من PMM و POUMM (مكافئ. 2 و 3). تصور المنطقة ذات اللون البني الفاتح والأخضر الفاتح الفواصل الزمنية للكثافة الخلفية العالية بنسبة 95٪ (HPD) المستنبطة من التوافق البايزي للنموذجين (المواد والطرق).

توضح النتيجة أعلاه أن قيمة مقدر التوريث على أساس الارتباط داخل أزواج النشوء والتطور (بما في ذلك الأزواج DR) تعتمد بشدة على داي جاي. قضية أخرى لجميع مقدر ح 2 باستخدام الارتباط في أزواج النشوء والتطور أو DR هو أن الأساليب الإحصائية الأساسية تتطلب الاستقلال بين الأزواج - يجب ألا تؤثر قيم السمات في زوج واحد أو ترتبط بقيم السمات في أي زوج آخر. هذا الافتراض غير صحيح بشكل عام ، بسبب علاقة النشوء والتطور بين جميع المرضى. تتمثل إحدى طرق التخفيف من آثار علاقة النشوء والتطور بين الأزواج في قصر التحليل على الأزواج الأقرب (أي الأزواج ، والتي داي جاي لا يتجاوز حد معين من قبل المستخدم). هذا النهج له عيب يتمثل في حذف الكثير من البيانات من التحليل. كبديل للاستفادة من الشجرة بأكملها ، من الممكن تصحيح علاقة النشوء والتطور باستخدام طريقة مقارنة النشوء والتطور (PCM). تحاول PCMs حل كلتا المشكلتين المذكورتين أعلاه ، لأنها 1) تدمج أطوال الفروع في شجرة النقل لنمذجة بنية التباين - التباين المشترك للبيانات و 2) تصحيح ارتباط النشوء والتطور عند تقدير المعلمات التطورية أو وراثة النشوء والتطور. سمة (Felsenstein 1985 Housworth et al. 2004 Alizon et al. 2010). تأتي مزايا PCMs بسعر افتراض عملية عشوائية محددة كنموذج لتطور السمات على طول الشجرة. في القسم الفرعي التالي ، نوضح أن افتراض عملية غير مناسبة لتطور السمات يمكن أن يسبب تحيزًا كبيرًا في تقدير التوريث النشئي.

لا يمكن لعملية الحركة البراونية إعادة إنتاج اضمحلال الارتباط في بيانات المملكة المتحدة

قمنا بتطبيق أقصى احتمالية وتناسب Bayesian لـ PMM (Lynch 1991 Housworth et al. 2004) وامتداده إلى نموذج Ornstein-Uhlenbeck للتطور (POUMM) (Hansen 1997 Mitov and Stadler 2016 Blanquart et al. 2017). تفترض PMM و POUMM نموذجًا مضافًا لقيم السمات ، z (t) = g (t) + e ⁠ ، حيث ض(ر) يمثل قيمة السمة في الوقت المناسب ر لنسب معين من الشجرة ، ز(ر) يمثل قيمة وراثية (وراثية) في الوقت المناسب ر لهذا النسب و ه يمثل مساهمة غير قابلة للتوريث تلخص آثار المضيف وبيئته / بيئتها على السمة وخطأ القياس. الاختلاف الوحيد بين النموذجين هو افتراضهم حول تطور ز(ر) على طول فروع الشجرة - تفترض PMM عملية حركة براونية تفترض POUMM عملية Ornstein-Uhlenbeck (Uhlenbeck and Ornstein 1930 Lande 1976 Hansen 1997).

باستخدام تقديرات الاحتمالية القصوى لمعلمات النموذج (الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت) ، قمنا بمحاكاة مسارات السمات العشوائية على شجرة المملكة المتحدة ، وتشغيل 100 تكرار لكل نموذج. لكل تكرار ، قدرنا الارتباط ، صأ، في PPs باستخدام القيم المحاكاة بدلاً من القيم الحقيقية. تظهر تقديرات الارتباط الناتجة في الشكل 3 كنقاط بنية وخضراء وأشرطة خطأ لمحاكاة PMM و POUMM ، على التوالي. نلاحظ وجود فرق كبير بين تقديرات الارتباط للنموذجين. على وجه الخصوص ، في العشرية أقصى اليسار ، يكون تقدير POUMM أعلى بكثير من تقدير PMM (POUMM 95٪ CI يستبعد تقدير PMM).

يأتي التقريب الأخير في المعادلة (5) من حقيقة أن المصطلح exp (- 8.35 + 36.47 dij) هو ما يقرب من 0 لمدى مسافات النشوء والتطور (⁠ dij ∈ [0 ، 0.14] ⁠) في شجرة المملكة المتحدة (انظر التكميلية) المعلومات ، المواد التكميلية عبر الإنترنت ، لمزيد من التفاصيل حول التقديرات المذكورة أعلاه).

تمثل المعادلتان (4) و (5) نموذجًا خطيًا وأسيًا للارتباط كدالة لـ داي جاي. قيم هذه المعادلات في داي جاي= 0 تساوي الوراثة التطورية المقدرة بمتوسط ​​مسافة طرف الجذر t ¯ تحت PMM و POUMM (تفاصيل عن ذلك لاحقًا). يساوي ميل النموذج الخطي (مكافئ 4) −0.36 (95٪ HPD [0.58 ، −0.21]). معدل الاضمحلال الأسي (مكافئ 5) يساوي معامل POUMM α= 28.78 (95٪ HPD [16.64، 46.93]) وعمر نصف التسوس يساوي ln ⁡ (2) / α = 0.02 بدائل لكل موقع (95٪ HPD [0.01، 0.04]).

يكشف رسم قيم المعادلتين (4) و (5) وفترات 95٪ من HPD على الشكل 3 بصريًا أن POUMM يناسب البيانات بشكل أفضل من PMM. إحصائيًا ، تم تأكيد ذلك من خلال معيار معلومات Akaike السفلي (AICc) لملاءمة POUMM وفاصل زمني إيجابي صارم لـ HPD لمعلمة OU α (الجدول التكميلي S1 والشكل S8 ، المواد التكميلية عبر الإنترنت). انحدار النموذج الخطي المشتق من تناسب PMM (مكافئ 4 ، الخط البني في الشكل 3) مسطح تقريبًا مقارنة بمنحدرات النمذجة OLS (الخطوط السوداء والأرجوانية في الشكل 3). لشرح ذلك ، نلاحظ أنه في PMM ، تم تصميم التباين المشترك في أزواج النشوء والتطور على مستوى السكان كوظائف خطية لمسافة الجذر- mrca (راي جاي) ومسافة طرف الجذر (ر) (البسط والمقام في المعادلة 2). الأهم من ذلك ، أن كلتا هاتين الدالتين الخطيتين مرتبطة بنفس معامل الانحدار ، σ 2. كما اتضح ، في بيانات المملكة المتحدة ، يزداد التباين والتباين بمعدلات مختلفة فيما يتعلق بـ راي جاي و ر (انظر الشكل التكميلي S2 والمعلومات التكميلية ، المواد التكميلية عبر الإنترنت). نستنتج أن PMM ليس نموذجًا مناسبًا للارتباط في أزواج النشوء والتطور ، غير قادر على نمذجة الفرق أعلاه في المعدلات.

في الحد d i j → 0 ، يجب أن يكون زوج النشوء والتطور مكافئًا للزوجين DR في لحظة الانتقال ، أي قبل أن تتباعد الأنماط الجينية في المضيفين بسبب التطور داخل المضيف. وبالتالي ، يبدو من المعقول استخدام تقدير الارتباط عند داي جاي= 0 كبديل للتوريث واسع المعنى ، ح 2 ، في جميع السكان. تم تطبيق هذه الفكرة في دراسات سابقة حول فيروس نقص المناعة البشرية (Hecht et al. 2010 Hollingsworth et al. 2010 Bachmann et al. 2017 Blanquart et al. 2017) وكذلك الملاريا (Anderson et al. 2010). تتمثل إحدى العوائق المحتملة لهذا النهج في إمكانية إدخال تحيز في العينة عن طريق ترشيح البيانات. على سبيل المثال ، إذا كانت الدراسة على سمة ، والتي تتطور نحو قيم أعلى أثناء مسار العدوى ، فإن المرضى الذين لديهم قيم سمات أقل يميلون إلى أن يكونوا أكثر تواترًا بين CPPs أكثر من السكان ككل. وبالتالي ، ليس هناك ما يضمن أن توزيع السمات ، وبالتالي ، التوريث المقاس في CPPs يساوي التوريث في جميع السكان. تؤثر مشكلة التحيز في أخذ العينات على كل من طرق المقارنة القائمة على التشابه وكذلك طرق المقارنة التطورية المستخدمة حاليًا. هذا يشير إلى أن نهج فرض عتبة على داي جاي أو تقدير الارتباط (صأ, صSp أو مقياس ارتباط آخر) في داي جاي= 0 يحتاج إلى مزيد من التحقق. في القسم الفرعي التالي ، نستخدم محاكاة نموذج اللعبة لإظهار أن تحيز أخذ العينات ، على الرغم من وجوده ، صغير نسبيًا فيما يتعلق بالتحيز السلبي بسبب تأخير القياس.

ANOVA-CPP و POUMM هما أقل مقدر للتوريث متحيزًا في محاكاة نماذج الألعاب

تجميع قيم السمات حسب النمط الجيني الممرض المتطابق. قمنا بتقييم معامل التحديد المعدل لحجم العينة المحدود ، R المجاور 2 ⁠ ، والارتباط داخل الصف (ICC) المقدّر باستخدام ANOVA أحادي الاتجاه ، r A [id] ⁠. يتمثل الاختلاف الرئيسي بين هذين المقدرين في افتراض ANOVA بأن وسائل المجموعة (القيم الوراثية) مأخوذة من توزيع من المحتمل أن يكون عددًا أكبر من الأنماط الجينية من تلك الموجودة في البيانات. على النقيض من ذلك ، تفترض R الصفة 2 أن جميع الأنماط الجينية في السكان موجودة في العينة. نظرًا لأن الافتراض الأخير صحيح بالنسبة للأوبئة التي تمت محاكاتها ، فإن الخيار R التالي يمثل القيمة المرجعية (الحقيقية) لـ ح 2 التي تتم مقارنة جميع التقديرات الأخرى.

الأزواج المعروفين DR. قمنا بتقييم منحدر انحدار المستلم على قيم المانحين بثلاث طرق: 1) ب- استنادًا إلى قيم السمات في لحظة تشخيص الإصابة 2) ب0- استنادًا إلى قيم السمات مباشرة بعد أحداث الإرسال و 3) b d i j ′ - استنادًا إلى العينة الفرعية للأزواج المشخصين لديهم داي جاي لا تتجاوز العتبة d i j ′ ⁠. بناءً على المفاضلة بين الدقة والتحيز ، حددنا d i j ′ = D 1 ، د1 للدلالة على العشر الأول في التوزيع التجريبي ل داي جاي (انظر المعلومات التكميلية ، المواد التكميلية على الإنترنت).

أزواج النشوء والتطور (PPs) في تي 10 ك ⁠. قمنا بتقييم المحكمة الجنائية الدولية باستخدام ANOVA بثلاث طرق: 1) صأ- على أساس جميع PPs 2) r A، D 1 - على أساس CPPs المعرفة على أنها PPs في T 10 k ذات داي جاي لا يتجاوز العشير الأول ، د1 و 3) ص أ ، 0 ، خط - التقاطع المقدر من الانحدار الخطي للقيم r A ، D k على القيم المتوسطة dij ، k في كل عشري ، k = 1 ، ... ، 10 ⁠ للمقدرين الأخيرين ، التي تحاول التقدير صأ في داي جاي= 0 ، نستخدم الاختصار ANOVA-CPP. كبديل لـ ANOVA ، وهو أكثر قوة للقيم المتطرفة (على سبيل المثال ، القيم القصوى عند ذيول توزيع السمات) ، قمنا بتقييم ارتباط سبيرمان في العشر الأول ، المشار إليه هنا بـ r Sp ، D 1 ⁠.

شجرة الإرسال تي 10 ك ⁠. قمنا بتقييم التوريث الوراثي بناءً على ملاءمة ML لنماذج PMM و POUMM. على وجه التحديد ، قمنا بمقارنة الصيغة الكلاسيكية التي تم تقييمها عند متوسط ​​مسافة طرف الجذر t ¯ في الشجرة (مكافئ 10 و 12) (Housworth et al. 2004 Leventhal and Bonhoeffer 2016) والصيغة التجريبية بناءً على تباين سمة العينة ، س 2 (ض) (مكافئ 11 و 13) (موصوف في المواد والطرق). بالنسبة إلى PMM ، نشير إلى هذه المقدرات بواسطة H BM 2 (t ¯) و H BM e 2 ⁠ لـ POUMM ، نستخدم الرموز H OU 2 (t ¯) و H OU e 2 ⁠:

يلخص الجدول 1 التعريف الرياضي وافتراضات التقديرات المذكورة أعلاه. يتم توفير وصف أكثر تفصيلاً لطرق PMM و POUMM في المواد والطرق. تعتبر الكتب المدرسية المرجعية حول الجينات الكمية (Lynch and Walsh 1998) مراجع ممتازة للطرق الأخرى.

المقدرون المختبرين للتوريث واسع النطاق لصفات العوامل الممرضة.

ادخال البيانات . طريقة (اختصار). الافتراضات . مقدر.
التجميع حسب سلالة إصابة متطابقة معامل التحديد المعدل تحتوي عينة البيانات على جميع الأنماط الجينية الموجودة في السكان R صفة 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
تحليل التباين أحادي الاتجاه (ANOVA) أخذ عينات مستقلة من الأنماط الجينية r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. قيم السمات داخل كل مجموعة
الفروق المتساوية داخل المجموعة (المثلية الجنسية)
الأزواج المتبرعون والمتلقون المعروفون انحدار المتبرع والمتلقي (DR) أخذ عينات بشكل مستقل من الأزواج المتبرعين والمتلقيين
التباين المتبقي المتساوي عبر نطاق قيم المانحين (المثلية الجنسية) b = s (z don، z rcp) s 2 (z don)، (8)
التباينات المتساوية بين الجهات المانحة والسكان المتغيرات: b ⁠، b 0 ⁠، b d i j ′
أزواج النشوء والتطور (PPs) ANOVA على جميع / أقرب PPs (ANOVA-PP ، ANOVA-CPP) افتراضات ANOVA (انظر أعلاه) مُعرَّفة كما في المعادلة (7) ، ولكنها محسوبة على PPs
المتغيرات: r A ⁠ ، r A ، d i j ′
ارتباط سبيرمان في جميع / الأقرب PPs PPs مستقلة عن بعضها البعض ارتباط بيرسون (يعني المنتج) ، محسوبًا على رتب قيم السمات.
المتغيرات: r Sp ⁠ ، r Sp ، d i j ′
الانحدار الخطي صأ تشغيل داي جاي على طبقات صأيعتمد خطيا على داي جايالتقاطع ، r A ، 0 ، l i n ⁠ ، من ملاءمة OLS للنموذج
التباين المتبقي المتساوي عبر النطاق داي جاي r A (d i j) = r A، 0، l i n + 1 d i j. (9)
شجرة الإرسال النموذج المختلط الوراثي (PMM) تطور BM المتفرعة H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. توزيع الانحراف البيئي ، e N (0، σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
نموذج مختلط من Ornstein – Uhlenbeck (POUMM) تطور OU المتفرعة H OU 2 (t ¯) = σ 2 (1 - exp (- 2 α t ¯)) σ 2 (1 - exp (- 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. الانحراف البيئي ، e N (0، σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)
ادخال البيانات . طريقة (اختصار). الافتراضات . مقدر.
التجميع حسب سلالة إصابة متطابقة معامل التحديد المعدل تحتوي عينة البيانات على جميع الأنماط الجينية الموجودة في السكان R صفة 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
تحليل التباين أحادي الاتجاه (ANOVA) أخذ عينات مستقلة من الأنماط الجينية r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. قيم السمات داخل كل مجموعة
الفروق المتساوية داخل المجموعة (المثلية الجنسية)
الأزواج المتبرعون والمتلقون المعروفون انحدار المتبرع والمتلقي (DR) أخذ عينات بشكل مستقل من الأزواج المتبرعين والمتلقيين
التباين المتبقي المتساوي عبر نطاق قيم المانحين (المثلية الجنسية) b = s (z don، z rcp) s 2 (z don)، (8)
التباينات المتساوية بين الجهات المانحة والسكان المتغيرات: b ⁠، b 0 ⁠، b d i j ′
أزواج النشوء والتطور (PPs) ANOVA على جميع / أقرب PPs (ANOVA-PP ، ANOVA-CPP) افتراضات ANOVA (انظر أعلاه) مُعرَّفة كما في المعادلة (7) ، ولكنها محسوبة على PPs
المتغيرات: r A ⁠ ، r A ، d i j ′
ارتباط سبيرمان في جميع / الأقرب PPs PPs مستقلة عن بعضها البعض ارتباط بيرسون (يعني المنتج) ، محسوبًا على رتب قيم السمات.
المتغيرات: r Sp ⁠ ، r Sp ، d i j ′
الانحدار الخطي صأ تشغيل داي جاي على طبقات صأيعتمد خطيا على داي جايالتقاطع ، r A ، 0 ، l i n ⁠ ، من ملاءمة OLS للنموذج
التباين المتبقي المتساوي عبر النطاق داي جاي r A (d i j) = r A، 0، l i n + 1 d i j. (9)
شجرة الإرسال النموذج المختلط الوراثي (PMM) تطور BM المتفرعة H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. توزيع الانحراف البيئي ، e N (0، σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
نموذج مختلط من Ornstein – Uhlenbeck (POUMM) تطور OU المتفرعة H OU 2 (t ¯) = σ 2 (1 - exp (- 2 α t ¯)) σ 2 (1 - exp (- 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. الانحراف البيئي ، e N (0، σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)

ملاحظة. - التدوين: s 2 (·) ⁠ ، عينة التباين s (· ، ·) ⁠ ، عينة التباين ن، عدد المرضى ك، عدد المجموعات المتميزة من المرضى ، أي الأنماط الجينية أو أزواج النشوء والتطور ض، القيم المقاسة G ^ ⁠ ، القيم الوراثية المقدرة: القيم المتوسطة من المرضى الذين يحملون نمطًا وراثيًا معينًا z don ، قيم المتبرعين z rcp ⁠ ، قيم المستلم MS e ⁠ ، مربع متوسط ​​داخل المجموعة: MS e = (zi - z ¯ ط) 2 N - K ⁠ ، أين ضأنا هي قيمة الفرد و z ¯ i هي القيمة المتوسطة للمجموعة التي ينتمي إليها الفرد MS b ⁠ ، مربع متوسط ​​بين المجموعة: MS b = ∑ (z ¯ i - z ¯) 2 K - 1 ⁠ ، حيث z تم تعريف ¯ i على النحو الوارد أعلاه و z ¯ هي القيمة المتوسطة للسكان ن، المتوسط ​​المرجح لعدد المرضى في مجموعة ، أي ، ن= 2 لأزواج النشوء والتطور و n = (N - ∑ n i 2 N) / (K - 1) للمجموعات ذات الحجم المتغير α, σ, σه: معلمات PMM / POUMM (الموضحة في المواد والطرق).

i.i.n.d. مستقلة وموزعة بشكل طبيعي داي جاي، مسافة النشوء والتطور بين أزواج المتبرعين والمتلقيين أو أزواج النشوء والتطور d i j ′ ، الحد الأقصى داي جاي (انظر النص).

المقدرون المختبرين للتوريث واسع النطاق لصفات العوامل الممرضة.

ادخال البيانات . طريقة (اختصار). الافتراضات . مقدر.
التجميع حسب سلالة إصابة متطابقة معامل التحديد المعدل تحتوي عينة البيانات على جميع الأنماط الجينية الموجودة في السكان R صفة 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
تحليل التباين أحادي الاتجاه (ANOVA) أخذ عينات مستقلة من الأنماط الجينية r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. قيم السمات داخل كل مجموعة
الفروق المتساوية داخل المجموعة (المثلية الجنسية)
الأزواج المتبرعون والمتلقون المعروفون انحدار المتبرع والمتلقي (DR) أخذ عينات بشكل مستقل من الأزواج المتبرعين والمتلقيين
التباين المتبقي المتساوي عبر نطاق قيم المانحين (المثلية الجنسية) b = s (z don، z rcp) s 2 (z don)، (8)
التباينات المتساوية بين الجهات المانحة والسكان المتغيرات: b ⁠، b 0 ⁠، b d i j ′
أزواج النشوء والتطور (PPs) ANOVA على جميع / أقرب PPs (ANOVA-PP ، ANOVA-CPP) افتراضات ANOVA (انظر أعلاه) مُعرَّفة كما في المعادلة (7) ، ولكنها محسوبة على PPs
المتغيرات: r A ⁠ ، r A ، d i j ′
ارتباط سبيرمان في جميع / الأقرب PPs PPs مستقلة عن بعضها البعض ارتباط بيرسون (يعني المنتج) ، محسوبًا على رتب قيم السمات.
المتغيرات: r Sp ⁠ ، r Sp ، d i j ′
الانحدار الخطي صأ تشغيل داي جاي على طبقات صأيعتمد خطيا على داي جايالتقاطع ، r A ، 0 ، l i n ⁠ ، من ملاءمة OLS للنموذج
التباين المتبقي المتساوي عبر النطاق داي جاي r A (d i j) = r A، 0، l i n + ω 1 d i j. (9)
شجرة الإرسال النموذج المختلط الوراثي (PMM) تطور BM المتفرعة H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. توزيع الانحراف البيئي ، e N (0، σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
نموذج مختلط من Ornstein – Uhlenbeck (POUMM) تطور OU المتفرعة H OU 2 (t ¯) = σ 2 (1 - exp (- 2 α t ¯)) σ 2 (1 - exp (- 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. الانحراف البيئي ، e N (0، σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)
ادخال البيانات . طريقة (اختصار). الافتراضات . مقدر.
التجميع حسب سلالة إصابة متطابقة معامل التحديد المعدل تحتوي عينة البيانات على جميع الأنماط الجينية الموجودة في السكان R صفة 2 = 1 - N - 1 N - K s 2 (z - G ^) s 2 (z) (6)
تحليل التباين أحادي الاتجاه (ANOVA) أخذ عينات مستقلة من الأنماط الجينية r A [id] = (M S b - M S e) / n (M S b - M S e) / n + M S e (7)
i.i.n.d. قيم السمات داخل كل مجموعة
الفروق المتساوية داخل المجموعة (المثلية الجنسية)
الأزواج المتبرعون والمتلقون المعروفون انحدار المتبرع والمتلقي (DR) أخذ عينات بشكل مستقل من الأزواج المتبرعين والمتلقيين
التباين المتبقي المتساوي عبر نطاق قيم المانحين (المثلية الجنسية) b = s (z don، z rcp) s 2 (z don)، (8)
التباينات المتساوية بين الجهات المانحة والسكان المتغيرات: b ⁠، b 0 ⁠، b d i j ′
أزواج النشوء والتطور (PPs) ANOVA على جميع / أقرب PPs (ANOVA-PP ، ANOVA-CPP) افتراضات ANOVA (انظر أعلاه) مُعرَّفة كما في المعادلة (7) ، ولكنها محسوبة على PPs
المتغيرات: r A ⁠ ، r A ، d i j ′
ارتباط سبيرمان في جميع / الأقرب PPs PPs مستقلة عن بعضها البعض ارتباط بيرسون (يعني المنتج) ، محسوبًا على رتب قيم السمات.
المتغيرات: r Sp ⁠ ، r Sp ، d i j ′
الانحدار الخطي صأ تشغيل داي جاي على طبقات صأيعتمد خطيا على داي جايالتقاطع ، r A ، 0 ، l i n ⁠ ، من ملاءمة OLS للنموذج
التباين المتبقي المتساوي عبر النطاق داي جاي r A (d i j) = r A، 0، l i n + 1 d i j. (9)
شجرة الإرسال النموذج المختلط الوراثي (PMM) تطور BM المتفرعة H BM 2 (t ¯) = t ¯ σ 2 / (t ¯ σ 2 + σ e 2) (10)
i.i.n.d. توزيع الانحراف البيئي ، e N (0، σ e 2) H BM e 2 = 1 - σ e 2 / s 2 (z) (11)
نموذج مختلط من Ornstein – Uhlenbeck (POUMM) تطور OU المتفرعة H OU 2 (t ¯) = σ 2 (1 - exp (- 2 α t ¯)) σ 2 (1 - exp (- 2 α t ¯)) + 2 α σ e 2 (12)
i.i.n.d. الانحراف البيئي ، e N (0، σ e 2) H OU e 2 = 1 - σ e 2 / s 2 (z) (13)

ملاحظة. - التدوين: s 2 (·) ⁠ ، عينة التباين s (· ، ·) ⁠ ، عينة التباين ن، عدد المرضى ك، عدد المجموعات المتميزة من المرضى ، أي الأنماط الجينية أو أزواج النشوء والتطور ض، القيم المقاسة G ^ ⁠ ، القيم الوراثية المقدرة: القيم المتوسطة من المرضى الذين يحملون نمطًا وراثيًا معينًا z don ، قيم المتبرعين z rcp ⁠ ، قيم المستلم MS e ⁠ ، مربع متوسط ​​داخل المجموعة: MS e = (zi - z ¯ ط) 2 N - K ⁠ ، أين ضأنا هي قيمة الفرد و z ¯ i هي القيمة المتوسطة للمجموعة التي ينتمي إليها الفرد MS b ⁠ ، مربع متوسط ​​بين المجموعة: MS b = ∑ (z ¯ i - z ¯) 2 K - 1 ⁠ ، حيث z يتم تعريف ¯ i على النحو الوارد أعلاه و z ¯ هو متوسط ​​القيمة السكانية ن، المتوسط ​​المرجح لعدد المرضى في مجموعة ، أي ، ن= 2 لأزواج النشوء والتطور و n = (N - ∑ n i 2 N) / (K - 1) للمجموعات ذات الحجم المتغير α, σ, σه: معلمات PMM / POUMM (الموضحة في المواد والطرق).

i.i.n.d. مستقلة وموزعة بشكل طبيعي داي جاي، مسافة النشوء والتطور بين أزواج المتبرعين والمتلقيين أو أزواج النشوء والتطور d i j ′ ، الحد الأقصى على داي جاي (انظر النص).

ضمن: محايد / بين: محايد

ضمن: تحديد / بين: محايد

ضمن: محايد / بين: حدد

ضمن: حدد / بين: حدد

لكل من هذه السيناريوهات ومتوسط ​​فترة الاتصال 1 / κ ∈ <2 ، 4 ، 6 ، 8 ، 10 ، 12> (وحدات زمنية عشوائية) ، قمنا بتنفيذ عشر عمليات محاكاة أدت إلى إجمالي 4 × 6 × 10 = 240 محاكاة. من بين 240 عملية محاكاة ، أسفرت 175 حالة عن تفشي وباء لما لا يقل عن 10000 عائل تم تشخيصه. لكل تفشٍ ، قمنا بتحليل تجمعات أول ما يصل إلى 10000 مضيف تم تشخيصه.

تؤدي أحداث الإرسال النادرة (أكبر 1 / κ ⁠) إلى أشجار إرسال أطول ، وبالتالي ، متوسط ​​مسافة نسج أطول بين الأطراف ، داي جاي (الشكل التكميلي S3 ، المواد التكميلية عبر الإنترنت). وقد أتاح ذلك توضيح تأثير تراكم التطور داخل العائل على مقدرات التوريث المختلفة (شكل 4).

تقديرات التوريث في محاكاة نماذج الألعاب. (ميلادي) ح 2 - تقديرات في محاكاة ديناميكيات "محايدة" و "تحديد" داخل / بين المضيف. تلخص كل مجموعة من شعيرات الصندوق عمليات المحاكاة لسيناريو ثابت وفاصل اتصال ، 1 / ​​κ مربعات بيضاء (الخلفية) تشير إلى التوريث الحقيقي ، والمربعات الملونة تشير إلى التقديرات (المقدمة). يتم تقييم الدلالة الإحصائية من خلال ر- الاختبارات ملخصة في الجدول 2.

تقديرات التوريث في محاكاة نماذج الألعاب. (ميلادي) ح 2 - تقديرات في محاكاة ديناميكيات "محايدة" و "تحديد" داخل / بين المضيف. تلخص كل مجموعة من شعيرات الصندوق عمليات المحاكاة لسيناريو ثابت وفاصل اتصال ، 1 / ​​κ مربعات بيضاء (الخلفية) تشير إلى التوريث الحقيقي ، والمربعات الملونة تشير إلى التقديرات (المقدمة). يتم تقييم الدلالة الإحصائية من خلال ر- الاختبارات ملخصة في الجدول 2.

يوضح الشكل 4 أن المقدرات b D 1 ⁠ و b و r A و D 1 و r A منحازة بشكل سلبي بشكل عام لجميع سيناريوهات نماذج الألعاب. يميل هذا التحيز إلى الزيادة مع متوسط ​​فاصل الاتصال ، 1 / ​​κ (على التوالي ، داي جاي) ، لأن الطفرة العشوائية داخل المضيف تميل إلى تقليل التداخل الجيني بين DRs وأزواج النشوء والتطور (الشكل التكميلي S4 ، المواد التكميلية عبر الإنترنت). كان التحيز السلبي أقل وضوحًا عند فرض عتبة داي جاي لكن هذا جاء على حساب الدقة (قطع أقل تحيزًا ولكن أطول لصندوق الطولي لـ b D 1 و r A ، D 1 مقارنةً بـ ب و صأ) (الشكل 4). تم الكشف عن عدة مصادر إضافية للتحيز عند النظر في التقديرات غير المتوفرة عمليا ب0 و r A [i d] ⁠. المقدر r A [المعرف] كان متحيزًا بشكل إيجابي بسبب العدد الصغير للأنماط الجينية المحاكاة (ستة فقط) - تم التحقق من صحة هذا من خلال عمليات محاكاة إضافية توضح أن r A [المعرف] يتقارب مع القيمة الحقيقية لعدد أكبر قليلاً من الأنماط الجينية (على سبيل المثال و ك≥24 نوعًا وراثيًا ، انظر المعلومات التكميلية ، المواد التكميلية عبر الإنترنت). المقدر ب0 كان يتصرف بدقة في السيناريو المحايد / المحايد (باستثناء فترات الاتصال القصيرة جدًا) ولكنه يميل إلى التحيز في كلا الاتجاهين في جميع السيناريوهات التي تتضمن الاختيار. كان السبب الرئيسي لهذه التحيزات هو ظاهرة "تحيز أخذ العينات" الذي يتكون من اختلاف بين توزيعات القيم المقاسة في أزواج DR والسكان المعنيين. على الرغم من أن حجمها كان صغيرًا نسبيًا في عمليات المحاكاة ، فإننا نفترض أن تحيز أخذ العينات يمكن أن يلعب دورًا مهمًا في التطبيقات البيولوجية الحقيقية.لقد قدمنا ​​بالفعل مثالاً على هذا التحيز في القسم الفرعي السابق. مظهر آخر من مظاهر التحيز في أخذ العينات هو حقيقة ذلك ب0 لا يقضي تمامًا على تأثير التطور داخل المضيف (والاختيار) في الجهات المانحة. لهذا السبب ، في حالات الاختيار ، يميل التباين الظاهري في المتبرعين إلى أن يكون أصغر من التباين في المتلقين وكذلك التباين في السكان (الشكل التكميلي S5 ، المواد التكميلية عبر الإنترنت). يتم توفير تفاصيل إضافية حول هذه المصادر المحتملة للتحيز في المعلومات التكميلية ، المواد التكميلية عبر الإنترنت.

علاوة على ذلك ، أظهرت عمليات المحاكاة أن التوافق المتدهور لنموذج BM على أشجار الإرسال الأطول تسبب في تقدير مبالغ فيه للانحراف البيئي ، σ e ⁠ ، في PMM ، وبالتالي ، انحياز سلبي في H BM 2 (t ¯) و H BM e 2 (قارن تقديرات القيم الصغيرة والكبيرة لـ 1 / κ في الشكل 4 والشكل التكميلي S6 ج، المواد التكميلية على الإنترنت). على النقيض من PMM ، كانت تقديرات POUMM ، H OU 2 (t ¯) و H OU e 2 أكثر دقة وكانت قيمة σ e في تناسب POUMM ML تطابق تقريبًا الانحراف الحقيقي غير القابل للتوريث في معظم عمليات المحاكاة (الشكل. 4 والتين التكميلي S6 ج، المواد التكميلية على الإنترنت). تم تأكيد توافق ML الأفضل لـ POUMM من خلال دعم إحصائي أقوى ، أي من خلال قيم AICc المنخفضة في جميع عمليات محاكاة نماذج الألعاب (الشكل التكميلي S6) د، المواد التكميلية على الإنترنت).

حقيقة أن POUMM تفوقت على PMM في جميع السيناريوهات تتناقض مع الاعتقاد الأولي بأن PMM يجب أن يكون النموذج الأكثر ملاءمة لسمات متطورة بشكل محايد يمثلها السيناريو المحايد / المحايد ، في حين أن POUMM يجب أن تتناسب بشكل أفضل مع السيناريوهات التي تنطوي على الاختيار. كان من غير المنطقي أيضًا أن المعلمة المستنبطة α من نموذج POUMM كان إيجابيًا بشكل ملحوظ في جميع عمليات المحاكاة بما في ذلك السيناريو المحايد / المحايد (الشكل التكميلي S6 ب، المواد التكميلية على الإنترنت). لفهم هذه الظاهرة بشكل أفضل ، أجرينا تحليل التقسيم الطبقي PP على بيانات نموذج اللعبة (الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت). كشف هذا عن نمط من الارتباط يتلاشى بشكل كبير مع داي جاي. كان شكل الانحلال الأسي واضحًا في الغالب لفترات تلامس أطول ، 1 / ​​κ ⁠ ، خاصة في السيناريو المحايد / المحايد (العمود الأول في الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت). في المعلومات التكميلية ، المواد التكميلية عبر الإنترنت ، نظهر أن ارتباط النمط الظاهري المتحلل بشكل كبير يتوافق مع النمط الوراثي الطافر بشكل محايد بموجب نموذج استبدال Jukes-Cantor (Yang 2006). كان تحلل الارتباط لا يزال موجودًا في السيناريوهات التي تتضمن الاختيار داخل و / أو بين المضيف ولكن النمط الملحوظ كان غير منتظم إلى حد ما وينحرف عن دالة أسية لـ داي جاي (الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت). في معظم الحالات ، كان ملاءم ML لطريقة PMM مناسبًا لاضمحلال الارتباط (النقاط البنية وأشرطة الخطأ في الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت) لفترات تلامس أطول ، كان هناك ميل نحو قيم ثابتة لـ الارتباط تحت PMM أقل بكثير من القيمة الحقيقية (النقاط البنية وأشرطة الخطأ في الشكل التكميلي S7 ، المواد التكميلية عبر الإنترنت). هذا يفسر الدقة الإجمالية الأفضل لـ POUMM مقابل طريقة PMM.

يوضح الجدول 2 متوسط ​​التحيز لكل مقدر تم اختباره لكل من السيناريوهات الأربعة. نستنتج أنه ، بصرف النظر عن المقدرات التي يتعذر الوصول إليها عمليا على أساس التجميع حسب النمط الوراثي المتطابق (⁠ R ، 2 و r A [معرف] ⁠) ، فإن أكثر التقديرات دقة ح 2 في محاكاة نموذج اللعبة هي H OU 2 (t ¯) و H OU e 2 متبوعة بمقدرات الارتباط في PPs لتقليل مسافة النشوء والتطور داي جاي، أي (⁠ r A ، D 1 ⁠ ، r A ، 0 ، l i n ⁠ ، r Sp ، D 1). في القسم الفرعي التالي ، قمنا بالإبلاغ عن نتائج هذه التقديرات في بيانات فيروس نقص المناعة البشرية في المملكة المتحدة.

متوسط ​​الفرق H 2 ̂ - R المجاور 2 من محاكاة نماذج اللعبة المجمعة حسب السيناريو.

داخل: . حيادي . حيادي . يختار . يختار .
بين: . حيادي . يختار . حيادي . يختار .
ن50 41 47 37
ب 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
ب د 1 −0.07 ** −0.04 ** 0 −0.01
ب−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
ص أ ، 0 ، ل أنا ن ^ −0.05 ** −0.06 ** 0.01 −0.04 **
ص أ ، د 1 −0.05 ** −0.06 ** 0 −0.03 *
ص أ −0.18 ** −0.15 ** −0.06 ** −0.08 **
ص س ، د 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (ر ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **
داخل: . حيادي . حيادي . يختار . يختار .
بين: . حيادي . يختار . حيادي . يختار .
ن50 41 47 37
ب 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
ب د 1 −0.07 ** −0.04 ** 0 −0.01
ب−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
ص أ ، 0 ، ل أنا ن ^ −0.05 ** −0.06 ** 0.01 −0.04 **
ص أ ، د 1 −0.05 ** −0.06 ** 0 −0.03 *
ص أ −0.18 ** −0.15 ** −0.06 ** −0.08 **
ص س ، د 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (ر ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **

ملاحظة - تقدر الأهمية الإحصائية بواسطة Student ر-الاختبارات ، ص القيم التي يُشار إليها بعلامة النجمة على النحو التالي: * ص& lt0.01 **ص& lt0.001. تشير الخلفية الرمادية إلى تقديرات غير متوفرة عمليًا.

متوسط ​​الفرق H 2 ̂ - R المجاور 2 من محاكاة نماذج اللعبة المجمعة حسب السيناريو.

داخل: . حيادي . حيادي . يختار . يختار .
بين: . حيادي . يختار . حيادي . يختار .
ن50 41 47 37
ب 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
ب د 1 −0.07 ** −0.04 ** 0 −0.01
ب−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
ص أ ، 0 ، ل أنا ن ^ −0.05 ** −0.06 ** 0.01 −0.04 **
ص أ ، د 1 −0.05 ** −0.06 ** 0 −0.03 *
ص أ −0.18 ** −0.15 ** −0.06 ** −0.08 **
ص س ، د 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (ر ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **
داخل: . حيادي . حيادي . يختار . يختار .
بين: . حيادي . يختار . حيادي . يختار .
ن50 41 47 37
ب 0 −0.01 * −0.02 ** 0.05 ** 0.04 **
ب د 1 −0.07 ** −0.04 ** 0 −0.01
ب−0.25 ** −0.2 ** −0.07 ** −0.06 **
r A [i d] 0.05 ** 0.05 ** 0.08 ** 0.06 **
ص أ ، 0 ، ل أنا ن ^ −0.05 ** −0.06 ** 0.01 −0.04 **
ص أ ، د 1 −0.05 ** −0.06 ** 0 −0.03 *
ص أ −0.18 ** −0.15 ** −0.06 ** −0.08 **
ص س ، د 1 −0.05 ** −0.05 ** −0.05 ** −0.07 **
H BM 2 (ر ¯) −0.17 ** −0.17 ** −0.01 −0.04 *
H BM e 2 −0.28 ** −0.24 ** −0.12 ** −0.16 **
H OU 2 (t ¯) −0.01 −0.02 ** 0.01 * 0.03 **
H OU e 2 −0.01 −0.02 ** 0.01 * 0.03 **

ملاحظة - تقدر الأهمية الإحصائية بواسطة Student ر-الاختبارات ، ص القيم التي يُشار إليها بعلامة النجمة على النحو التالي: * ص& lt0.01 **ص& lt0.001. تشير الخلفية الرمادية إلى تقديرات غير متوفرة عمليًا.

Heratibality of lg (spVL) في مجموعة HIV في المملكة المتحدة

قمنا بتقييم الارتباط في CPPs (ارتباط ANOVA و Spearman) في البيانات من مجموعة HIV في المملكة المتحدة التي تضم قياسات lg (spVL) وشجرة من الفيروسية (بول) متواليات من 8483 مريضًا تم استنتاجها سابقًا في (Hodcroft et al. 2014). بالإضافة إلى ذلك ، أجرينا ملاءمة Bayesian لطرق POUMM و PMM لنفس البيانات. كان الهدف هو اختبار استنتاجاتنا على مجموعة بيانات حقيقية ومقارنة ح 2 - تقديرات من CPPs و POUMM إلى تقديرات PMM / ReML السابقة على نفس البيانات بالضبط (Hodcroft et al. 2014).

عند تطبيق ANOVA-CPP ، كانت الخطوة الأولى هي تحديد مسافة النشوء والتطور لتعريف CPPs. تحقيقا لهذه الغاية ، استكشفنا طبقات مختلفة من PPs كما هو موضح في الشكل التكميلي S1 ب، والمواد التكميلية عبر الإنترنت ، ومخطط مبعثر لمسافات النشوء والتطور مقابل الاختلافات المظهرية المطلقة ، | Δ lg ⁡ (spVL) | (الشكل 5 أ). كشف هذا عن مجموعة صغيرة من 116 PPs لها d i j ≤ 10-4 وتتزامن بصعوبة مع الوقفة الأولى (وتسمى أيضًا 20-quantile أو ventile) من داي جاي. كانت مسافة النشوء والتطور في جميع أزواج الأطراف المتبقية أكبر من مرتبة من حيث الحجم ، أي d i j & gt 10 - 3. بالنظر إلى أن المسافة التطورية على شجرة النقل تقاس بالبدائل لكل موقع وطول بول-المنطقة بترتيب 10 3 مواقع ، نفترض أن المجموعة المذكورة أعلاه المكونة من 116 PP تتوافق مع مجموعة من 116 زوجًا من متطابقة بول تسلسل الإجماع (لم تتوفر بيانات تسلسل للتحقق من ذلك). بناءً على هذه الملاحظة ، حددنا الأزواج المذكورة أعلاه على أنها CPPs وتم تعيين العتبة رسميًا على d i j ′ = 10-4 ⁠. تحققنا من أن CPPs تم توزيعها عشوائيًا على طول الشجرة (الشكل 5 ب). يشير التوزيع العشوائي لـ CPPs على طول شجرة الإرسال إلى أن أزواج النشوء والتطور هذه تتوافق مع الاكتشافات المبكرة للعدوى التي تحدث بشكل عشوائي (قيم السمات من كل زوج تم تصويره على شكل مقاطع أرجوانية في الشكل 5 ب). للتحقق من أن تصفية البيانات ، لم تقدم تحيزًا كبيرًا في أخذ العينات بسبب الاختيار (انظر القسم الفرعي السابق) ، تحققنا أيضًا من عدم وجود اختلاف جوهري في توزيعات السمات لجميع المرضى ، و PPs و CPPs (الشكل. 5 ج).

أزواج النشوء والتطور في بيانات lg (spVL) من المملكة المتحدة. (أ) مخطط مبعثر للمسافات التطورية بين أزواج من الأطراف مقابل الاختلافات المظهرية المطلقة: رمادي ، PPs (⁠ d i j & gt 10-4 ⁠) أرجواني ، CPPs (⁠ d i j & lt 10-4 ⁠). يُظهر الخط الأسود الانحدار الخطي لـ | Δ lg ⁡ (spVL) | تشغيل داي جاي (كان منحدر الانحدار موجبًا إحصائيًا عند مستوى 0.01). (ب) مخطط مربع يمثل توزيع السمات على طول شجرة الإرسال. يمثل كل شارب صندوقي توزيع lg (spVL) للمرضى مجمعين حسب المسافة من جذر الشجرة المقاسة بالبدائل لكل موقع. تشير المربعات الأوسع إلى مجموعات أكبر في الحجم. تشير المقاطع باللون الأرجواني إلى قيم lg (spVL) في CPPs. (ج) مخطط مربع لتوزيع lg (spVL) في جميع المرضى (أسود) و PPs (رمادي) و CPPs (أرجواني).

أزواج النشوء والتطور في بيانات lg (spVL) من المملكة المتحدة. (أ) مخطط مبعثر للمسافات التطورية بين أزواج من الأطراف مقابل الاختلافات المظهرية المطلقة: رمادي ، PPs (⁠ d i j & gt 10-4 ⁠) أرجواني ، CPPs (⁠ d i j & lt 10-4 ⁠). يظهر الخط الأسود الانحدار الخطي لـ | Δ lg ⁡ (spVL) | تشغيل داي جاي (كان منحدر الانحدار موجبًا إحصائيًا عند مستوى 0.01). (ب) مخطط مربع يمثل توزيع السمات على طول شجرة الإرسال. يمثل كل شارب صندوقي توزيع lg (spVL) للمرضى مجمعين حسب المسافة من جذر الشجرة المقاسة بالبدائل لكل موقع. تشير المربعات الأوسع إلى مجموعات أكبر في الحجم. تشير المقاطع باللون الأرجواني إلى قيم lg (spVL) في CPPs. (ج) مخطط مربع لتوزيع lg (spVL) في جميع المرضى (أسود) و PPs (رمادي) و CPPs (أرجواني).

ANOVA-CPPs (⁠ r A ، D 1 ، r A ، 10-4 ، r A ، V 1 ⁠) وطريقة PP الأصلية صأ

التقاطع من الانحدار الخطي لـ صأ تشغيل داي جاي عند التقسيم الطبقي لـ PPs إلى عشري (⁠ r A ، 0 ، l i n ⁠ ، مكافئ 9)

ارتباط سبيرمان في CPPs (⁠ r Sp ، D 1 ⁠ ، r Sp ، 10 - 4 ⁠ ، r Sp ، V 1 ⁠) وفي جميع PP (⁠ r Sp ⁠).

التقاطع من الانحدار الخطي لـ r Sp on داي جاي عند التقسيم الطبقي لـ PPs إلى شرائح عشرية (⁠ r Sp ، 0 ، l i n ⁠)

POUMM (⁠ H OU 2 (t ¯) ⁠ ، H OU e 2 ⁠) ، مقابل PMM (⁠ H BM 2 (t ¯) ⁠ ، H BM e 2 ⁠) على الشجرة بأكملها

تم الإبلاغ عن نتائج هذه التحليلات في الجدول 3. تقديرات الارتباط ANOVA- و Spearman ، التي قللت من مسافة النشوء والتطور عن طريق الانحدار أو الترشيح للأزواج النشوء والتطور لها تقديرات نقطية لـ r A ، 10-4 = 0.17 و r Sp ، 10-4 = 0.22 أوم. يمكن تفسير التقدير الأعلى قليلاً لارتباط سبيرمان من خلال وجود القيم المتطرفة في البيانات. أبلغ تطبيق POUMM على الشجرة بأكملها عن تقدير نقطة H OU 2 (t ¯) = 0.21 (8483 مريضًا ، 95٪ CI [0.14 ، 0.29]).

تقديرات lg (spVL) -Heritability في بيانات فيروس نقص المناعة البشرية من المملكة المتحدة.

طريقة . ن . ح ^ 2. 95٪ CI. 95٪ HPD.
الانحدار الخطي صأ على d i j ¯ في الفئات العشرية (مكافئ 9) (⁠ r A، 0، l i n ⁠) 10 نقاط 0.17 [0.09, 0.24]
الانحدار الخطي صSp على d i j ¯ في الفئات العشرية (⁠ r Sp، 0، l i n ⁠) 10 نقاط 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A ، V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ ص أ ، 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A ، D 1) 384 0.16 [0.06, 0.25]
ANOVA-PP (صأ) أ 3,834 0.11 [0.08, 0.14]
سبيرمان- CPP (⁠ r Sp ، V 1 ⁠) 224 0.23 [0.05, 0.42]
سبيرمان- CPP (⁠ r Sp ، 10-4 ⁠) 232 0.22 [0.03, 0.4]
سبيرمان- CPP (⁠ r Sp ، D 1 ⁠) 384 0.2 [0.06, 0.34]
سبيرمان- ب ب (صSp) أ 3,834 0.11 [0.06, 0.15]
بوم (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
بوم (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) ب 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) ب 8,483 0.06 [0.02, 0.1]
PMM ، ReML (Hodcroft وآخرون 2014) ب 8,483 0.06 [0.03, 0.09]
طريقة . ن . ح ^ 2. 95٪ CI. 95٪ HPD.
الانحدار الخطي صأ على d i j ¯ في الفئات العشرية (مكافئ 9) (⁠ r A، 0، l i n ⁠) 10 نقاط 0.17 [0.09, 0.24]
الانحدار الخطي صSp على d i j ¯ في الفئات العشرية (⁠ r Sp، 0، l i n ⁠) 10 نقاط 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A ، V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ ص أ ، 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A ، D 1) 384 0.16 [0.06, 0.25]
ANOVA-PP (صأ) أ 3,834 0.11 [0.08, 0.14]
سبيرمان- CPP (⁠ r Sp ، V 1 ⁠) 224 0.23 [0.05, 0.42]
سبيرمان- CPP (⁠ r Sp ، 10-4 ⁠) 232 0.22 [0.03, 0.4]
سبيرمان- CPP (⁠ r Sp ، D 1 ⁠) 384 0.2 [0.06, 0.34]
سبيرمان- ب ب (صSp) أ 3,834 0.11 [0.06, 0.15]
بووم (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
بوم (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) ب 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) ب 8,483 0.06 [0.02, 0.1]
PMM ، ReML (Hodcroft وآخرون 2014) ب 8,483 0.06 [0.03, 0.09]

ملاحظة —- مكتوبة أيضًا نتائج تحليل سابق على نفس مجموعة البيانات (Hodcroft et al. 2014). "-": لم يتم التحليل في الدراسة المذكورة. الخلفية الرمادية: تعتبر التقديرات غير موثوقة بسبب: انحياز سلبي ناتج عن تأخيرات في القياس وتحيز سلبي ناتج عن انتهاك BM. يتم التعبير عن عدم اليقين في التقديرات من حيث فترات الثقة 95 ٪ (CI) ، أو ، في حالة الاستدلال البايزي ، بنسبة 95 ٪ من فترات الكثافة الخلفية العالية (HPDs).

تقديرات lg (spVL) -Heritability في بيانات فيروس نقص المناعة البشرية من المملكة المتحدة.

طريقة . ن . ح ^ 2. 95٪ CI. 95٪ HPD.
الانحدار الخطي صأ على d i j ¯ في الفئات العشرية (مكافئ 9) (⁠ r A، 0، l i n ⁠) 10 نقاط 0.17 [0.09, 0.24]
الانحدار الخطي صSp على d i j ¯ في الفئات العشرية (⁠ r Sp، 0، l i n ⁠) 10 نقاط 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A ، V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ ص أ ، 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A ، D 1) 384 0.16 [0.06, 0.25]
ANOVA-PP (صأ) أ 3,834 0.11 [0.08, 0.14]
سبيرمان- CPP (⁠ r Sp ، V 1 ⁠) 224 0.23 [0.05, 0.42]
سبيرمان- CPP (⁠ r Sp ، 10-4 ⁠) 232 0.22 [0.03, 0.4]
سبيرمان- CPP (⁠ r Sp ، D 1 ⁠) 384 0.2 [0.06, 0.34]
سبيرمان- ب ب (صSp) أ 3,834 0.11 [0.06, 0.15]
بووم (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
بوم (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) ب 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) ب 8,483 0.06 [0.02, 0.1]
PMM ، ReML (Hodcroft وآخرون 2014) ب 8,483 0.06 [0.03, 0.09]
طريقة . ن . ح ^ 2. 95٪ CI. 95٪ HPD.
الانحدار الخطي صأ على d i j ¯ في الفئات العشرية (مكافئ 9) (⁠ r A، 0، l i n ⁠) 10 نقاط 0.17 [0.09, 0.24]
الانحدار الخطي صSp على d i j ¯ في الفئات العشرية (⁠ r Sp، 0، l i n ⁠) 10 نقاط 0.18 [0.11, 0.25]
ANOVA-CPP (⁠ r A ، V 1 ⁠) 224 0.17 [−0.02, 0.31]
ANOVA-CPP (⁠ ص أ ، 10-4 ⁠) 232 0.16 [0.01, 0.30]
ANOVA-CPP (⁠ r A ، D 1) 384 0.16 [0.06, 0.25]
ANOVA-PP (صأ) أ 3,834 0.11 [0.08, 0.14]
سبيرمان- CPP (⁠ r Sp ، V 1 ⁠) 224 0.23 [0.05, 0.42]
سبيرمان- CPP (⁠ r Sp ، 10-4 ⁠) 232 0.22 [0.03, 0.4]
سبيرمان- CPP (⁠ r Sp ، D 1 ⁠) 384 0.2 [0.06, 0.34]
سبيرمان- ب ب (صSp) أ 3,834 0.11 [0.06, 0.15]
بووم (⁠ H OU 2 (t ¯) ⁠) 8,483 0.21 [0.14, 0.29]
بوم (⁠ H OU e 2 ⁠) 8,483 0.2 [0.13, 0.29]
PMM (⁠ H BM 2 (t ¯) ⁠) ب 8,483 0.08 [0.05, 0.12]
PMM (⁠ H BM e 2 ⁠) ب 8,483 0.06 [0.02, 0.1]
PMM ، ReML (Hodcroft وآخرون 2014) ب 8,483 0.06 [0.03, 0.09]

ملاحظة —- مكتوبة أيضًا نتائج تحليل سابق على نفس مجموعة البيانات (Hodcroft et al. 2014). "-": لم يتم التحليل في الدراسة المذكورة. الخلفية الرمادية: تعتبر التقديرات غير موثوقة بسبب: انحياز سلبي ناتج عن تأخيرات في القياس وتحيز سلبي ناتج عن انتهاك BM. يتم التعبير عن عدم اليقين في التقديرات من حيث فترات الثقة 95 ٪ (CI) ، أو ، في حالة الاستدلال البايزي ، بنسبة 95 ٪ من فترات الكثافة الخلفية العالية (HPDs).

على العكس من ذلك ، كانت تقديرات التوريث من طريقة PP الأصلية (ANOVA أو ارتباط سبيرمان على جميع PPs) و PMM أقل بكثير وتقل عن 95٪ من مجالات الموثوقية من POUMM (الجدول 3). هذا يؤكد الملاحظة من محاكاة نموذج اللعبة أن هذه المقدرات متحيزة سلبًا ، لأنها تتجاهل الارتباط المتغير أو يصوغه بشكل غير دقيق داخل أزواج من النصائح. لقد تحققنا من صحة الدعم الإحصائي الأقوى لـ POUMM فيما يتعلق بـ PMM ، من خلال قيمة AICc المنخفضة (الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت) والكثافة الخلفية لمعلمة POUMM α (الشكل التكميلي S8 ، المواد التكميلية عبر الإنترنت).

أخيرًا ، قمنا بمقارنة تقديراتنا لقابلية التوريث lg (spVL) بالتطبيقات السابقة لنفس الطرق على مجموعات بيانات مختلفة (الشكل 6). بالاتفاق مع نماذج محاكاة لعبة ، تقديرات ح 2 باستخدام PMM أو طرق النشوء والتطور الأخرى المستندة إلى BM (على سبيل المثال ، Blomberg’s ك و Pagel's λ) أقل بشكل ملحوظ من جميع التقديرات الأخرى ، مما يشير إلى أن طرق المقارنة الوراثية هذه تقلل من قيمتها ح 2 التقديرات القائمة على التشابه منحازة لأسفل بسبب التأخيرات في القياس (على سبيل المثال ، المقارنة المبكرة مقابل المتأخرة في هولندا في الشكل 6).

مقارنة بين ح 2 H 2 - تقديرات من مجموعة فيروس العوز المناعي البشري في المملكة المتحدة وتقديرات سابقة لبيانات أفريقية وسويسرية وهولندية. (أ) تقديرات مع تقليل تأخير القياس (أزرق داكن) وتقديرات POUMM (أخضر) (ب) تقديرات منحازة لأسفل بسبب التأخيرات العالية في القياس (أزرق فاتح) أو انتهاك افتراض BM (بني). يتم تصوير الثقة إما على أنها شرائح تشير إلى 95٪ CI مقدرة أو ص القيم في حالات فقدان 95٪ من مجالات الموثوقية. تتم كتابة الإشارات إلى المنشورات المقابلة كأرقام مكتوبة بخط مرتفع على النحو التالي: 1: Tang et al. (2004) 2: هيشت وآخرون. (2010) 3: هولينجسورث وآخرون. (2010) 4: فان دير كويل وآخرون. (2010) 5: Lingappa et al. (2013) 6: Yue et al. (2013) 7: أليزون وآخرون. (2010) 8: Shirreff وآخرون. (2013) 9: Hodcroft et al. (2014) 10: Blanquart et al. (2017) 11: بيرتلز وآخرون. (2018) 12: هذا العمل.من أجل الوضوح ، تقديرات من الدراسات السابقة ، والتي لا يمكن مقارنتها بشكل مباشر (على سبيل المثال ، النتائج السابقة من MSM السويسرية / مجموعات البيانات الصارمة Alizon et al. 2010).

مقارنة بين ح 2 H 2 - تقديرات من مجموعة فيروس العوز المناعي البشري في المملكة المتحدة وتقديرات سابقة لبيانات أفريقية وسويسرية وهولندية. (أ) تقديرات مع تقليل تأخير القياس (أزرق داكن) وتقديرات POUMM (أخضر) (ب) تقديرات منحازة لأسفل بسبب التأخيرات العالية في القياس (أزرق فاتح) أو انتهاك افتراض BM (بني). يتم تصوير الثقة إما على أنها شرائح تشير إلى 95٪ CI مقدرة أو ص القيم في حالات فقدان 95٪ من مجالات الموثوقية. تتم كتابة الإشارات إلى المنشورات المقابلة كأرقام مكتوبة بخط مرتفع على النحو التالي: 1: Tang et al. (2004) 2: هيشت وآخرون. (2010) 3: هولينجسورث وآخرون. (2010) 4: فان دير كويل وآخرون. (2010) 5: Lingappa et al. (2013) 6: Yue et al. (2013) 7: أليزون وآخرون. (2010) 8: Shirreff وآخرون. (2013) 9: Hodcroft et al. (2014) 10: Blanquart et al. (2017) 11: بيرتلز وآخرون. (2018) 12: هذا العمل. من أجل الوضوح ، تقديرات من الدراسات السابقة ، والتي لا يمكن مقارنتها بشكل مباشر (على سبيل المثال ، النتائج السابقة من MSM السويسرية / مجموعات البيانات الصارمة Alizon et al. 2010).

باختصار ، POUMM و ANOVA-CPP تنتج تقديرات متفق عليها لـ ح 2 في بيانات المملكة المتحدة وتتفق هذه التقديرات مع التقديرات المستندة إلى التشابه في مجموعات البيانات مع تأخير القياس القصير (بلدان أفريقية مختلفة وهولندا). على غرار محاكاة نموذج اللعبة ، نلاحظ وجود نمط واضح من التحيز السلبي للمقدرات الأخرى ، PMM و ANOVA-PP ، وكذلك للدراسات السابقة القائمة على التشابه على البيانات مع تأخير طويل في القياس.


حجم الدماغ والذكاء

قام بعض المحققين بفحص العلاقة بين حجم الدماغ والذكاء. 26 بالنسبة للبشر ، العلاقة الإحصائية متواضعة ولكنها مهمة. من الواضح أن النتيجة مرتبطة فقط: قد يؤدي حجم الدماغ الأكبر إلى زيادة الذكاء ، وقد يؤدي زيادة الذكاء إلى زيادة حجم الدماغ ، أو قد يعتمد كلاهما على عامل ثالث. علاوة على ذلك ، ربما تكون مدى كفاءة استخدام الدماغ أكثر أهمية من حجمه. على سبيل المثال ، في المتوسط ​​، يمتلك الرجال أدمغة أكبر من النساء ، لكن النساء لديهن روابط أفضل ، من خلال الجسم الثفني ، بين نصفي الكرة الأرضية. لذلك ليس من الواضح أي جنس سيكون له ، في المتوسط ​​، ميزة & # x02014 على الأرجح لا. 27

العلاقة بين حجم الدماغ والذكاء لا تصمد عبر الأنواع. بدلاً من ذلك ، يبدو أن هناك علاقة بين الذكاء وحجم الدماغ بالنسبة للحجم العام التقريبي للكائن الحي (مستوى الدماغ).


نتائج

توصيف المشهد العصبي لمثيل الحمض النووي عبر 8 مناطق بالمخ

أظهرت التقارير السابقة منا ومن آخرين مناظر طبيعية فوق جينية متميزة بين مناطق الدماغ المتنوعة وظيفيًا [11 ، 12]. اقتصرت دراستنا السابقة على عدد قليل من الأفراد ومناطق الدماغ. ومع ذلك ، فقد أوضحنا أن مثيلة الحمض النووي الخاصة بمنطقة الدماغ كانت موجودة بشكل أساسي في النوى العصبية بدلاً من النوى غير العصبية. علاوة على ذلك ، اختلفت نسبة الخلايا العصبية إلى غير الخلايا العصبية حتى بين الأقسام المجاورة من نفس منطقة الدماغ اختلافًا كبيرًا ، مما أدى إلى إرباك شديد في تحليل المثيلة التفاضلية في النوى غير المنقاة. لذلك ، قمنا بتطبيق استراتيجية لتنقية النوى العصبية قبل تسلسل الجينوم الكامل بيسلفيت. مكننا تحليل عدد أكبر بكثير من الأفراد ومناطق الدماغ من معالجة الوجود المحتمل لـ VMRs (مناطق التباين بين الأفراد في المثيلة داخل الأنسجة) ، وعلاقتهم ببعضهم البعض ، والعلاقة مع SNPs المحددة في هؤلاء المتبرعين GTEx. تم عزل النوى العصبية من أنسجة المخ بناءً على NeuN الإيجابي (RBFOX3) يُشار إلى التلوين عن طريق فرز النوى المُنشَّط بالفلور ونواة NeuN + على أنها عصبية ، مع ملاحظة أن هذا الجزء يتكون من مجموعات سكانية فرعية متعددة (ملف إضافي 1: الشكل S1a). قمنا بفحص 8 مناطق دماغية تم جمعها من متبرعي GTEx: اللوزة (ن = 12) ، القشرة الحزامية الأمامية (BA24) (ن = 15) ، مذنبات (ن = 22) ، القشرة الأمامية (BA9) (ن = 24) ، قرن آمون (ن = 20) ، الوطاء (ن = 13) النواة المتكئة (ن = 23) والبوتامين (ن = 16). بالإضافة إلى ذلك ، قمنا بتحليل مثيلة الحمض النووي المعزول من أنسجة غير دماغية من متبرعين بـ GTEx: الرئة (ن = 18) والغدة الدرقية (ن = 19) لما مجموعه 182 عينة (ملف إضافي 2: الجدول S1). لقد أنشأنا 30 مليارًا من قراءات نهائية مقترنة بحجم 150 نقطة أساس بشكل فريد مع متوسط ​​عمق و GT 10 معالجة لاحقة (ملف إضافي 3: الجدول S2). تم استبعاد العديد من العينات بسبب اختلاف التركيب الوراثي ، حيث لم يتطابق النمط الجيني للعينة المشحونة مع سجلات البنك الحيوي (ملف إضافي 4: الجدول S3). تم استبعاد خمس عينات إضافية بعد أن كشف تحليل المكون الرئيسي عن تسمية خاطئة للعينة قبل استلامها من قبل مختبرنا. لقد أكدنا ذلك من خلال تحديد الأنسجة الأكثر تطابقًا مع مثيلة هذه العينات (ملف إضافي 1: الشكل S1b).

كشف تحليل المكون الرئيسي لمستويات مثيلة الحمض النووي للخلايا العصبية العالمية عن فصل واضح لمناطق الدماغ هذه في المكونين الرئيسيين الأولين (الشكل 1 أ). أجرينا تحليلًا تفاضليًا لمثيلة CpG التي تحدد CG-DMRs ، أي مناطق مثيلة CpG التفاضلية بين النوى العصبية المعزولة عن كل منطقة من مناطق الدماغ. بالنظر إلى أن CG-DMR واحد يمكن أن يمثل اختلافًا بين مناطق الدماغ المتعددة ، بدلاً من إجراء 28 مقارنة زوجية ، استخدمنا F-اختبار لتحديد 174،482 خلية عصبية جسمية ذات دلالة إحصائية CG-DMRs والتي يتم تعريفها على أنها مناطق من الجينوم حيث يوجد على الأقل 2 من مناطق الدماغ الثمانية مستويات مختلفة من مثيلة CpG (ملف إضافي 5: الجدول S4). نحن نتحكم في معدل الخطأ العائلي عند 5٪ من خلال التقليب ، ونستخدم BSmooth للاستفادة من المعلومات من CpGs القريبة من خلال التنعيم. في دراسة تجريبية ، قمنا بتحديد ملامح خلايا NeuN + من 4 مناطق دماغية باستخدام تسلسل الجينوم الكامل بيسلفيت على عينات من 6 أفراد مختلفين ليسوا جزءًا من GTEx [12]. وجدنا أن 99.5 ٪ من CG-DMRs العصبية التي تم تحديدها سابقًا (13019/13074) تتداخل مع CG-DMRs من تحليلنا الجديد لعينات GTEx (بعد التصحيح للاختبار المتعدد). لإجراء مقارنة أكثر دقة ، قمنا بفحص العلاقة بين الاختلافات المثيلة بين الأنسجة كما تم قياسها بشكل منفصل في Rizzardi et al. [12] وهذه الدراسة (كانت الأنسجة عبارة عن النواة المتكئة وقشرة الفص الجبهي ، تم اختيارها لأن معظم CG-DMRs من Rizzardi وآخرون. [12] كانت بين هذين النسجين). وجدنا ارتباطًا مذهلاً قدره 0.97 كما هو موضح في الشكل S1c يسلط الضوء على قابلية تكرار مناهجنا التجريبية والتحليلية عبر البنوك الحيوية. هذا المستوى العالي من قابلية التكاثر يستمر حتى عند فحص اختلافات المثيلة بين جميع DMRs العصبية البالغ عددها 13074 المحددة في [12] بين منطقتين قشريتين متشابهتين جدًا (ملف إضافي 1: الشكل S1d) ، مما يشير إلى أن نهجنا متحفظ ، على الأرجح لأننا نتحكم في الأسرة - معدل الخطأ.

تحديد CG-DMRs بين الخلايا العصبية في مناطق الدماغ المتميزة وظيفيًا. تم تقييم مثيلة الحمض النووي في نوى عصبية معزولة من 8 مناطق دماغية كما هو موضح من 12 إلى 24 فردًا. أ تحليل المكون الرئيسي للمسافات المشتقة من متوسط ​​مثيلة CpG الجسدية في حاويات 1 كيلو بايت. ب التجميع الهرمي للعينات على أساس متوسط ​​مثيلة لكل عينة في CG-DMRs الأكثر تمييزًا (انظر قسم "الطرق"). ج تمثل خريطة الحرارة إثراء السجل 2 لـ CpGs داخل CG-DMRs والكتل المحددة في كل تحليل CG-DMR مقارنة ببقية الجينوم للميزات الجينية. نماذج الجينات من GENCODEv26 (المروجين ، intronic ، exonic ، 5′UTR ، 3′UTR ، بين الجينات) ، جزر CpG (CGIs) والميزات ذات الصلة من UCSC (الشواطئ ، الرفوف ، OpenSea) ، مناطق المُحسِّن المفترضة (معززات ومعززات الثقة العالية من PsychENCODE [18] و H3K27ac [19]). 5 مجموعة = CG-DMRs أو كتل بين جميع مجموعات الأنسجة الخمس. د كما في ج، يُظهر التخصيب في مناطق الكروماتين المفتوح في نوى NeuN− و NeuN + و NeuN + المعزولة من مناطق الدماغ المشار إليها (القشرة الكهروضوئية ، القشرة البصرية الأولية ، المهاد ، المهاد الأوسط) من [10]. ه مثال CG-DMRs يغطي NPTXR الجين الذي يظهر متوسط ​​قيم المثيلة لنواة NeuN + من كل مجموعة أنسجة مشفرة بالألوان كما في ب. مناطق المثيلة التفاضلية مظللة باللون الوردي. F التعبير عن NPTXR من عينة متطابقة من أنسجة المخ الأكبر من إصدار بيانات GTEx v8

لتسهيل تفسير بياناتنا ، أجرينا تحليلًا أبسط. على وجه التحديد ، لقد انهارنا القشرة الأمامية وعينات القشرة الحزامية الأمامية في مجموعة "قشرية" وتتكون المذنبات والبوتامين والنواة في مجموعة "العقد القاعدية". تتوافق مجموعات الأنسجة الخمس الناتجة مع الأصول التطورية لمناطق الدماغ ، حيث يؤدي الدماغ البيني إلى ظهور القشرة الدماغية (التي تتفرع إلى القشرة الأمامية والقشرة الحزامية الأمامية وتشكيل الحصين) والنواة الدماغية (التي تتفرع إلى اللوزة المخية) والعقد القاعدية) بينما ينتج الدماغ البيني الوطاء [23]. حددنا 181،146 خلية عصبية جسمية CG-DMRs (196 ميجا بايت) من بين هذه المجموعات الخمس التي تغطي 11 ٪ من جميع CpGs. علاوة على ذلك ، استحوذ التحليل المكون من 5 مجموعات على 94 ٪ من CG-DMRs المحددة في تحليل 8 مجموعات (ملف إضافي 6: الجدول S5). متوسط ​​مستويات مثيلة الحمض النووي لأكثر أنواع CG-DMRs تمييزية ، بصرف النظر عن العديد من عينات الحصين ، قادرة على فصل العينات في مجموعات الأنسجة الخاصة بهم (الشكل 1 ب). حددنا أيضًا 7671 منطقة كبيرة من مثيلة CpG التفاضلية (والتي أطلقنا عليها سابقًا "كتل" من مثيلة CpG التفاضلية التي تم تحديدها باستخدام نطاق ترددي أكبر للتنعيم) بين مجموعات الأنسجة الخمس (ملف إضافي 7: الجدول S6). غطت كتل CG هذه 260 ميغا بايت وكان حجمها في المتوسط ​​33.9 كيلو بايت. تم إثراء CG-DMRs في مناطق مُحسِنة تم تحديدها بواسطة PsychENCODE [13] ، توجد قمم H3K27ac في دماغ البالغين [24] ، وفي حالات chromHMM التنظيمية من 4 مناطق دماغية [25] (الشكل 1 ج ، ملف إضافي 1: الشكل S1e ). لاحظنا أيضًا إثراء CG-DMRs الخاصة بنا في مناطق الكروماتين المفتوح المحدد في نوى NeuN + من 14 منطقة دماغية [11] (الشكل 1 د). مثال CG-DMRs داخل جين البنتراكسين 1 (NP1) العصبي (NPTXR) (الشكل 1 هـ) مع hypomethylation في الخلايا العصبية الحُصين المرتبطة بزيادة التعبير في نسيج الحصين السائب (الشكل 1f). يشارك NP1 في استيعاب مستقبلات الغلوتامات وقد تورط في مرض الزهايمر حيث أن تنظيمه استجابة لزيادة أميلويد بيتا يعزز السمية العصبية [26].

على الرغم من أننا قمنا بتجميعها معًا في تحليلنا الأولي لـ CG-DMR ، إلا أن هناك تمييزًا واضحًا بين أنسجة العقد القاعدية. تحظى هذه المناطق بأهمية خاصة نظرًا لأهميتها في مسارات الإدمان والمكافأة [27] ، ومع ذلك لم يتم إجراء تحليل شامل لاختلافات المثيلة في الدماغ البشري حتى الآن. أجرينا تحليل DMR إضافيًا لتقييم اختلافات المثيلة بين الخلايا العصبية من هذه الأنسجة وحددنا 16،866 من العقد القاعدية العصبية الجسدية CG-DMRs (24 ميجا بايت) التي تشمل 1.7 ٪ من جميع CpGs (ملف إضافي 8: الجدول S7). تماشيًا مع هويتها الإقليمية ، تم إثراء هذه العقد القاعدية CG-DMRs بشكل خاص في مناطق الكروماتين المفتوحة المحددة في النوى العصبية من الأنسجة المخططة [11] (الشكل 1 د). أكثر من 13 ٪ (2295/16866) من هذه العقد القاعدية ، لم يتم تحديد CG-DMRs في تحليل CG-DMR المكون من 5 مجموعات. استخدمنا أداة إثراء المناطق الجينومية للتعليقات التوضيحية (rGREAT v4.0.0) [28] لتحديد مصطلحات علم الوجود الجيني المخصب المرتبطة بهذه العقد القاعدية الفريدة CG-DMRs. كانت عشرة من أفضل 20 مصطلحًا مُخصبًا بشكل كبير مرتبطة بنقل الأيونات أو الإشارات العصبية (ملف إضافي 9: الجدول S8). تشير هذه النتيجة إلى أن المثيلة التفاضلية بالقرب من هذه الجينات (بما في ذلك جينات الوحدة الفرعية لقناة الجهد الكهربي Ca + 2 و K +) يمكن أن تشارك في ضبط تعبيرها في مجموعات عصبية معينة داخل العقد القاعدية.

يحدد تحليل المثيلة التفاضلي مجموعات سكانية فرعية عصبية متميزة في الحُصين

ومن المثير للاهتمام ، كشف تحليل المكون الرئيسي عن مجموعتين متميزتين نشأتا من الحُصين لم يتم اكتشافهما في تحليلنا السابق لأنسجة الحصين [12] (الشكلان 1 أ و 2 أ). يتكون الحصين من عدة مناطق فرعية تتكون من أربع مناطق "cornu ammonis" والتلفيف المسنن. افترضنا أن عيناتنا تمثل الخلايا العصبية الهرمية والحبيبية المحددة داخل هذه المناطق الفرعية المعنية. اختبرنا هذه الفرضية من خلال تحديد الحصين الجسدي CG-DMRs (ن = 11702) بين هاتين المجموعتين (الشكل 2 ب ، ملف إضافي 10: الجدول S9). أظهر التحليل الكبير لأعلى 2000 قرن آمون CG-DMRs إثراء في تكوين الخلايا العصبية وتوليد الخلايا العصبية (ملف إضافي 9: الجدول S8). نظرًا لأن تكوين الخلايا العصبية عند البالغين يحدث في التلفيف المسنن ، فإن هذه البيانات تشير إلى أن بعض هذه العينات نشأت من تلك المنطقة الفرعية المعينة. تم استخدام بيانات التعبير الجيني من [29،30،31] لتجميع قائمة من 75 جينًا تم التعبير عنها تحديدًا في الخلايا العصبية الحبيبية المسننة (ملف إضافي 11: الجدول S10) وقمنا بتقاطع الحصين CG-DMRs مع هذه الجينات ومحفزاتها (TSS) ± 4 كيلو بايت). حددنا 117 hippocampal CG-DMRs متداخلة مع هذه الجينات ووجدنا أنه في 12 من عينات الحصين الـ 18 هذه الجينات الواسمة ميثلة مقارنة بعينات الحصين الستة الأخرى وأنسجة المخ الأخرى التي تم فحصها (الشكل 2 ج). فحص محدد ل PROX1 يكشف الجين ، وهو علامة للخلايا العصبية الحبيبية المسننة ، عن نقص الميثيل في المحفز وفي جميع أنحاء الجسم الجيني في هذه العينات الـ 12 ، مما يوفر دليلًا قويًا على أن هذه العينات قد تم تخصيبها للخلايا العصبية التلفيف المسنن (الشكل 2 د). يشار إلى هذه المجموعة من العينات على أنها عينات التلفيف المسنن طوال بقية الدراسة ، وبذلك يصل العدد الإجمالي لمناطق الدماغ التي تم تحليلها إلى تسعة.

يكشف المثيلة التفاضلية عن مجموعة فرعية من عينات قرن آمون تنشأ من التلفيف المسنن. أ تحليل المكون الرئيسي للمسافات المشتقة من متوسط ​​مثيلة CpG الجسدية في حاويات 1 كيلو بايت. البيانات الموضحة مأخوذة من هذه الدراسة ومن [11] كما هو موضح. ب التجميع الهرمي لعينات الحصين بناءً على متوسط ​​مثيلة لكل عينة في CG-DMRs المحددة بين مجموعتي الحصين. ج التجميع الهرمي لعينات الحصين بناءً على متوسط ​​مثيلة لكل عينة من جينات علامة التلفيف المسنن CG-DMRs الحصينية. العلامة الأولية للتلفيف المسنن ، PROX1محاصر. د مثال الحصين CG-DMRs في PROX1 الجين بمتوسط ​​قيم مثيلة محسوبة من نوى NeuN + المعزولة من مجموعات الأنسجة المشار إليها ومناطق الميثلة التفاضلية المظللة باللون الوردي

DMRs mCH

الميثيل غير CpG (mCH) منتشر على نطاق واسع في الخلايا العصبية البشرية ، ويرتبط mCH على أجسام الجينات والعناصر التنظيمية عمومًا بالقمع [1 ، 12 ، 32]. ومن المثير للاهتمام ، أن انخفاض نسبة صحة الأم والطفل تحديدًا في محسنات الخلايا العصبية قد ارتبط مؤخرًا بأمراض مرض الزهايمر [33]. ومن المفارقات أن mCH قد ارتبطت أيضًا بالجينات منخفضة النسخ المشاركة في تطور الخلايا العصبية [34] بالإضافة إلى الجينات التي تفلت من تعطيل X [35]. نظرًا لأهمية mCH في تطور الخلايا العصبية والمرض ، أجرينا تحليلًا تفاضليًا لـ mCH عبر مجموعات الأنسجة الخمس لدينا. حددنا ما مجموعه 264868 CH-DMRs عبر جميع السياقات (CA ، CT ، CC) وخيوط (+ ، -) تغطي ثلث الجينوم (1.0 جيجا بايت) (ملف إضافي 12: الجدول S11). تمثل هذه النتيجة زيادة قدرها 10 أضعاف في عدد CH-DMRs المحددة عبر الدماغ مقارنة بعملنا السابق [12]. في تلك الدراسة ، أظهرنا ارتباطات عالية بين السلاسل والسياقات الخاصة بصحة الأم والطفل ، وبالتالي ، فإننا نستخدم mCA (+) لتمثيل mCH في هذه الدراسة. كشف التحليل العالمي لـ mCA (+) عن طريق تحليل المكون الرئيسي عن فصل العينات بناءً على مجموعة الأنسجة ولكن ليس بنفس الدرجة مثل مثيلة CpG (الشكل 3 أ). كانت CH-DMRs أكبر 3.5 مرة من CG-DMRs (3839 مقابل 1086 نقطة أساس ، على التوالي) وتم إثرائها في CG-DMRs مع 67979 (25٪) CH-DMRs متداخلة مع 118،621 CG-DMRs (65٪). ومع ذلك ، أظهرت CH-DMRs القليل من الإثراء للخصائص الجينية أو التنظيمية واستنفدت في جزر CpG (الشكل 3 ب). كان لدى CH-DMRs في سياق CA (+) فرق مثيلة متوسط ​​قدره 5.8 ٪ مع وجود فرق مثيلة 3195 & GT 10٪. تم إثراء هذه CH-DMRs شديدة التباين (الشكل 3 ب "& gt 10٪") بشكل خاص في المناطق الجينية / الداخلية والمُحسِنة. كانت نتائج تحليلنا CH-DMR بين أنسجة العقد القاعدية (152.056 CH-DMRs) وبين مجموعتي الحصين (100757 CH-DMRs) مشابهة لتحليل CH-DMR المكون من 5 مجموعات (ملف إضافي 13: الجدول S12). أظهرت CH-DMRs أيضًا إثراءًا طفيفًا في الكروماتين المفتوح عبر جميع مناطق الدماغ التي تم تحليلها في [11] (الشكل 3 ج). ومن المثير للاهتمام ، أن Hippocampal and basal ganglia CH-DMRs لم تظهر إثراء مماثل ، ولكنها استنفدت بالفعل في مناطق الكروماتين المفتوح في بعض الأنسجة. تمشيا مع CG-DMRs ، كانت CH-DMRs شديدة التباين بشكل عام مفرطة الميثيل في أنسجة العقد القاعدية مقارنة بالآخرين (الشكل ثلاثي الأبعاد). تُظهر CH-DMRs درجة عالية من التداخل بين التحليلات التي يتم إجراؤها باستخدام مجموعات الأنسجة الخمس وعينات العقد القاعدية وعينات الحصين ، وهذا ينطبق أيضًا على CG-DMRs (الشكل 3 هـ ، أعلى). بالإضافة إلى ذلك ، تُظهر CH-DMRs تداخلًا كبيرًا مع CG-DMRs كما أبلغنا سابقًا [12] (الشكل 3 هـ ، أسفل). يمكننا اكتشاف العديد من CH- و CG-DMRs الإضافية عند النظر فقط بين أنسجة العقد القاعدية أو بين مجموعات الحصين. يظهر مثال CH-DMR داخل الجسم الجيني لـ NRGN، الذي يشفر بروتين Neurogranin الخاص بالدماغ ، والذي تم تحديده مؤخرًا باعتباره علامة حيوية للسائل الدماغي الشوكي لمرض الزهايمر [36] (الشكل 3f).

مثيلة تفاضلية غير CpG عبر مناطق الدماغ المتميزة وظيفيًا. أ تحليل المكون الرئيسي للمسافات المشتقة من متوسط ​​جسمي ، بالإضافة إلى مثيلة CA (mCA +) في حبلا 1 كيلوبايت. ب تمثل خريطة الحرارة إثراء السجل 2 لـ CA و CT و CC داخل CH-DMRs مقارنة ببقية الجينوم للميزات المشار إليها بما في ذلك CG-DMRs المحددة في هذه الدراسة. نماذج الجينات من GENCODEv26 (المروجين ، intronic ، exonic ، 5′UTR ، 3′UTR ، بين الجينات) ، جزر CpG (CGIs) والميزات ذات الصلة من UCSC (الشواطئ ، الرفوف ، OpenSea) ، مناطق المُحسِّن المفترضة (معززات ومعززات الثقة العالية من PsychENCODE [18] و H3K27ac [19]). 5-group = CH-DMRs بين كل المجموعات الخمس 5-group & gt 10٪ = 3195 CH-DMRs من 5-group مقارنة مع متوسط ​​CA-DMR مثيلة الفرق & GT 10%. ج كما في ب، يُظهر التخصيب في مناطق الكروماتين المفتوح في نوى NeuN− و NeuN + و NeuN + المعزولة من مناطق الدماغ المشار إليها (القشرة الكهروضوئية ، القشرة البصرية الأولية ، المهاد ، المهاد الأوسط) من [10]. د التجميع الهرمي للعينات بناءً على متوسط ​​CA (+) مثيلة لكل عينة في CA-DMRs مع & GT ، فرق مثيلة 10 ٪ بين مجموعات الأنسجة الخمس. ه مخططات Venn توضح التقاطعات بين CH- و CG-DMRs المحددة بين التحليلات المختلفة. F مثال CA-DMR أكثر NRGN مع كل من الخيوط و CG-DMRs (mCG (S) التي تم الحصول عليها من نافذة تجانس صغيرة) وكتل (mCG (L) تم الحصول عليها من نافذة تجانس كبيرة). متوسط ​​قيم المثيلة المحسوبة من نوى NeuN + المعزولة من مجموعات الأنسجة المشار إليها. مناطق المثيلة التفاضلية مظللة باللون الوردي

تحديد VMRs في الخلايا العصبية المعزولة من أنسجة المخ البشري

كان التباين بين الأفراد في مثيلة الحمض النووي محل اهتمام العديد من المجموعات ، وقد سمحت لنا مجموعة عينات GTEx باستكشاف تباين مثيلة خاص بالأنسجة على نطاق الجينوم الذي لم يكن ممكنًا في السابق. VMRs هي مواضع متغيرة للغاية بين الأفراد داخل نوع نسيج معين [21 ، 22]. على سبيل التوضيح ، تم استخدام كلمة "التباين" في أعمال أخرى للإشارة إلى التغيرات في مثيلة الحمض النووي بين الأنسجة [37] ، وهو ليس معنى VMR ​​المستخدم هنا. كانت الدراسات السابقة لتنوع الميثيل في أنسجة المخ مقصورة على المناطق الجينومية المستهدفة (صفيف Illumina 450 كيلو) [38] أو عدد قليل من الأفراد [39] الذين يستخدمون منطقة دماغية واحدة. يمكن أن يكون التباين الجهازي في المثيلة مدفوعًا بالتأثيرات الجينية (مثيلة QTLs في رابطة الدول المستقلة و / أو عبر) ، تحدث بشكل مستقل مثل epialleles غير المستقر [40] ، أو ناتجة عن التعرض البيئي ، أو تكون مرتبكة بسبب عدم تجانس نوع الخلية. كما أوضحنا سابقًا [12] ، تتم إزالة الكثير من التباين الناتج عن عدم تجانس نوع الخلية عند عزل نوى NeuN + من أنسجة المخ. ومع ذلك ، فإن نسب المجموعات السكانية العصبية الفرعية بين مناطق الدماغ وبين الأفراد لا يزال بإمكانها المساهمة في قياسات التباين. باستخدام EpiDISH [41] ، قدرنا نسب NeuN + في عيناتنا. للحصول على بيانات مرجعية ، استخدمنا مواقع المثيلة التفاضلية بين نوى NeuN + و NeuN− المعزولة من القشرة الأمامية المدارية المحددة في Kozlenkov et al. [42]. قمنا بتصفية 51412 موقعًا من مواقع CpG التي حددوها على أنها "خلايا عصبية منقوصة الميثيل" و "ناقصة الميثيل الدبقية" لـ | Δβ | & gt 0.7 نتج عنها 426 موقعًا. بعد ذلك ، قمنا بإزالة CpGs التي تداخلت مع DMRs المحددة في تحليلاتنا المكونة من 8 مجموعات والحصين ، مما أدى إلى 201 مرجعية CpGs. كانت هذه الخطوة حاسمة للقضاء على التباين بسبب الاختلافات المعروفة في مثيلة الخلايا العصبية الخاصة بالمنطقة. وجدنا أن أربع عينات فقط من قرن آمون لديها أي دليل على تلوث دبقي (NeuN−) وبالتالي توفير التحقق المستقل من كفاءة الفرز لدينا (ملف إضافي 1: الشكل S2a). واحد فقط من هؤلاء كان أقل من 97٪ من الخلايا العصبية بتقدير 87٪.

حددنا VMRs من خلال تحديد النسبة المئوية 99 للانحراف المعياري لقيم المثيلة في كل نسيج وتطبيق أقل قيمة انحراف معياري (SD = 0.095) كقطع واحد لجميع الأنسجة (ملف إضافي 1: الشكل S2b). يسمح استخدام نفس قطع SD للأنسجة المختلفة بالحصول على أعداد مختلفة من VMRs بدلاً من أخذ أعلى المناطق المتغيرة. تسمح هذه الإستراتيجية بإمكانية أن تكون بعض الأنسجة أكثر تنوعًا من غيرها. حددنا ما مجموعه 81،130 VMRs فريدة تحتوي على & gt 10 CpGs وتغطي 159 ميجا بايت في جميع مناطق الدماغ التسع والرئة والغدة الدرقية (الشكل 4 أ ، الجدول 1 ، ملف إضافي 1: الشكل S2 ، ملف إضافي 14: الجدول S13). تتم مشاركة غالبية VMR بين نسجين أو أكثر (الشكل 4 ب ، "VMR المشترك") مع 333 مشتركًا بين جميع مناطق الدماغ. من بين هؤلاء ، هناك 202 منطقة VMR "منتشرة في كل مكان" ، وهي مناطق متغيرة مشتركة بين جميع الأنسجة بما في ذلك الرئة والغدة الدرقية (الشكل 4 ج). بشكل ملحوظ ، ما متوسطه 24 ٪ من VMRs المحددة في كل نسيج هي فريدة من نوعها لهذا النسيج ونقدم أمثلة على VMRs الخاصة بالأنسجة (الشكل 4 ب). لتقدير حجم تأثير التباين ، استخدمنا نطاق كل عينة ، متوسط ​​مثيلة عبر المنطقة. يبلغ متوسط ​​حجم التأثير 35٪ حيث يكون لكل VMR تقريبًا حجم تأثير أكبر من 20٪ وبعضها يصل إلى 50٪ أو أعلى (ملف إضافي 1: الشكل S2c).

تقلب الميثيل عبر أنسجة المخ وغير المخ. أ تشترك VMR بين نسجين غير دماغيين ونواة عصبية من مناطق دماغية متميزة. يتم سرد عدد VMRs في كل تقاطع في الجزء السفلي من المؤامرة. ب أمثلة على VMRs المشتركة والخاصة بالأنسجة في اللوزة (الوردي) ، والذرة (الرمادية) ، والوطاء (الأخضر). تكون VMRs مظللة باللون الوردي في الأنسجة التي تم تحديدها فيها ويشار إلى اللون الرمادي في الأنسجة حيث لم يتم اعتبارها VMR SNPs عند وجودها. ج مثال على VMR ​​في كل مكان مشترك عبر أنسجة المخ وغير المخ كما هو محدد. د تمثل خريطة الحرارة إثراء السجل 2 لاتحاد جميع VMRs المحددة ، VMRs في كل مكان ، VMRs الخاصة بالأنسجة ، وجميع VMRs المحددة في كل نسيج كما هو موضح مقارنة ببقية الجينوم للسمات الجينومية. نماذج الجينات من GENCODEv26 (المروجين ، intronic ، exonic ، 5′UTR ، 3′UTR ، بين الجينات) ، جزر CpG (CGIs) والميزات ذات الصلة من UCSC (الشواطئ ، الرفوف ، OpenSea) ، مناطق المُحسِّن المفترضة (معززات ومعززات الثقة العالية من PsychENCODE [18] و H3K27ac [19]). 5 مجموعة CG-DMRs = تم تحديد CG-DMRs بين جميع مجموعات الأنسجة الخمس

تداخلت جميع VMRs تقريبًا (97٪) مع CG-DMR مع 35-50٪ من VMRs المحتواة بالكامل في CG-DMR (الجدول 1). تنخفض هذه النسبة المئوية إلى 18-20٪ بالنسبة لـ VMRs المحددة في الرئة والغدة الدرقية ، وهو أمر متوقع لأن هذين النسجين لم يتم تضمينهما في تحليلات CG-DMR. ينعكس هذا التداخل في إثراء VMRs لـ CG-DMRs ، وهو أقل بالنسبة للرئة والغدة الدرقية للسبب المذكور أعلاه (الشكل 4 د). يمكن تصور ذلك في الشكل 4 ب (اللوحات في أقصى اليمين) حيث يوجد VMR في منطقة ما تحت المهاد (أسفل ، أخضر) ويكون متوسط ​​المثيلة مختلفًا بشكل كبير عن ذلك الموجود في اللوزة (أعلى ، وردي) أو مذنب (وسط ، رمادي) وبالتالي تشكل CG-DMR. تم إثراء هذه المناطق الخاصة بالأنسجة من تقلب الميثيل في المناطق التنظيمية المفترضة بما في ذلك حالات chromHMM المرتبطة بالمحسِّن والنسخ (الشكل 4 د ، ملف إضافي 1: الشكل S3a). تم العثور على VMRs في جميع autosomes (ملف إضافي 1: الشكل S3b) بما في ذلك منطقة MHC من الكروموسوم 6 المعروف أنه متغير للغاية. احتوت منطقة MHC ، بالإضافة إلى المنطقة المحيطة بالكروموسوم 20 ، على عدد أكبر من VMRs في كل مكان من أي منطقة جينومية أخرى مماثلة للنتائج السابقة [39] (ملف إضافي 1: الشكل S4). على عكس معظم VMRs ، تم إثراء VMRs في كل مكان بشكل خاص في جزر وشواطئ CpG (الشكل 4 د).

عند النظر في VMRs الخاصة بالأنسجة ، ركزنا أولاً على اللوزة حيث أن 32 ٪ من VMRs المحددة في هذا النسيج كانت فريدة من نوعها في اللوزة. أظهرت اللوزة أعلى تباين بين الأفراد بين جميع الأنسجة التي تم قياسها ، وكان هذا واضحًا من خلال تحليل المكون الرئيسي (الشكل 1 أ) وفي العدد المتزايد من إجمالي VMRs المحددة (الجدول 1). افترضنا أنه ، على غرار الحصين ، تم عزل مناطق فرعية متميزة من اللوزة عن هؤلاء الأفراد مما أدى إلى زيادة عدم تجانس الخلايا العصبية. بالنسبة إلى VMRs الخاصة بالأنسجة ، لا يمكننا التمييز بين الاختلاف الحقيقي من ذلك بسبب عدم التجانس الخلوي ، مما دفعنا إلى التحقيق في حجم مساهمة عدم التجانس. قسمت تحليلات التصوير العصبي للتوصيل التشريحي والوظيفي اللوزة إلى ما يصل إلى 9 نوى فرعية متميزة [43 ، 44 ، 45]. تختلف هذه النوى في قوة الاتصال بمناطق الدماغ الأخرى بما في ذلك منطقة ما تحت المهاد ، والحصين ، والمناطق القشرية. على سبيل المثال ، وجدت دراسة تصوير عصبي حديثة أن النواة القاعدية عرضت روابط أقوى مع ما تحت المهاد والقشرة البصرية مقارنة بالنواة القشرية المركزية التي أظهرت اتصالات أقوى بالقشرة الحركية الأولية [46]. نظرًا لأن هذه التصنيفات تستند أساسًا إلى بيانات التصوير العصبي ، فإن السمات الجزيئية لهذه المناطق الفرعية لم يتم توضيحها بعد في اللوزة البشرية. ومع ذلك ، أدت خلية واحدة من تسلسل الحمض النووي الريبي من اللوزة الإنسي في الماوس إلى تحديد 16 نوعًا فرعيًا عصبيًا متميزًا [47]. قمنا بفحص المثيلة في حدود 1 كيلو بايت من المتماثلات البشرية لـ 262 جينًا تستخدم لتجميع الخلايا العصبية ووجدنا 649 VMRs ، 116 منها كانت خاصة باللوزة. لم يتم الكشف عن أي VMRs خاصة بالأنسجة من أي منطقة دماغية أخرى بالقرب من هذه الجينات. يكشف التجميع الهرمي لعينات اللوزة العصبية بناءً على 649 VMRs عن ثلاث مجموعات تشير إلى أن هذه العينات ربما تكون قد نشأت من نوى فرعية مميزة داخل اللوزة (ملف إضافي 1: الشكل S5a ، ب). VMRs داخل SLC17A7 يتم عرض الجين ، وهو علامة للخلايا العصبية الجلوتاماتيكية ، كمثال على المثيلة المتغيرة بين مجموعات العينات الثلاث هذه (ملف إضافي 1: الشكل S5c). تشير هذه البيانات بقوة إلى أن التباين بين عينات اللوزة الدماغية مدفوع بالاختلافات في الأنواع الفرعية العصبية بين المناطق دون الإقليمية التي تم أخذ عينات منها. لم نتمكن من تحديد VMRs ضمن هذه المجموعات الثلاث المتميزة حيث كان هناك 3-4 أفراد فقط في كل مجموعة فرعية.

عندما نفكر في تلك VMRs التي ليست خاصة بالأنسجة ، ولكنها مشتركة بين منطقة دماغية أخرى على الأقل (كما هو موضح في الشكل 4 أ) ، فمن غير المحتمل أن تكون VMRs ناتجة عن عدم تجانس الخلايا العصبية ، لأنها مشتركة بين مناطق الدماغ مع مجموعات عصبية متميزة. لذلك ، يجب مشاركة تنوع هذه المناطق بين أنواع الخلايا المختلفة مما يشير إلى أن لديهم بعض الوظائف البيولوجية المشتركة. كشف التحليل الإضافي لـ 949 VMRs المشتركة فقط بين اللوزة والوطاء عن إثراء لجينات نقل الناقل العصبي ، لا سيما في عائلة SLC (ملف إضافي 15: الجدول S14). يوجد VMR

3 كيلو بايت المنبع من TSS من SLC32A1 (الشكل 4 ب ، "VMR المشترك") ، والذي يتم التعبير عنه في الخلايا العصبية GABAergic ويتوسط امتصاص GABA والجليسين إلى الحويصلات المشبكية [48]. تم العثور على هذه VMRs المشتركة أيضًا بالقرب SLC6A1 (- 15 كيلو بايت) و SLC6A11 (+ 1.4 كيلوبايت) ، ناقلان آخران لـ GABA للخلايا العصبية والدبقية ، على التوالي ، بالإضافة إلى المنبع SLC6A3 (- 52 كيلو بايت) ، مادة ناقلة للدوبامين مهمة في التسبب في الاضطرابات النفسية [49]. من بين VMRs التي تم تحديدها في مناطق الدماغ الأخرى ، تمت مشاركة 77-95 ٪ بين اثنين أو أكثر. يمكن أن تكون هذه VMRs المشتركة مناطق مهمة لدمج مدخلات الإشارة من الحديث المتبادل بين الخلايا العصبية.

يتم إثراء DMRs و VMR لتوريث السمات المرتبطة بالدماغ

لقد أظهرنا نحن وآخرون ارتباطًا قويًا بين السمات اللاجينية التفاضلية والأنماط الظاهرية العصبية والنفسية العصبية والسلوكية المعرفية [4 ، 11 ، 12]. باستخدام انحدار درجات اختلال التوازن الطبقي [50] ، سألنا عما إذا كانت VMRs التي حددناها في كل منطقة دماغية مرتبطة أيضًا بسمات مرتبطة بالدماغ (ملف إضافي 16: الجدول S15). أولاً ، قمنا بتكرار النتائج السابقة التي توصلنا إليها بأن مناطق مثيلة CpG التفاضلية يتم إثرائها لتوريث السمات المرتبطة بالدماغ بما في ذلك الفصام والعصابية وأعراض الاكتئاب (الشكل 5 أ ، ملف إضافي 1: الشكل S6 ، ملف إضافي 17: الجدول S16). بالإضافة إلى ذلك ، أظهرت CG-DMRs وتلك التي تم تحديدها بين مناطق العقد القاعدية إثراءًا كبيرًا لتوريث اضطراب نقص الانتباه وفرط النشاط (ADHD). تم إثراء VMRs التي تم تحديدها في منطقة ما تحت المهاد أيضًا لتوريث اضطراب فرط الحركة ونقص الانتباه ، بينما تم إثراء VMRs المحددة في اللوزة والقشرة الحزامية الأمامية والحصين بشكل كبير لتوريث مرض انفصام الشخصية (الشكل 5 ب). أظهرت Amygdala VMRs إثراءًا أكبر من CG-DMRs (6.5 مقابل 4.6) على الرغم من أنها تغطي

75٪ أقل من الجينوم من CG-DMRs (ملف إضافي 17: الجدول S16).

تم إثراء CG-DMRs و VMRs العصبية بدرجة عالية لتفسير التوريث لصفات نفسية وعصبية وسلوكية معرفية متعددة. النتائج من تشغيل انحدار درجات اختلال التوازن الطبقي باستخدام 30 سمة GWAS مع 97 ميزة أساسية وإما DMRs (أ) أو VMRs (ب) المحددة في هذه الدراسة. فقط مجموعات السمات ذات المعامل ض-نتائج أكبر بكثير من 0 (من جانب واحد ض-اختبار ألفا = 0.05 ، ص- القيم التي تم تصحيحها داخل كل سمة باستخدام طريقة هولم) موضحة. درجة الإثراء (ذ-المحور) والمعامل ض-نتيجة (x-المحور) من تشغيل هذا التحليل لكل من ميزات المثيلة المشار إليها جنبًا إلى جنب مع ميزات خط الأساس

المساهمات الجينية في تقلبية مثيلة الحمض النووي

التفسير الأكثر ترجيحًا للمساهمة الجينية في تقلب مثيلة الحمض النووي هو تعدد الأشكال الجيني داخل منطقة VMR. ما يقرب من 25 ٪ من VMR لا تتداخل مع أي تعدد الأشكال مع تردد أليل ثانوي (MAF) و gt 0.1 عبر عيناتنا (ملف إضافي 18: الجدول S17).

كانت بيانات النمط الجيني من جميع الأفراد باستثناء شخصين متاحة من GTEx v8 [16] مما يترك 6-20 فردًا لكل نسيج ، وهو عدد قليل جدًا لإجراء تحليل مثيلة دقيق QTL. ومع ذلك ، فقد حددنا العديد من الأمثلة على VMRs التي تتداخل مع واحد أو أكثر من SNPs المرتبطة بالمثيلة المتغيرة (الشكل 6 أ). يتم عرض مثال واحد داخل MYO3A الجين الذي يقع في المنبع GAD2، وهو منظم أساسي لتخليق GABA المرتبط بالفصام [53] والاضطراب ثنائي القطب [54] والاكتئاب الشديد [55]. هناك واحد على الأقل GAD2 محسن يقع داخل MYO3A الجين ، على الرغم من أنه كذلك

150 كيلو بايت بعيدًا عن VMR هذا [56]. لفحص المساهمات الجينية المحتملة في تباين المثيلة الملحوظ ، سألنا ما إذا كانت mQTLs التي تم تحديدها مسبقًا من أنسجة المخ قد تم إثرائها في VMRs لدينا (الشكل 6 ب). تم إنشاء بيانات mQTL التي اخترناها باستخدام مصفوفة 450 ألف على عينات من الحصين الأكبر (ن = 110) [51] ، دماغ الجنين (ن = 166) [6] ، والقشرة الصدغية المجمعة (ن = 44) تم فرزها أيضًا في NeuN + (ن = 18) و NeuN− (ن = 22) نوى [52]. لقد وجدنا أكبر إثراء في جميع مجموعات البيانات داخل VMRs الموجودة في كل مكان بما يتوافق مع تأكيدنا أن تباين المثيلة في هذه الفئة من VMRs مدفوع وراثيًا. قمنا أيضًا بمقارنة VMRs لدينا بمجموعتين من البيانات الموجودة [38 ، 39] التي تفحص المساهمات الجينية والبيئية في تباين المثيلة. جارج وآخرون. [38] حددت 58 عينة من القشرة الأمامية المصنفة من قبل NeuN باستخدام مصفوفة Illumina 450k ، وحدد 1136 VMRs عصبية ، تم اكتشاف 996 منها أيضًا في تحليلنا. بالإضافة إلى ذلك ، حددوا 149 VMR مشتركًا بين عينات الدم والدماغ والأرومة الليفية ، وبينما تم تحديد 142 منها أيضًا في تحليلنا ، كان 18 فقط موجودًا في مجموعتنا من VMRs في كل مكان. Gunasekara et al. [39] لمحة عن مثيلة الحمض النووي في ثلاثة أنسجة من 10 متبرعين لـ GTEx لتحديد المناطق التي لا يكون فيها تباين المثيلة بين الأفراد خاصًا بالأنسجة. حددوا 9926 منطقة مرتبطة من التباين النظامي بين الأفراد (CoRSIVs). وجدنا أن VMRs الخاصة بنا قد تم إثرائها من أجل VMRs التي حددها Garg et al. [38] وكذلك لـ CoRSIVs [39] (الشكل 6 ج). اكتشفنا 16٪ (1588/9926) من CoRSIVs في تحليلنا. نظرًا لأن CoRSIVs ، بحكم التعريف ، متسقة عبر الأنسجة الثلاثة التي تم أخذ عينات منها (القلب والغدة الدرقية والمخيخ) ، لم نفاجأ عندما وجدنا أن التخصيب في هذه المناطق كان أقل بالنسبة إلى VMR ​​الخاصة بالأنسجة.

المساهمات الجينية في تقلبية المثيلة. أ مثال على SNP المرتبط بالمثيلة المتغيرة في الداخل MYO3A إظهار متوسط ​​قيم المثيلة لكل نمط وراثي (المشار إليه) لجميع الأنسجة. تكون VMRs المرتبطة بـ SNP وردي مظلل ويشار إلى SNP. ب تمثل خريطة الحرارة إثراء السجل 2 لـ CpGs داخل VMRs و VMRs الخاصة بالأنسجة مقارنة ببقية الجينوم لمجموعات بيانات mQTL المنشورة سابقًا [6 ، 51 ، 52] ، VMRs العصبية [35] ، والمناطق المرتبطة من الاختلافات الجهازية بين الأفراد (CoRSIVs) [ 36]. يتم عرض عمليات التخصيب / الاستنفاد الكبيرة فقط. المجموعات غير الهامة مظللة باللون الرمادي


هل يمكن أن تكون قيمة التوريث أكبر من 1؟ - مادة الاحياء

"القابلية للتوريث" مصطلح يستخدم في العديد من المقالات ومن خلال الكثير من المؤلفات العلمية ويروج دائمًا لفكرة أنه يتعلق تحديدًا بالسمات الموروثة. نتيجة لذلك ، غالبًا ما يُفترض أن وراثة سمة معينة تتعلق بمدى تأثير الجينات على السمة التي تظهر في الفرد.

ومع ذلك ، هذا ليس ما يعنيه.

يحاول التوريث معالجة العلاقة بين الطبيعة (علم الوراثة) والتنشئة (البيئة) ، بحيث يمكن تقدير التباين بين الأفراد داخل مجموعة سكانية بناءً على هذه التأثيرات مع تغير كل منهما. في هذا السياق ، تمثل "البيئة" ببساطة كل شيء خارج الجينوم يمكن أن يؤثر على التعبير.

لذلك فإن أول جانب مهم للوراثة يجب فهمه هو أنه لا يخبرنا شيئًا عن الأفراد. إنه تقدير صارم للتغيرات التي تحدث داخل السكان. إذا تم تطبيق التوريث على فرد ما فهذا مفهوم لا معنى له [حيث لا يمكن القول بأن الفرد يختلف باختلاف أي شيء].

كما أنه لا يخبرنا بأي شيء عن التأثير المحدد للجينات على أي سمة معينة ، لأن ذلك سيكون نتيجة الوراثة. نحتاج أيضًا إلى فهم أن السمة هي شيء "قابل للاختيار". بمعنى آخر ، هناك احتمال أن النتائج يمكن أن تختلف في التعبير عن سمة معينة. يأتي هذا من وجهة النظر المندلية للوراثة حيث يتم تمثيل الجينات على أنها أليلين [سائد ومتنحي] ، بحيث ينتج عن توليفات معينة نتائج معينة. لذلك إذا لم يكن هناك اختلاف في الأليلات ، فسيكون لدى كل شخص نفس الجينات وسيكون التوريث صفرًا. التكيفات مثل وجود قلب أو معدة ليست قابلة للتحديد (الكثير من الجينات والتفاعلات) وبالتالي لا تخبرنا شيئًا عن التوريث. الفرق الأساسي هو أن التكيفات تمثل التأثير التراكمي للتغييرات بمرور الوقت والتي تم تثبيتها في مجموعة سكانية. نتيجة لذلك ، لا يوجد "اختيار" من شأنه أن يحدد "قلب أو لا قلب". لذلك يمكننا أن نعتبر أن القلب هو تكيف ، في حين أن خطر الإصابة بأمراض القلب هو سمة.

إذا افترضنا أن كلا من الجينات والبيئة يؤثران على السمات الموجودة في الكائن الحي ، فيجب علينا إذن أن نفكر في التأثير الأكبر على الاختلافات بين الكائنات الحية (1).

لذلك دعونا نجري تجربة فكرية لتوضيح ما يتم تقييمه.

افترض أنه يمكننا إنشاء بيئة متطابقة في كل جانب لمجموعة معينة من الكائنات الحية. إنهم يتطورون وينمون وعندما يصلون إلى سن الرشد نلاحظ الاختلافات في السمات التي تظهر. نظرًا لأن البيئة تمارس تأثيرًا متطابقًا على الكائنات الحية ، فيمكننا إذن استبعاد البيئة كعامل [بمعنى آخر ، ستؤثر عليها جميعًا بالتساوي]. من هذا يمكننا أن نستنتج أنه مهما كانت الاختلافات الموجودة بين الكائنات الحية [التباين] يجب أن تكون نتيجة الجينات وحدها.

في هذه الحالة ، سيكون التوريث 1.0 أو 100٪ ، مما يشير إلى أن الجينات فقط هي المسؤولة عن الاختلاف الذي نراه بين الأفراد.

وبالمثل ، يمكننا إجراء تجربة فكرية أخرى حيث نأخذ أفرادًا متطابقين وراثيًا [مستنسخات] ونخضعهم لبيئات مختلفة. عندما نفحص السمات ، أيا كان الاختلاف الموجود لا يمكن أن يكون بسبب الجينات [لأنها متطابقة] لذلك ، فإن الاختلاف يتأثر بالبيئة فقط. في هذه الحالة يكون التوريث 0.0 أو 0٪ (2).

ومع ذلك ، فإن ما يجعل هذا المفهوم صعبًا بعض الشيء هو عندما نفكر في الأرقام الفعلية في هذا السياق. على سبيل المثال ، لنفترض أن الارتفاع قد يكون له قابلية توريث قدرها 0.90. ما يعنيه هذا هو أنه في حين أن هناك تأثيرًا تمارسه العوامل البيئية (مثل العناصر الغذائية) في ارتفاع الفرد ، فإن الجزء الأكبر من التأثير تمارسه الجينات. والأهم من ذلك ، أنه يخبرنا حقًا أن التأثير الرئيسي في شرح الاختلافات بين الأفراد يتم حسابه بهذه الطريقة.

لاحظ أنه لا يخبرنا شيئًا عما أدى إلى ارتفاع معين لأي فرد معين ، بل ما يفسر الاختلافات بين الأفراد داخل مجموعة سكانية معينة.

بالنظر إلى النباتات في الرسم التخطيطي ، لدينا بيئة موحدة على اليسار تحتوي على العناصر الغذائية والإضاءة ، وبالتالي فإن التباين في الارتفاع يرجع فقط إلى الجينات (التوريث = 100٪). باستخدام نفس البذور ، نغير البيئة إلى مستوى مغذٍ رديء ، وهذه المرة لدينا نباتات متقزمة يتأثر تباينها بنسبة 100٪ بالجينات ، لأن البيئة لا تزال ثابتة.
يؤدي هذا إلى ظهور شرط "يمكن أن يكون لدينا توارث كامل داخل المجموعات ، وتباين كبير بين المجموعات ، ولكن لا يوجد فرق جيني بين المجموعات". في كلتا الحالتين ، يتم الاحتفاظ بالبيئة بشكل أساسي ، وبالتالي فإن التباين في الارتفاع يرجع فقط إلى الجينات ، وبالتالي 100 ٪ من التوريث. ومع ذلك ، إذا قمنا الآن بدمج كلا السيناريوهين بحيث كانت هناك أيضًا اختلافات بيئية بين المجموعتين ، فسيكون التوريث هو القيمة 0.90 المشار إليها سابقًا لأن التباين بين المجموعات لا يتم حسابه فقط من خلال الجينات ، ولكن أيضًا من خلال التأثيرات البيئية التي تسبب التقزم.

ما يوفره هذا التعيين المحدد هو وسيلة يمكننا من خلالها البدء في تقدير أو تقييم التأثيرات التي قد تكون موجودة في سمات معينة. لذلك بينما تكون الجينات مسؤولة عن التعبير عن سمة ما ، يتم استخدام التوريث لتحديد مدى خصوصية مثل هذا التعبير للجينات وحدها.

نتيجة لذلك ، غالبًا ما تستخدم القابلية للتوريث في الانتقاء الاصطناعي لتحديد السمات الأكثر احتمالية لاختيارها بنجاح. كلما زادت قابلية التوريث في السمة ، زاد تأثير الفرد في الحصول على تلك الصفة من خلال اختيار أفضل زوج تربية.

إحدى الصعوبات التي تنشأ مع التوريث هي أن أي سمة مدروسة يجب أن تكون مرتبطة بشكل واضح بالانتقال الجيني. يمكن أن يصبح هذا مشكلة عند استخدام الوراثة لتقييم السمات السلوكية حيث قد يكون الارتباط الجيني ضعيفًا. في محاولة لقياس التوريث ، غالبًا ما يكون هناك اعتماد على الدراسات المزدوجة على افتراض أن الفروق بينهما يجب أن تكون مسؤولة أمام البيئة لأنها متطابقة وراثيًا بشكل فعال. ومع ذلك ، كما ذكرنا سابقًا ، يمكن أن يؤدي هذا إلى تفسيرات صعبة عندما تكون السمات المعنية سلوكية بحتة. إلى أن يحين الوقت الذي يمكن فيه ربط السمات السلوكية صراحةً بالجينات ، يجب اعتبار أي بيان يتعلق بالوراثة مشكوكًا فيه.

============================================
(1) القابلية للتوريث هي في النهاية نسبة يتم التعبير عنها كقيمة بين 0 و 1. نتيجة لذلك ، يمكننا العثور على أرقام التوريث التي تشير إلى 0.30 أو 0.60 أو بعض هذه النسبة للإشارة إلى تأثير الجينات في تنوع معين. سمة. باختصار ، يمكن تعريف التوريث على أنه نسبة التباين بسبب الجينات إلى التباين الكلي في مجموعة سكانية.

من المسلم به أن الجينات هي المسؤولة عن السمة نفسها. يحاول التوريث تحديد تأثير الطبيعة (الجينات) مقابل التنشئة (البيئة) على التباين في السكان. لذلك يمكن القول إن تباين السمة التي لها قابلية وراثية تبلغ 30. يتأثر بالوراثة بنسبة 30٪ تقريبًا والبيئة عند 70٪. بالإضافة إلى ذلك ، يجب أن تكون هذه السمات قابلة للتحديد بالفعل.

(2) يكون التوريث صفراً إذا لم يكن هناك أي اختلاف في الجينات [لذلك لا يمكن أن يكون هناك اختلاف في تعبيرها بسبب الجينات] ، سواء كانت النتيجة بسبب الجينات التي ستثبت أو بسبب التشابه الجيني كما في التوائم أو المستنسخات .


شاهد الفيديو: المواريث: طرق تقسيم التركة (قد 2022).