معلومة

ما هي الأنواع التي تم تسلسل جينوماتها / يتم ترتيبها؟

ما هي الأنواع التي تم تسلسل جينوماتها / يتم ترتيبها؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أطلق مشروع الجينوم البشري أول جينوم كامل له منذ ما يقرب من عشر سنوات. منذ ذلك الحين تم أيضًا ترتيب العديد من الأنواع.

أحاول العثور على قائمة بالمشاريع المكتملة (وربما الجارية / التي بدأت) لتسلسل الأنواع الأخرى إلى جانب بعض البيانات الموجزة الأساسية للغاية مثل عدد الجينات (مقسمة بين الكروموسومات الجنسية والجسيمات الذاتية) ، وطول الحمض النووي ، وعدد الكروموسومات ، إلخ. .

هذا للعرض التقديمي الذي أقدمه في مؤتمر وسيكون إضافة لطيفة إلى حديثي.


تحتوي قاعدة بيانات GOLD (Genomes Online DB) على بيانات عن حالة التسلسل ، وكذلك بعض الإحصائيات (عدد الكروموسومات ، وحجم الجينوم) - ولكن هذه البيانات الإضافية غير متاحة لجميع الأنواع.


توجد عدة قوائم على ويكيبيديا ، على سبيل المثال للنباتات والبكتيريا وحقيقيات النوى.


يهدف مشروع الجينوم 10K بكلماتهم "إلى تجميع حديقة حيوانات جينومية - مجموعة من تسلسلات الحمض النووي التي تمثل جينومات 10000 نوع من الفقاريات ، تقريبًا واحد لكل جنس فقاري." ها هي قائمة الأنواع الخاصة بهم.


في NCBI ، يمكنك العثور على جدول يحتوي على معلومات الجينوم لكل كائن حي.

لكل كائن حي ، يمكنك العثور على المملكة والمجموعة والمجموعة الفرعية التي ينتمي إليها ، والحجم في Megabases ، وعدد الكروموسومات والعضيات والبلازميدات (إن وجدت) وعدد التجمعات.


تشير بيانات الجينوم الكامل إلى أربعة أنواع من الزرافة

روث ويليامز
6 مايو 2021

فوق: الزرافة شبكي في حديقة سامبورو الوطنية ، كينيا
مؤسسة الحفاظ على الجراف ، جوليان فينيسي

بعد إجراء تحليل التسلسل الجيني الأكثر تفصيلاً حتى الآن لأطول حيوان بري في العالم ، يجادل الباحثون بوجود أربعة أنواع مميزة من الزرافة. لكن تقريرهم ، الذي نُشر أمس (5 مايو) في علم الأحياء الحالي، يبدو أنه لم يحسم الجدل طويل الأمد بين خبراء الزرافة حول أعداد الأنواع الدقيقة ، حيث لا يزال البعض يجادل بأنه من المحتمل أن يكون هناك المزيد من الأنواع والبعض الآخر أقل.

يقول عالم الوراثة التطوري راسموس هيلر Rasmus Heller من جامعة كوبنهاجن والذي لم يشارك في البحث: "هذه حقًا بيانات وراثية حديثة [و] مساهمة هائلة في العلوم". ويضيف: "إنه لأمر رائع حقًا أن نحصل أخيرًا على بيانات جينوم كاملة بهذا الحجم للزرافات" ، مشيرًا إلى أن وجود العديد من الجينومات التي تمثل عددًا كبيرًا من مجموعات الزرافة "ليس من السهل الحصول عليها". فيما يتعلق بما إذا كان يعتقد أن البيانات تؤكد وجود أربعة أنواع وأربعة فقط ، كما يقول ، "لقد كانت مسألة خلافية نوعًا ما لعدد من السنوات و. . . أنا أفضل أن أبقى محايدا قليلا. . . . أنا حقا لا أعرف ، لأكون صادقا ".

منذ أن بدأ البشر في تصنيف الأنواع ، كانت الزرافة الأيقونية ، التي تجوب السافانا في إفريقيا تمضغ الأشجار والشاهقة فوق كل الحيوانات الأخرى ، تعتبر نوعًا واحدًا. مع ظهور التسلسل الجيني ، تم اقتراح ستة وثمانية وأربعة وثلاثة أنواع من الزرافة ، بأعداد متفاوتة من السلالات الفرعية.

يقول هيلر إن الجدل كان "محتدما بشكل مدهش". ويضيف عالم الأحياء البرية ديريك لي من جامعة ولاية بنسلفانيا والذي لم يشارك في الدراسة: "إنها مشكلة أن تكون الحياة فوضوية ويصعب تفكيكها ، وامتلاك البشر لأدمغة تضع الأشياء بشكل قهري في حفر الحمام".

يقول عالم الوراثة التطورية أكسل يانكي من مركز سينكينبيرج للتنوع البيولوجي وأبحاث المناخ في ألمانيا: "[أردنا] معالجة هذه المشكلة مرة واحدة وإلى الأبد".

أنشأ فريق Janke جينومًا مرجعيًا عن طريق de novo لتسلسل عينة DNA تم الحصول عليها حديثًا من الزرافة ، واستخدم هذا لمحاذاة 50 جينومًا إضافيًا تم الحصول عليه من إعادة التسلسل عالي الجودة لعينات الزرافة الموجودة وتسلسلان زرافة متاحان للجمهور. جاءت 43 عينة من مجموعات برية في 17 موقعًا عبر القارة الأفريقية ، تم جمعها من قبل أعضاء مؤسسة الحفاظ على الزرافة (GCF). جاء الأفراد الثمانية الباقون من ثلاث حدائق حيوان أوروبية. تمثل العينات أعضاء من جميع الأنواع أو الأنواع الفرعية المشتبه بها من الثدييات.

أكدت تحليلات التسلسل المقارن ، التي فحصت ما يقرب من 200000 تعدد أشكال النوكليوتيدات المفردة في جينومات الحيوانات ، اكتشاف Janke السابق بأن التسلسلات تتجمع في أربع مجموعات أو أنواع مختلفة. استندت الدراسة السابقة إلى سبعة مواضع جينومية فقط مع متواليات الميتوكوندريا. اقترح تحليل الجينوم الكامل للفريق كذلك أن السلالات الأربعة كانت تتطور بشكل منفصل مع عدم وجود دليل مهم على التهجين. وفقًا للفريق ، فإن الأنواع هي: زرافة camelopardalis (بما في ذلك الأنواع الفرعية ج. العتيقة, ج. camelopardalis، و ج. بيرالتا) G. tippelskirchi (بما في ذلك الأنواع الفرعية جي تي. تيبلسكيرشي و جي تي. شوكى) الزرافة G. (بما في ذلك الأنواع الفرعية ز. أنجولينسيس و ز. زرافة) و G. شبكية.

بينما يمكن أن يحدث التهجين بين هذه الأنواع في الأسر ، ومن هنا جاءت الحجة السابقة لنوع واحد من الزرافة ، "لا نرى علامات تهجين في الجينومات ، وبالاستنتاج نقول إنه لا يحدث في البرية" ، كما يقول جانكي ، وهذا يدعم التعريف البيولوجي للأنواع المنفصلة ، كما يقول.

راجع "الحيوانات الهجينة ليست غير ملائمة للطبيعة"

لا يتفق عالم الأحياء التطوري ألكسندر حسنين من جامعة السوربون ، والذي كان تحليله السابق قد جادل بوجود ثلاثة أنواع فقط. يكتب في رسالة بريد إلكتروني إلى العالم أن التهجين يحدث بالفعل بين G. شبكية و G. camelopardalisمما يجعلهم أعضاء من نفس النوع. يقول إن الورقة الحالية "محدودة النطاق لأن المؤلفين يختارون تضمين مجموعة برية واحدة فقط من الأنواع الفرعية شبكي في تحليلاتهم الجينومية. " إذا كانوا قد شملوا "سكان من شبكي وجدت في الأجزاء الغربية والشمالية من توزيعها ، أنا متأكد من أن الاستنتاجات ستكون مختلفة "، يضيف.

في المقابل ، يرى عالم الأحياء الجزيئية دوغلاس كافينر Douglas Cavener من جامعة ولاية بنسلفانيا أنه قد يكون هناك أكثر من أربعة أنواع فقط. يقول إنه نظرًا لأن الفريق لا يكشف عن المواقع الدقيقة للحيوانات التي تم أخذ عينات منها ، فمن الممكن أن يكون بعضها أفرادًا من نفس العائلة وبالتالي متشابهين جينيًا جدًا مع بعضهم البعض. إذا كان هذا هو الحال ، كما يقول ، فقد تكون المجموعات الطبيعية في الواقع أكثر تنوعًا ، مع وجود عدد أكبر من الأنواع والأنواع الفرعية مما تشير إليه هذه الدراسة.

يكتب Janke في رسالة متابعة بالبريد الإلكتروني إلى العالم، "العينات مأخوذة من خزعات السهام التي أخذها الصندوق الأخضر للمناخ على مدى بضعة أيام ، على ما أعتقد. بالطبع ، لا يمكن للمرء أبدًا استبعاد إشراك أفراد مرتبطين به ، لكنني واثق جدًا من معرفتي بمدى احتراف فريق GCF بشكل مباشر أنهم بذلوا قصارى جهدهم لتجنب أخذ العينات من الأفراد ذوي الصلة ".

راجع "الجينوم يكشف عن أدلة على شكل جسم الزرافات" الغريب بشكل صارخ "

إذن ، لماذا تعتبر معرفة العدد الدقيق لأنواع الزرافة أمرًا مهمًا؟

سواء أحببنا ذلك أم لا ، فإن الأنواع لا تزال هي العملة الأساسية. . . لقياس التنوع البيولوجي "، كما يقول هيلر ، و" الطريقة التي يتم بها تخصيص اهتمام الحفظ والموارد التي يتم تخصيصها على أساس تحديد الأنواع. . . . إنها وحدة الأنواع التي نهتم بحمايتها ".

يشرح هيلر أنه إذا كان هناك أربعة أنواع من الزرافة بدلاً من نوع واحد ، فعندئذ "سيكون لكل منها وضعه الخاص" ، مما قد يعزز جهود الحفظ.

في النهاية ، كما يقول كافينر ، إنه لأمر مؤسف أن يكون هناك الكثير من الجدل حول مسألة الأنواع لأنه عندما يتعلق الأمر بها ، "أعتقد أن الجميع لديهم نفس الاهتمام في الاعتبار ، وهذا هو الحفاظ على الزرافة".


يتسلسل العلماء جينومات 240 حيوانًا لفهم التطور على مستوى الحمض النووي

قام فريق متعدد التخصصات من العلماء بقيادة إلينور كارلسون ، دكتوراه ، أستاذ مشارك في الطب الجزيئي في برنامج المعلوماتية الحيوية والبيولوجيا الحاسوبية ، بالتقاط التنوع البيولوجي على المستوى الجيني. من خلال تسلسل الجينوم لـ 240 نوعًا من الثدييات ، 122 نوعًا منها لم يتم تسلسلها مطلقًا ، حدد الباحثون علاقة بين مناطق انخفاض التنوع الجيني في الأنواع ذات المخاطر العالية للانقراض. سيسمح الاستخدام الإضافي لهذه الجينومات المقارنة للعلماء بتحديد امتدادات الحمض النووي التي ظلت دون تغيير (أو محفوظة) في الثدييات لملايين السنين ، مما يؤدي إلى رؤى جديدة في صحة الإنسان والأمراض والتنوع البيولوجي.

قال الدكتور كارلسون: "ما تمكنا من القيام به من خلال تسلسل هذه الجينومات هو التقاط التنوع البيولوجي على المستوى الجيني". "من خلال أخذ هذه البيانات ، يمكننا تحليل جينومات الثدييات عبر الأنواع لمعرفة ما يتغير أو لا يتغير على مدى ملايين السنين بطرق مثيرة للاهتمام عبر كل هذه الجينومات. وهذا يشمل مناطق الجينوم حيث من المرجح أن تؤدي التغييرات إلى المرض أو المرض ".

البيانات المنشورة في طبيعة سجية، تم استخدامه بالفعل لزيادة فهم المرض والمرض. في وقت سابق من هذا العام ، كان كارلسون أحد المؤلفين الذين استخدموا العمل في ملف وقائع الأكاديمية الوطنية للعلوم دراسة الأنواع التي قد تكون معرضة بشكل خاص لانتقال فيروس SARS-CoV-2 من إنسان إلى حيوان.

لالتقاط مجموعة متنوعة وواسعة من الأنواع لإنشاء مجموعة بيانات جينومية كانت مفيدة ، ضم كارلسون نوعًا واحدًا على الأقل من كل عائلة يوثيرية. من بين الأنواع المختارة تسعة أفراد هم الأفراد الوحيدون في عائلتهم وسبعة مهددة بالانقراض بشدة ، بما في ذلك قرد العواء المكسيكي ، هيرولا ، سايجا الروسي ، توكو توكو الاجتماعي ، إندري ، وحيد القرن الأبيض الشمالي ووحيد القرن الأسود. في المجموع ، يتم تمثيل 80 في المائة من عائلات الثدييات في التحليل المقارن لكارلسون.

أوضح كارلسون: "لا يمكن العثور على الكثير من هذه الحيوانات في حدائق الحيوان". "لا يمكننا الحصول على عينات من الحمض النووي إلا من خلال الخروج إلى الحقل وإيجاد هذه الأنواع في موطنها الأصلي. بالنسبة للأنواع التي تعيش في أماكن نائية ، مثل الغابات المطيرة أو أعماق المحيط ، فإن إعادة عينة الحمض النووي إلى المختبر ذات الجودة التي يمكن ترتيب تسلسلها يمثل تحديًا كبيرًا ".

بمجرد حصول كارلسون وفريقها على التسلسلات ، كان عليهم تحليل البيانات. للقيام بذلك ، كان لا بد من ترتيب الجينومات المختلفة بشكل صحيح بحيث يتم دراسة المناطق الجينية المقابلة بدقة. استغرقت مقارنة 240 جينومًا ، بما في ذلك البشر ، قاعدة تلو الأخرى وترتيبها جميعًا بدقة تسعة أشهر من الحوسبة السحابية للوصول إلى دقة أساسية واحدة. قال كارلسون: "من الناحية الحسابية ، هذا رفع ضخم".

بمجرد معالجة جميع البيانات ، تمكن العلماء من عزل 3.1 في المائة من جينوم الثدييات الذي كان متطابقًا تقريبًا بين جميع الأنواع الـ 240.

قال كارلسون ، "ما يعنيه هذا هو أن تسلسل الحمض النووي لم يتغير منذ الوقت الذي تشترك فيه كل هذه الأنواع في سلف مشترك - يعود إلى ملايين وملايين السنين. هذا أكثر مما نتوقعه من الطفرات العشوائية. قد يشير هذا إلى أن هذه المناطق من الحمض النووي مهمة للحياة ، وأن الحيوانات ذات الطفرات في هذه المناطق تميل إلى عدم البقاء على قيد الحياة لفترة كافية للتكاثر ".

كان أحد الأسئلة الأولية التي تمكن كارلسون من التحقيق فيها هو مقدار التنوع الموجود في جينوم نوع معين.

قال كارلسون: "إذا كنا نبحث عن إشارات مبكرة بأن السكان قد يتعرضون للتهديد ، ويمكن أن يستفيدوا من تدخل مجموعات الحفظ ، فيمكننا العثور على ذلك في البيانات الجينية". من المحتمل أن يكون للأنواع ذات التنوع البيولوجي الأقل اختلافات جينية أقل بين الحمض النووي الموروث من الأم والحمض النووي الموروث من الأب. يمكن تحديد هذه الأنواع باستخدام البيانات الجينية قبل أن تنخفض أعداد السكان بشكل حاد ، ومنح الأولوية للدراسة المتعمقة ".

أثناء البحث عن مجالات التشابه بين الأنواع يمكن أن يؤدي إلى رؤى ثاقبة في صحة الإنسان والمرض ، فإن كارلسون مفتون أيضًا بالاختلافات الجينية بين الأنواع. قال كارلسون: "إذا فكرت في كل الأشياء التي يمكن للأنواع الأخرى أن تفعلها والتي لا يستطيع البشر القيام بها ، مثل السبات". "في كل عام ، تخزن الحيوانات التي تدخل في سبات السعرات الحرارية ، وتصبح مقاومة للأنسولين وتدخل السبات. ثم عادوا إلى الوراء. لا يستطيع البشر فعل ذلك. ستكون كارثية. ما هي الجينات التي تتحكم في ذلك؟ ماذا يعني ذلك وكيف يرتبط بالعودة إلى كيفية عمل الجينوم البشري؟ هذا هو السؤال النهائي ".


العلماء يتسلسلون جينومات 131 نوعًا من الثدييات المشيمية

في دراسة لها آثار على تعزيز الطب والحفاظ على التنوع البيولوجي ، قام اتحاد دولي كبير من الباحثين المشاركين في مشروع Zoonomia بتسلسل وتحليل الجينوم لـ 131 نوعًا من الثدييات المشيمية ، وبذلك يصل المجموع العالمي إلى 240 نوعًا.

يرفع مشروع Zoonomia نسبة عائلات الثدييات eutherian التي يتم تمثيلها بواسطة مجموعة واحدة على الأقل إلى 83٪. تظهر هذه الصورة الكسلان البني الحلق (براديبوس فاريغاتوس) في حديقة Cahuita الوطنية ، كوستاريكا. رصيد الصورة: Christian Mehlführer / CC BY 2.5.

تمكّن ثورة علم الجينوم من تحقيق التقدم ليس فقط في البحوث الطبية ، ولكن أيضًا في علم الأحياء الأساسي وفي الحفاظ على التنوع البيولوجي ، حيث ساعدت الأدوات الجينومية في القبض على الصيادين غير المشروعين وحماية السكان المعرضين للخطر.

ومع ذلك ، لدينا قدرة محدودة فقط على التنبؤ بالمتغيرات الجينية التي تؤدي إلى تغييرات في الأنماط الظاهرية على مستوى الكائن الحي ، مثل زيادة خطر الإصابة بالأمراض & # 8212 ، وهي مهمة معقدة في البشر بسبب الحجم الهائل للجينوم.

يمكن لعلم الجينوم المقارن أن يتصدى لهذا التحدي من خلال تحديد مواقع النيوكليوتيدات التي ظلت دون تغيير عبر ملايين السنين من التطور ، مع التركيز على البحث عن المتغيرات المسببة للأمراض.

في عام 2011 ، حدد مشروع 29 للثدييات المناطق الجينية للقيود التطورية التي تشكل في المجموع 4.2 ٪ من الجينوم ، عن طريق قياس الحفظ المتسلسل في البشر بالإضافة إلى 28 من الثدييات الأخرى.

أثبتت هذه المناطق أنها أكثر إثراءً فيما يتعلق بتوريث الأمراض المعقدة أكثر من أي علامة وظيفية أخرى ، بما في ذلك حالة الترميز.

من خلال توسيع عدد الأنواع وإجراء محاذاة مستقلة عن أي جينوم مرجعي واحد ، تم تصميم مشروع Zoonomia & # 8212 الذي كان يُطلق عليه سابقًا مشروع 200 الثدييات & # 8212 لاكتشاف القيد التطوري في النسب eutherian بدقة أعلى ، ول توفير الموارد الجينية لأكثر من 130 نوعًا غير معهود سابقًا.

قال البروفيسور كيرستين ليندبلاد-توه ، الباحث في جامعة أوبسالا ، و SciLifeLab ومعهد برود في معهد ماساتشوستس للتكنولوجيا وهارفارد: "إن مقارنة الجينومات من 240 من الثدييات ستساعد علماء الوراثة على تحديد الطفرات التي تؤدي إلى أمراض بشرية".

حدد علماء Zoonomia الابتكارات الجينية التي يبدو أنها تحمي حيوانات معينة من أمراض مثل السرطان والسكري.

كما حددوا العناصر الجينومية التي ظلت دون تغيير عبر ملايين السنين من التطور ، والتي تتنبأ بالمكان الذي من المحتمل أن ترتبط فيه الطفرات بخطر الإصابة بالأمراض ، ويمكن أن تكشف عن طرق جديدة للتطور العلاجي.

قال الدكتور أوليفر رايدر ، مدير علم الوراثة الحفظ في معهد حديقة حيوان سان دييغو لأبحاث الحفظ ، الدكتور أوليفر رايدر: "قبل المجهر ، لم نتمكن من رؤية ما يجري داخل الخلية".

"الآن ، نحن نشاهد الحياة من منظور جديد تمامًا. يحمل الحمض النووي تعليمات ، ونحن الآن قادرون على قراءتها ".

شجرة النشوء والتطور لعائلات الثدييات في محاذاة مشروع Zoonomia ، بما في ذلك كل من التجميعات الجديدة وجميع جينومات الثدييات الأخرى عالية الجودة المتاحة للجمهور في GenBank عندما بدأ الفريق في المحاذاة. تعترف التصنيفات التصنيفية الحالية بما مجموعه 127 عائلة موجودة من الثدييات eutherian ، بما في ذلك 43 عائلة لم تكن ممثلة سابقًا في GenBank (المربعات الحمراء) و 41 عائلة مع مجموعات جينوم تمثيلية إضافية (مربعات وردية). من بين العائلات المتبقية ، كان لدى 21 عائلة تجميعات جينوم بنك الجينوم ولكن لم يكن لديها مجموعة مشروع Zoonomia (مربعات رمادية) و 22 عائلة لم يكن بها تجميع جينوم تمثيلي (مربعات بيضاء). تشير الأرقام الأبوية إلى عدد الأنواع ذات مجموعات الجينوم في عائلة معينة. رصيد الصورة: Genereux وآخرون.، دوى: 10.1038 / s41586-020-2876-6.

بالإضافة إلى فهم الجينوم البشري ، يمكن استخدام جميع جينومات الثدييات المشيمية الجديدة معًا لدراسة كيفية تكيف أنواع معينة مع بيئات مختلفة.

على سبيل المثال ، تمتلك بعض ثعالب الماء طبقة سميكة مقاومة للماء ، وقد تكيفت بعض الفئران ، ولكن ليس كلها ، مع السبات. يمكن أن تساعدنا هذه السمات الحيوانية في فهم سمات الإنسان مثل الأمراض الأيضية.

مع تغير المناخ وتأثر المزيد من الموائل الحيوانية بالأنشطة البشرية ، أصبح من المهم أكثر فأكثر الدفاع عن الأنواع المهددة بالانقراض.

في الدراسة الجديدة ، كان للحيوانات المدرجة في القائمة الحمراء IUCN للأنواع المهددة بالانقراض تنوع أقل في جينومها ، وهو ما يتوافق مع حالتها المهددة بالانقراض.

قال البروفيسور ليندبلاد-توه: "نأمل أن تُستخدم مجموعة البيانات الشاملة لدينا ، والمتاحة لجميع العلماء في العالم ، لفهم الجينات المرضية وحماية التنوع البيولوجي".

"تسلسل الجينوم للأنواع المهددة بالانقراض يمكن أن يساعد في تحديد مخاطر انقراض الأنواع وتوجيه جهود الحفظ ،" قال الدكتور ميغان أوين ، مدير الشركة لعلوم الحفاظ على الحياة البرية في San Diego Zoo Global.

"كما أنها توفر للمسؤولين عن الحياة البرية أدوات للقبض على الصيادين والمتاجرين بالحياة البرية."

قالت الدكتورة ديان جينيرو ، عالمة الأبحاث في مجموعة علم الجينوم الفقاري في معهد برود بمعهد ماساتشوستس للتكنولوجيا: "أحد أكثر الأشياء إثارة في مشروع Zoonomia هو أن العديد من أسئلتنا الأساسية في متناول الأشخاص داخل وخارج العلم على حد سواء". وجامعة هارفارد.

"من خلال تصميم المشاريع العلمية التي يمكن للجميع الوصول إليها ، يمكننا ضمان الفوائد للصحة العامة والبشرية والبيئية."

تم نشر نتائج الفريق في عدد 12 نوفمبر 2020 من المجلة طبيعة سجية.


كيف يقرر العلماء أي جينومات حيوانية يجب ترتيب تسلسلها

ما هو القاسم المشترك بين الضفادع الأفريقية وإنسان الغاب والماعز المخالب؟ لقد نظر علماء الوراثة بعمق في جيناتهم: لقد تم تسلسل جينومات هذه الأنواع بالكامل.

المحتوى ذو الصلة

ربما سمعت عن إمكانية الحصول على تسلسل الجينوم الكامل الخاص بك. قبل بضع سنوات ، انخفض سعر تسلسل الجينوم البشري # 160 إلى 1000 دولار. إنه ليس تغييرًا في الجيب ، ولكنه ليس 2.7 مليار دولار تكلفته لتسلسل الجينوم البشري الأول. مع الحيوانات ، الأمر أكثر تعقيدًا. نظرًا لعدم وجود تسلسل للأنواع الأخرى من هذا النوع ، فمن الصعب تجميع الجينوم معًا دون أي مرجع.

الدودة C. ايليجانس أصبح أول حيوان يحصل على تسلسل الجينوم # 160 ، & # 160 في 1998. منذ ذلك الحين ، سمحت التكنولوجيا الأفضل لتسلسل الجينوم # 160 للعلماء بالانتقال إلى كائنات أكثر تعقيدًا بشكل ملحوظ وإجراء التسلسل بسرعة وفعالية أكبر. & # 160

لكن لا يزال من غير المحتمل أن يقوم العلماء بتسلسل جينوم كل حيوان على الإطلاق. عليهم أن يختاروا ويختاروا. إذن & # 160 من أين نبدأ؟

& # 8217s لا يوجد معيار واحد يتم على أساسه اتخاذ هذا القرار. في بعض الأحيان ، يكون رفع مستوى الوعي حول الأنواع وفوائدها المحتملة للبشرية هو السبب الذي دفع الباحثين من جامعة سنغافورة الوطنية إلى تقديم طلب للحصول على تمويل لتسلسل أفعى حفرة المعبد وجينوم # 8217s في وقت سابق من هذا العام ، & # 160 يكتب سامانثا بوه سنغافورة تايمز. الأفعى هي & # 8220 أنواع الثعابين الوحيدة المعروفة بإنتاج سموم تسمى waglerin ، & # 8221 تكتب & # 8211 & # 8220a المانع العصبي العضلي الذي يعتقد العلماء أنه يمكن تطويره إلى عقار مرخي للعضلات. & # 8221

بالإضافة إلى الفوائد الطبية المحتملة لتسلسل الجينوم ، فإن هذه الممارسة مهمة للعلم الأساسي & # 8211 والتاريخ & # 8211 فهم العالم. & # 8220 تقع في جينومات الأنواع الحية هي الآثار التاريخية للأحداث التكيفية التي أدت بها إلى ما هي عليه اليوم ، & # 8221 قال ستيفن أو & # 8217 برين ، رئيس مختبر التنوع الجينومي ، في أحد المؤتمرات.

يمكن أن تخبر دراسة الجينوم الحالي للحيوانات العلماء عن ماضيهم كنوع & # 8211 وتاريخ البيئات التي عاشوا فيها والأنواع الأخرى التي عاشت معهم. على سبيل المثال ، يمكن أن تساعد جينومات الحيوانات الأليفة في تفسير ماضي الإنسانية. تم تغيير كل من البشر والحيوانات مثل الأبقار والخنازير (واستمر التغيير) عندما استقر جزء من البشرية وبدأ في الزراعة. تساعد دراسة كيفية تطورها عندما أصبحت مستأنسة علماء الوراثة على فهم العوامل في التطور البشري القديم ، ويمكن أن تساعد في تفسير متى تم تدجين الحيوانات بالضبط.

تمتلك جينومات هذه الحيوانات الأليفة الكثير لتقدمه للبشرية أيضًا. & # 8220 الجينومات المرجعية الدقيقة مهمة لفهم الكائن الحي وعلم الأحياء # 8217 ، للتعرف على الأسباب الوراثية للصحة والمرض ، وفي الحيوانات ، لاتخاذ قرارات التربية ، & # 8221 & # 160 وفقًا لـ & # 160a National Human Genome Research Institute Press إفراج. & # 160

في بعض الأحيان ، يساعد تسلسل جينوم الحيوان & # 8217s العلماء على البقاء متيقظين. قام باحثون كنديون يعملون عادة على الجينوم البشري بتسلسل جينوم القندس # 8217s في وقت سابق من هذا العام احتفالًا بعيد ميلاد كندا الـ 150 رقم 8217. & # 8220 معظم جهودنا على الجينوم البشري ، وقال لي العالم ستيفن شيرير # 8221. & # 8220 ولكنه في الواقع يحفزنا فكريًا على النظر إلى ما وراء ما نفعله & # 8217re. & # 8221 لم يضر أن القندس هو الرمز الوطني لكندا. لأنه في بعض الأحيان ، تكون العلاقات العامة الجيدة ذات سبب كأي سبب آخر.

Papadum ، عنزة San Clemente التي أعيد بناء جينومها باستخدام تقنية جديدة في وقت سابق من هذا العام. (بريان إل ساير)

حول كات إشنر

كات إشنر صحفية مستقلة في مجال العلوم والثقافة مركزها تورونتو.


محتويات

كانت طرق تسلسل الحمض النووي المستخدمة في السبعينيات والثمانينيات من القرن الماضي يدوية ، على سبيل المثال تسلسل ماكسام جيلبرت وتسلسل سانجر. تم ترتيب العديد من الجينوم البكتيري والفيروسي الحيواني بالكامل من خلال هذه التقنيات ، ولكن التحول إلى طرق التسلسل الآلي الأكثر سرعة في التسعينيات سهّل تسلسل الجينومات البكتيرية وحقيقية النواة الأكبر حجمًا. [10]

كان الكائن الحي الأول الذي حصل على تسلسل الجينوم بأكمله المستدمية النزلية في عام 1995. [11] بعد ذلك ، تم تسلسل جينومات البكتيريا الأخرى وبعض العتائق لأول مرة ، ويرجع ذلك إلى حد كبير إلى صغر حجم جينومها. المستدمية النزلية يحتوي على جينوم مكون من 1،830،140 زوجًا أساسيًا من الحمض النووي. [11] في المقابل ، حقيقيات النوى ، أحادية الخلية ومتعددة الخلايا مثل الأميبا الدوبيا والبشر (الانسان العاقل) على التوالي ، لديها جينومات أكبر بكثير (انظر مفارقة القيمة C). [12] الأميبا الدوبيا يحتوي على جينوم مكون من 700 مليار زوج نيوكليوتيد منتشر عبر آلاف الكروموسومات. [13] يحتوي البشر على عدد أقل من أزواج النوكليوتيدات (حوالي 3.2 مليار في كل خلية جرثومية - لاحظ أن الحجم الدقيق للجينوم البشري لا يزال قيد المراجعة) من أ.دوبيا لكن حجم الجينوم الخاص بها يفوق بكثير حجم الجينوم للبكتيريا الفردية. [14]

أول جينومات بكتيرية وأثرية ، بما في ذلك جينوم المستدمية النزلية، من خلال تسلسل البندقية. [11] في عام 1996 ، ظهر أول جينوم حقيقي النواة (خميرة الخميرة) تم تسلسله. S. cerevisiae، وهو كائن حي نموذجي في علم الأحياء يحتوي على جينوم يتكون من حوالي 12 مليون زوج من النوكليوتيدات فقط ، [15] وكان أول وحيدة الخلية حقيقيات النوى للحصول على تسلسل الجينوم الكامل. الأول متعدد الخلايا حقيقيات النوى ، والحيوان ، لتسلسل الجينوم الكامل كان دودة الديدان الخيطية: أنواع معينة انيقة في عام 1998. [16] يتم تسلسل الجينومات حقيقية النواة بعدة طرق بما في ذلك تسلسل البندقية لشظايا الحمض النووي القصيرة وتسلسل استنساخ الحمض النووي الأكبر حجمًا من مكتبات الحمض النووي مثل الكروموسومات الاصطناعية البكتيرية (BACs) والكروموسومات الاصطناعية للخميرة (YACs). [17]

في عام 1999 ، تم نشر تسلسل الحمض النووي الكامل للكروموسوم البشري 22 ، وهو أقصر جسيم جسمي بشري. [18] بحلول عام 2000 ، تم وضع تسلسل جينوم للحيوان الثاني والثاني من اللافقاريات (لكن الحشرة الأولى) - وهو جينوم ذبابة الفاكهة ذبابة الفاكهة سوداء البطن - اختيار شائع للكائن الحي في البحث التجريبي. [19] أول جينوم نباتي - جينوم الكائن الحي نبات الأرابيدوبسيس thaliana - تم أيضًا تسلسله بالكامل بحلول عام 2000. [20] بحلول عام 2001 ، تم نشر مسودة لتسلسل الجينوم البشري بأكمله. [21] جينوم فأر المختبر موس العضلات اكتمل في عام 2002. [22]

في عام 2004 ، نشر مشروع الجينوم البشري نسخة غير كاملة من الجينوم البشري. [23] في عام 2008 ، أبلغت مجموعة من لايدن بهولندا عن تسلسل أول جينوم بشري أنثوي (مارجولين كريك).

الخلايا المستخدمة في تحرير التسلسل

يمكن لأي عينة بيولوجية تحتوي على نسخة كاملة من الحمض النووي - حتى كمية صغيرة جدًا من الحمض النووي أو الحمض النووي القديم - أن توفر المادة الجينية اللازمة لتسلسل الجينوم الكامل. قد تشمل هذه العينات اللعاب أو الخلايا الظهارية أو نخاع العظام أو الشعر (طالما أن الشعر يحتوي على بصيلات الشعر) أو البذور أو أوراق النبات أو أي شيء آخر يحتوي على خلايا تحتوي على الحمض النووي.

يمكن تحديد تسلسل الجينوم لخلية واحدة مختارة من مجموعة مختلطة من الخلايا باستخدام تقنيات تسلسل جينوم الخلية الواحدة. هذا له مزايا مهمة في علم الأحياء الدقيقة البيئي في الحالات التي يمكن فيها عزل خلية واحدة من نوع معين من الكائنات الحية الدقيقة عن مجموعة مختلطة عن طريق الفحص المجهري على أساس خصائصها المورفولوجية أو غيرها من الخصائص المميزة. في مثل هذه الحالات ، قد يتم حذف الخطوات الضرورية عادة لعزل ونمو الكائن الحي في الثقافة ، مما يسمح بتسلسل طيف أكبر بكثير من جينومات الكائن الحي. [24]

يتم اختبار تسلسل الجينوم أحادي الخلية كطريقة للتشخيص الجيني قبل الانغراس ، حيث يتم أخذ خلية من الجنين الناتج عن الإخصاب في المختبر وتحليلها قبل نقل الجنين إلى الرحم. [25] بعد الزرع ، يمكن أخذ الحمض النووي للجنين الخالي من الخلايا عن طريق بزل الوريد البسيط من الأم واستخدامه في تسلسل الجينوم الكامل للجنين. [26]

تقنيات مبكرة تحرير

تم إنجاز تسلسل جينوم بشري كامل تقريبًا لأول مرة في عام 2000 جزئيًا من خلال استخدام تقنية تسلسل البنادق. في حين أن التسلسل الكامل لبندقية الجينوم للجينوم الصغير (4000-7000 زوج أساسي) كان قيد الاستخدام بالفعل في عام 1979 ، [27] استفاد التطبيق الأوسع من تسلسل النهاية الزوجي ، المعروف بالعامية باسم تسلسل بندقية مزدوجة الماسورة. عندما بدأت مشاريع التسلسل في أخذ جينومات أطول وأكثر تعقيدًا ، بدأت مجموعات متعددة في إدراك أنه يمكن الحصول على معلومات مفيدة من خلال تسلسل طرفي جزء من الحمض النووي. على الرغم من أن تسلسل طرفي نفس الجزء وتتبع البيانات المقترنة كان أكثر تعقيدًا من تسلسل نهاية واحدة من جزأين مختلفين ، إلا أن معرفة أن التسلسلين تم توجيههما في اتجاهين متعاكسين وكانا بطول الجزء بعيدًا عن كل منهما. الآخر كان ذا قيمة في إعادة بناء تسلسل جزء الهدف الأصلي.

كان أول وصف منشور لاستخدام النهايات المزدوجة في عام 1990 كجزء من تسلسل موضع HPRT البشري ، [28] على الرغم من أن استخدام الأطراف المزدوجة كان مقصورًا على سد الفجوات بعد تطبيق نهج تسلسل البندقية التقليدي. كان أول وصف نظري لإستراتيجية التسلسل النهائي الزوجي الخالص ، بافتراض أجزاء ذات طول ثابت ، في عام 1991. [29] في عام 1995 تم تقديم ابتكار استخدام أجزاء ذات أحجام مختلفة ، [30] وأثبت أن التسلسل النهائي الزوجي الخالص ستكون الاستراتيجية ممكنة على أهداف كبيرة. تم اعتماد الاستراتيجية لاحقًا من قبل معهد الأبحاث الجينومية (TIGR) لتسلسل الجينوم الكامل للبكتيريا المستدمية النزلية في عام 1995 ، [31] ثم بواسطة شركة Celera Genomics لتسلسل جينوم ذبابة الفاكهة بالكامل في عام 2000 ، [32] وبالتالي الجينوم البشري بأكمله. قامت شركة Applied Biosystems ، التي تسمى الآن Life Technologies ، بتصنيع أجهزة التسلسل الشعري الآلي التي يستخدمها كل من Celera Genomics و The Human Genome Project.

تحرير التقنيات الحالية

في حين أن التسلسل الشعري كان النهج الأول لتسلسل الجينوم البشري شبه الكامل بنجاح ، إلا أنه لا يزال مكلفًا للغاية ويستغرق وقتًا طويلاً للأغراض التجارية. منذ عام 2005 تم إزاحة التسلسل الشعري تدريجياً عن طريق تقنيات التسلسل عالية الإنتاجية ("الجيل التالي" سابقًا) مثل تسلسل صبغة Illumina ، والتسلسل الحراري ، وتسلسل SMRT. [33] كل هذه التقنيات تستمر في توظيف إستراتيجية البندقية الأساسية ، وبالتحديد الموازاة وتوليد القوالب عبر تجزئة الجينوم.

تقنيات أخرى آخذة في الظهور ، بما في ذلك تكنولوجيا النانو. على الرغم من أن تقنية تسلسل النانو لا تزال قيد التطوير ، إلا أن قابليتها للنقل وقدرتها المحتملة على توليد قراءات طويلة ذات صلة بتطبيقات تسلسل الجينوم الكامل. [34]

تحرير التحليل

من حيث المبدأ ، يمكن أن يوفر تسلسل الجينوم الكامل تسلسل النيوكليوتيدات الخام للحمض النووي للكائن الحي. ومع ذلك ، يجب إجراء مزيد من التحليل لتوفير المعنى البيولوجي أو الطبي لهذا التسلسل ، مثل كيفية استخدام هذه المعرفة للمساعدة في منع المرض. طرق لتحليل تسلسل البيانات يجري تطويرها وصقلها.

نظرًا لأن التسلسل يولد الكثير من البيانات (على سبيل المثال ، هناك ما يقرب من ستة مليارات زوج أساسي في كل جينوم ثنائي الصبغة البشري) ، يتم تخزين مخرجاته إلكترونيًا ويتطلب قدرًا كبيرًا من طاقة الحوسبة وسعة التخزين.

بينما يمكن أن يكون تحليل بيانات WGS بطيئًا ، فمن الممكن تسريع هذه الخطوة باستخدام أجهزة مخصصة. [35]

يتنافس عدد من الشركات العامة والخاصة لتطوير منصة كاملة لتسلسل الجينوم تكون قوية تجاريًا لكل من البحث والاستخدام السريري ، [36] بما في ذلك Illumina ، [37] Knome ، [38] Sequenom ، [39] 454 Life Sciences ، [40] Pacific Biosciences ، [41] علم الجينوم الكامل ، [42] Helicos Biosciences ، [43] GE Global Research (General Electric) ، Affymetrix ، IBM ، Intelligent Bio-Systems ، [44] Life Technologies ، Oxford Nanopore Technologies ، [45] ] ومعهد بكين لعلم الجينوم. [46] [47] [48] يتم تمويل هذه الشركات ودعمها بشكل كبير من قبل أصحاب رؤوس الأموال ، وصناديق التحوط ، والبنوك الاستثمارية. [49] [50]

كان الهدف التجاري المشهور لتكلفة التسلسل حتى أواخر عام 2010 هو 1000 دولار ، ومع ذلك ، تعمل الشركات الخاصة للوصول إلى هدف جديد بقيمة 100 دولار فقط. [51]

تحرير الحوافز

في أكتوبر 2006 ، أنشأت مؤسسة X Prize ، بالتعاون مع مؤسسة J. Craig Venter Science Foundation ، جائزة Archon X لعلم الجينوم ، [52] بهدف منح 10 ملايين دولار "للفريق الأول الذي يمكنه بناء جهاز واستخدامه لتسلسل 100 جينوم بشري في غضون 10 أيام أو أقل ، بدقة لا تزيد عن خطأ واحد في كل 1000000 قاعدة متسلسلة ، مع تسلسل يغطي بدقة ما لا يقل عن 98٪ من الجينوم ، وبتكلفة متكررة لا تزيد عن 1000 دولار لكل جينوم ". [53] ألغيت جائزة Archon X لعلم الجينوم في عام 2013 ، قبل تاريخ بدايتها الرسمي. [54] [55]

تحرير التاريخ

في عام 2007 ، بدأت شركة Applied Biosystems في بيع نوع جديد من أجهزة التسلسل يسمى نظام SOLiD. [56] سمحت التكنولوجيا للمستخدمين بتسلسل 60 جيجا بايت في كل شوط. [57]

في يونيو 2009 ، أعلنت شركة Illumina أنها أطلقت خدمة تسلسل الجينوم الكامل الشخصية الخاصة بها على عمق 30 × مقابل 48000 دولار لكل جينوم. [58] [59] في أغسطس ، صرح ستيفن كويك ، مؤسس شركة Helicos Biosciences ، أنه باستخدام جهاز تسلسل الجزيء الأحادي التابع للشركة ، قام بتسلسل الجينوم الكامل الخاص به بأقل من 50000 دولار. [60] في نوفمبر ، نشرت شركة Complete Genomics ورقة تمت مراجعتها من قبل الزملاء في علم يوضح قدرته على تسلسل جينوم بشري كامل مقابل 1700 دولار. [61] [62]

In May 2011, Illumina lowered its Full Genome Sequencing service to $5,000 per human genome, or $4,000 if ordering 50 or more. [63] Helicos Biosciences, Pacific Biosciences, Complete Genomics, Illumina, Sequenom, ION Torrent Systems, Halcyon Molecular, NABsys, IBM, and GE Global appear to all be going head to head in the race to commercialize full genome sequencing. [33] [64]

With sequencing costs declining, a number of companies began claiming that their equipment would soon achieve the $1,000 genome: these companies included Life Technologies in January 2012, [65] Oxford Nanopore Technologies in February 2012, [66] and Illumina in February 2014. [67] [68] In 2015, the NHGRI estimated the cost of obtaining a whole-genome sequence at around $1,500. [69] In 2016, Veritas Genetics began selling whole genome sequencing, including a report as to some of the information in the sequencing for $999. [70] In summer 2019 Veritas Genetics cut the cost for WGS to $599. [71] In 2017, BGI began offering WGS for $600. [72]

However, in 2015 some noted that effective use of whole gene sequencing can cost considerably more than $1000. [73] Also, reportedly there remain parts of the human genome that have not been fully sequenced by 2017. [74] [75] [76]

DNA microarrays Edit

Full genome sequencing provides information on a genome that is orders of magnitude larger than by DNA arrays, the previous leader in genotyping technology.

For humans, DNA arrays currently provide genotypic information on up to one million genetic variants, [77] [78] [79] while full genome sequencing will provide information on all six billion bases in the human genome, or 3,000 times more data. Because of this, full genome sequencing is considered a disruptive innovation to the DNA array markets as the accuracy of both range from 99.98% to 99.999% (in non-repetitive DNA regions) and their consumables cost of $5000 per 6 billion base pairs is competitive (for some applications) with DNA arrays ($500 per 1 million basepairs). [40]

Mutation frequencies Edit

Whole genome sequencing has established the mutation frequency for whole human genomes. The mutation frequency in the whole genome between generations for humans (parent to child) is about 70 new mutations per generation. [80] [81] An even lower level of variation was found comparing whole genome sequencing in blood cells for a pair of monozygotic (identical twins) 100-year-old centenarians. [82] Only 8 somatic differences were found, though somatic variation occurring in less than 20% of blood cells would be undetected.

In the specifically protein coding regions of the human genome, it is estimated that there are about 0.35 mutations that would change the protein sequence between parent/child generations (less than one mutated protein per generation). [83]

In cancer, mutation frequencies are much higher, due to genome instability. This frequency can further depend on patient age, exposure to DNA damaging agents (such as UV-irradiation or components of tobacco smoke) and the activity/inactivity of DNA repair mechanisms. [ بحاجة لمصدر ] Furthermore, mutation frequency can vary between cancer types: in germline cells, mutation rates occur at approximately 0.023 mutations per megabase, but this number is much higher in breast cancer (1.18-1.66 somatic mutations per Mb), in lung cancer (17.7) or in melanomas (≈33). [84] Since the haploid human genome consists of approximately 3,200 megabases, [85] this translates into about 74 mutations (mostly in noncoding regions) in germline DNA per generation, but 3,776-5,312 somatic mutations per haploid genome in breast cancer, 56,640 in lung cancer and 105,600 in melanomas.

The distribution of somatic mutations across the human genome is very uneven, [86] such that the gene-rich, early-replicating regions receive fewer mutations than gene-poor, late-replicating heterochromatin, likely due to differential DNA repair activity. [87] In particular, the histone modification H3K9me3 is associated with high, [88] and H3K36me3 with low mutation frequencies. [89]

Genome-wide association studies Edit

In research, whole-genome sequencing can be used in a Genome-Wide Association Study (GWAS) - a project aiming to determine the genetic variant or variants associated with a disease or some other phenotype. [90]

Diagnostic use Edit

In 2009, Illumina released its first whole genome sequencers that were approved for clinical as opposed to research-only use and doctors at academic medical centers began quietly using them to try to diagnose what was wrong with people whom standard approaches had failed to help. [91] In 2009, a team from Stanford led by Euan Ashley performed clinical interpretation of a full human genome, that of bioengineer Stephen Quake. [92] In 2010, Ashley’s team reported whole genome molecular autopsy [93] and in 2011, extended the interpretation framework to a fully sequenced family, the West family, who were the first family to be sequenced on the Illumina platform. [94] The price to sequence a genome at that time was US$19,500, which was billed to the patient but usually paid for out of a research grant one person at that time had applied for reimbursement from their insurance company. [91] For example, one child had needed around 100 surgeries by the time he was three years old, and his doctor turned to whole genome sequencing to determine the problem it took a team of around 30 people that included 12 bioinformatics experts, three sequencing technicians, five physicians, two genetic counsellors and two ethicists to identify a rare mutation in the XIAP that was causing widespread problems. [91] [95] [96]

Due to recent cost reductions (see above) whole genome sequencing has become a realistic application in DNA diagnostics. In 2013, the 3Gb-TEST consortium obtained funding from the European Union to prepare the health care system for these innovations in DNA diagnostics. [97] [98] Quality assessment schemes, Health technology assessment and guidelines have to be in place. The 3Gb-TEST consortium has identified the analysis and interpretation of sequence data as the most complicated step in the diagnostic process. [99] At the Consortium meeting in Athens in September 2014, the Consortium coined the word genotranslation for this crucial step. This step leads to a so-called genoreport. Guidelines are needed to determine the required content of these reports.

Genomes2People (G2P), an initiative of Brigham and Women's Hospital and Harvard Medical School was created in 2011 to examine the integration of genomic sequencing into clinical care of adults and children. [100] G2P's director, Robert C. Green, had previously led the REVEAL study — Risk EValuation and Education for Alzheimer's Disease – a series of clinical trials exploring patient reactions to the knowledge of their genetic risk for Alzheimer's. [101] [102]

In 2018, researchers at Rady Children's Institute for Genomic Medicine in San Diego, CA determined that rapid whole-genome sequencing (rWGS) can diagnose genetic disorders in time to change acute medical or surgical management (clinical utility) and improve outcomes in acutely ill infants. The researchers reported a retrospective cohort study of acutely ill inpatient infants in a regional children's hospital from July 2016-March 2017. Forty-two families received rWGS for etiologic diagnosis of genetic disorders. The diagnostic sensitivity of rWGS was 43% (eighteen of 42 infants) and 10% (four of 42 infants) for standard genetic tests (P = .0005). The rate of clinical utility of rWGS (31%, thirteen of 42 infants) was significantly greater than for standard genetic tests (2%, one of 42 P = .0015). Eleven (26%) infants with diagnostic rWGS avoided morbidity, one had a 43% reduction in likelihood of mortality, and one started palliative care. In six of the eleven infants, the changes in management reduced inpatient cost by $800,000-$2,000,000. These findings replicate a prior study of the clinical utility of rWGS in acutely ill inpatient infants, and demonstrate improved outcomes and net healthcare savings. rWGS merits consideration as a first tier test in this setting. [103]

Rare variant association study Edit

Whole genome sequencing studies enable the assessment of associations between complex traits and both coding and noncoding rare variants (minor allele frequency (MAF) < 1%) across the genome. Single-variant analyses typically have low power to identify associations with rare variants, and variant set tests have been proposed to jointly test the effects of given sets of multiple rare variants. [104] SNP annotations help to prioritize rare functional variants, and incorporating these annotations can effectively boost the power of genetic association of rare variants analysis of whole genome sequencing studies. [105]

The introduction of whole genome sequencing may have ethical implications. [106] On one hand, genetic testing can potentially diagnose preventable diseases, both in the individual undergoing genetic testing and in their relatives. [106] On the other hand, genetic testing has potential downsides such as genetic discrimination, loss of anonymity, and psychological impacts such as discovery of non-paternity. [107]

Some ethicists insist that the privacy of individuals undergoing genetic testing must be protected. [106] Indeed, privacy issues can be of particular concern when minors undergo genetic testing. [108] Illumina's CEO, Jay Flatley, claimed in February 2009 that "by 2019 it will have become routine to map infants' genes when they are born". [109] This potential use of genome sequencing is highly controversial, as it runs counter to established ethical norms for predictive genetic testing of asymptomatic minors that have been well established in the fields of medical genetics and genetic counseling. [110] [111] [112] [113] The traditional guidelines for genetic testing have been developed over the course of several decades since it first became possible to test for genetic markers associated with disease, prior to the advent of cost-effective, comprehensive genetic screening.

When an individual undergoes whole genome sequencing, they reveal information about not only their own DNA sequences, but also about probable DNA sequences of their close genetic relatives. [106] This information can further reveal useful predictive information about relatives' present and future health risks. [114] Hence, there are important questions about what obligations, if any, are owed to the family members of the individuals who are undergoing genetic testing. In Western/European society, tested individuals are usually encouraged to share important information on any genetic diagnoses with their close relatives, since the importance of the genetic diagnosis for offspring and other close relatives is usually one of the reasons for seeking a genetic testing in the first place. [106] Nevertheless, a major ethical dilemma can develop when the patients refuse to share information on a diagnosis that is made for serious genetic disorder that is highly preventable and where there is a high risk to relatives carrying the same disease mutation. Under such circumstances, the clinician may suspect that the relatives would rather know of the diagnosis and hence the clinician can face a conflict of interest with respect to patient-doctor confidentiality. [106]

Privacy concerns can also arise when whole genome sequencing is used in scientific research studies. Researchers often need to put information on patient's genotypes and phenotypes into public scientific databases, such as locus specific databases. [106] Although only anonymous patient data are submitted to locus specific databases, patients might still be identifiable by their relatives in the case of finding a rare disease or a rare missense mutation. [106] Public discussion around the introduction of advanced forensic techniques (such as advanced familial searching using public DNA ancestry websites and DNA phenotyping approaches) has been limited, disjointed, and unfocused. As forensic genetics and medical genetics converge toward genome sequencing, issues surrounding genetic data become increasingly connected, and additional legal protections may need to be established. [115]

The first nearly complete human genomes sequenced were two Americans of predominantly Northwestern European ancestry in 2007 (J. Craig Venter at 7.5-fold coverage, [116] [117] [118] and James Watson at 7.4-fold). [119] [120] [121] This was followed in 2008 by sequencing of an anonymous Han Chinese man (at 36-fold), [122] a Yoruban man from Nigeria (at 30-fold), [123] a female clinical geneticist (Marjolein Kriek) from the Netherlands (at 7 to 8-fold), and a female caucasian Leukemia patient (at 33 and 14-fold coverage for tumor and normal tissues). [124] Steve Jobs was among the first 20 people to have their whole genome sequenced, reportedly for the cost of $100,000. [125] As of June 2012 [update] , there were 69 nearly complete human genomes publicly available. [126] In November 2013, a Spanish family made their personal genomics data publicly available under a Creative Commons public domain license. The work was led by Manuel Corpas and the data obtained by direct-to-consumer genetic testing with 23andMe and the Beijing Genomics Institute). This is believed to be the first such Public Genomics dataset for a whole family. [127]


مراجع

Egea, L. A., Merida-Garcia, R., Kilian, A., Hernandez, P. & Dorado, G. Assessment of genetic diversity and structure of large garlic (Allium sativum) germplasm bank, by diversity arrays technology “genotyping-by-sequencing” platform (DArTseq). أمام. جينيه. 8, 98 (2017).

Peska, V., Mandakova, T., Ihradska, V. & Fajkus, J. Comparative dissection of three giant genomes: أليوم سيبا, Allium sativum، و Allium ursinum. كثافة العمليات جيه مول. علوم. 20, E733 (2019).

لي ، هـ وآخرون. The wolds of wine: old, new and ancient. Wine Econ. Pol. 7, 178–182 (2018).

Zheng, Z., Chen, J. & Deng, X. Historical perspectives, management, and current research of citrus HLB in Guangdong Province of China, where the disease has been endemic for over a hundred years. علم أمراض النبات 108, 1224–1236 (2018).

Hubner, S. et al. Sunflower pan-genome analysis shows that hybridization altered gene content and disease resistance. نات. النباتات 5, 54–62 (2019).

Jaillon, O. et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. طبيعة سجية 449, 463–467 (2007).

Leisner, C. P. et al. Genome sequence of M6, a diploid inbred clone of the high-glycoalkaloid-producing tuber-bearing potato species Solanum chacoense, reveals residual heterozygosity. مصنع J. 94, 562–570 (2018).

Chen, F. et al. The sequenced angiosperm genomes and genome databases. أمام. علوم النبات. 9, 418 (2018).

Gardner, E. M., Johnson, M. G., Ragone, D., Wickett, N. J. & Zerega, N. J. Low-coverage, whole-genome sequencing of Artocarpus camansi (Moraceae) for phylogenetic marker development and gene discovery. Appl Plant Sci. 4, apps.1600017 (2016).

Mori, K. et al. Identification of RAN1 orthologue associated with sex determination through whole genome sequencing analysis in fig (Ficus carica L.). علوم. اعادة عد. 7, 41124 (2017).

Liu, M. J. et al. The complex jujube genome provides insights into fruit tree biology. نات. كومون. 5, 5315 (2014).

Edger, P. P. et al. Origin and evolution of the octoploid strawberry genome. نات. جينيه. 51, 541–547 (2019).

Shulaev, V. et al. The genome of woodland strawberry (فراغاريا فيسكا). نات. جينيه. 43, 109–116 (2011).

Hirakawa, H. et al. Dissection of the octoploid strawberry genome by deep sequencing of the genomes of Fragaria محيط. الدقة DNA. 21, 169–181 (2014).

Velasco, R. et al. The genome of the domesticated apple (Malus x domestica Borkh.). نات. جينيه. 42, 833–839 (2010).

He, N. et al. Draft genome sequence of the mulberry tree Morus notabilis. نات. كومون. 4, 2445 (2013).

Shirasawa, K. et al. The genome sequence of sweet cherry (Prunus avium) for use in genomics-assisted breeding. الدقة DNA. 24, 499–508 (2017).

Verde, I. et al. The high-quality draft genome of peach (Prunus persica) identifies unique patterns of genetic diversity, domestication and genome evolution. نات. جينيه. 45, 487–494 (2013).

وو ، ج. وآخرون. The genome of the pear (Pyrus bretschneideri Rehd.). الدقة الجينوم. 23, 396–408 (2013).

Chagne, D. et al. The draft genome sequence of European pear (Pyrus communis L. ‘Bartlett’). بلوس واحد 9, e92644 (2014).

VanBuren, R. et al. A near complete, chromosome-scale assembly of the black raspberry (Rubus occidentalis) genome. جيجاسينس 7, giy094 (2018).

Zhang, Q. X. et al. The genome of Prunus mume. نات. كومون. 3, 1318 (2012).

Baek, S. et al. Draft genome sequence of wild Prunus yedoensis reveals massive inter-specific hybridization between sympatric flowering cherries. جينوم بيول. 19, 127 (2018).

Nakamura, N. et al. Genome structure of روزا مولتيفلورا, a wild ancestor of cultivated roses. الدقة DNA. 25, 113–121 (2018).

Raymond, O. et al. ال Rosa genome provides new insights into the domestication of modern roses. نات. جينيه. 50, 772–777 (2018).

Lu, M., An, H. M. & Li, L. L. Genome survey sequencing for the characterization of the genetic background of Rosa roxburghii tratt and leaf ascorbate metabolism genes. بلوس واحد 11, e0147530 (2016).

تشانغ ، ل. وآخرون. A high-quality apple genome assembly reveals the association of a retrotransposon and red fruit colour. نات. كومون. 10, 1494 (2019).

ساتو ، إس وآخرون. The tomato genome sequence provides insights into fleshy fruit evolution. طبيعة سجية 485, 635–641 (2012).

Razali, R. et al. The genome sequence of the wild tomato Solanum pimpinellifolium provides insights into salinity tolerance. أمام. علوم النبات. 9, 1402 (2018).

Xu, X. et al. Genome sequence and analysis of the tuber crop potato. طبيعة سجية 475, 189–194 (2011).

Qin, C. et al. Whole-genome sequencing of cultivated and wild peppers provides insights into الفليفلة domestication and specialization. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 111, 5135–5140 (2014).

Kim, S. et al. Genome sequence of the hot pepper provides insights into the evolution of pungency in الفليفلة محيط. نات. جينيه. 46, 270–278 (2014).

Ahn, Y. K. et al. Whole genome resequencing of الفليفلة الباكيتية و الفليفلة الحولية to discover single nucleotide polymorphism related to Powdery Mildew مقاومة. علوم. اعادة عد. 8, 5188 (2018).

Hirakawa, H. et al. Draft genome sequence of eggplant (Solanum melongena L.): the representative solanum species indigenous to the old world. الدقة DNA. 21, 649–660 (2014).

Hoshino, A. et al. Genome sequence and analysis of the Japanese morning glory Ipomoea nil. نات. كومون. 7, 13295 (2016).

Sierro, N. et al. Reference genomes and transcriptomes of Nicotiana sylvestris و Nicotiana tomentosiformis. جينوم بيول. 14, R60 (2013).

Bombarely, A. et al. Insight into the evolution of the Solanaceae from the parental genomes of Petunia hybrida. نات. النباتات 2, 16074 (2016).

Ruggieri, V., Bostan, H., Barone, A., Frusciante, L. & Chiusano, M. L. Integrated bioinformatics to decipher the ascorbic acid metabolic network in tomato. مصنع مول. بيول. 91, 397–412 (2016).

Sierro, N. et al. The tobacco genome sequence and its comparison with those of tomato and potato. نات. كومون. 5, 3833 (2014).

Varshney, R. K. et al. Draft genome sequence of pigeonpea (Cajanus cajan), an orphan legume crop of resource-poor farmers. نات. التكنولوجيا الحيوية. 30, 83–89 (2012).

Varshney, R. K. et al. Draft genome sequence of chickpea (Cicer arietinum) provides a resource for trait improvement. نات. التكنولوجيا الحيوية. 31, 240–246 (2013).

Gupta, S. et al. Draft genome sequence of Cicer شبكي L., the wild progenitor of chickpea provides a resource for agronomic trait improvement. الدقة DNA. 24, 1–10 (2017).

Schmutz, J. et al. Genome sequence of the palaeopolyploid soybean. طبيعة سجية 463, 178–183 (2010).

Young, N. D. et al. ال ميديكاغو genome provides insight into the evolution of rhizobial symbioses. طبيعة سجية 480, 520–524 (2011).

Schmutz, J. et al. A reference genome for common bean and genome-wide analysis of dual domestications. نات. جينيه. 46, 707–713 (2014).

Cooper, J. W. et al. Enhancing faba bean (Vicia faba L.) genome resources. ياء إكسب. بوت. 68, 1941–1953 (2017).

Kang, Y. J. et al. Draft genome sequence of adzuki bean, Vigna angularis. علوم. اعادة عد. 5, 8069 (2015).

Kang, Y. J. et al. Genome sequence of mungbean and insights into evolution within Vigna محيط. نات. كومون. 5, 5443 (2014).

Griesmann, M. et al. Phylogenomics reveals multiple losses of nitrogen-fixing root nodule symbiosis. علم 361, eaat1743 (2018).

Hane, J. K. et al. A comprehensive draft genome sequence for lupin (Lupinus angustifolius), an emerging health food: insights into plant-microbe interactions and legume evolution. التكنولوجيا الحيوية النباتية. ج. 15, 318–330 (2017).

Mochida, K. et al. Draft genome assembly and annotation of Glycyrrhiza uralensis, a medicinal legume. مصنع J. 89, 181–194 (2017).

De Vega, J. J. et al. Red clover (Trifolium pratense L.) draft genome provides a platform for trait improvement. علوم. اعادة عد. 5, 17394 (2015).

Cullis, C. & Kunert, K. J. Unlocking the potential of orphan legumes. ياء إكسب. بوت. 68, 1895–1903 (2017).

Yang, J. et al. The genome sequence of allopolyploid براسيكا جونسي and analysis of differential homoeolog gene expression influencing selection. نات. جينيه. 48, 1225–1232 (2016).

Liu, S. Y. et al. ال Brassica oleracea genome reveals the asymmetrical evolution of polyploid genomes. نات. كومون. 5, 3930 (2014).

Wang, X. W. et al. The genome of the mesopolyploid crop species براسيكا رابا. نات. جينيه. 43, 1035–1039 (2011).

Kasianov, A. S. et al. High-quality genome assembly of Capsella bursa-pastoris reveals asymmetry of regulatory elements at early stages ofpolyploid genome evolution. مصنع J. 91, 278–291 (2017).

Slotte, T. et al. ال Capsella rubella genome and the genomic consequences of rapid mating system evolution. نات. جينيه. 45, 831–835 (2013).

Kitashiba, H. et al. Draft sequences of the radish (رافانوس ساتيفوس L.) genome. الدقة DNA. 21, 481–490 (2014).

Dorn, K. M., Fankhauser, J. D., Wyse, D. L. & Marks, M. D. A draft genome of field pennycress (ثلاسبي ارفينس) provides tools for the domestication of a new winter biofuel crop. الدقة DNA. 22, 121–131 (2015).

Guo, X. et al. The genomes of two Eutrema species provide insight into plant adaptation to high altitudes. الدقة DNA. https://doi.org/10.1093/dnares/dsy003 (2018).

Zhang, J. et al. Genome of plant maca (Lepidium meyenii) illuminates genomic basis for high-altitude adaptation in the central Andes. مول. مصنع 9, 1066–1077 (2016).

Milia, G., Camiolo, S., Avesani, L. & Porceddu, A. The dynamic loss and gain of introns during the evolution of the Brassicaceae. مصنع J. 82, 915–924 (2015).

Singh, S., Das, S. & Geeta, R. A segmental duplication in the common ancestor of Brassicaceae is responsible for the origin of the paralogs KCS6-KCS5, which are not shared with other angiosperms. مول. نسالة. Evol. 126, 331–345 (2018).

Murat, F. et al. Understanding Brassicaceae evolution through ancestral genome reconstruction. جينوم بيول. 16, 262 (2015).

Barrera-Redondo, J. et al. The genome of Cucurbita argyrosperma (silver-seed gourd) reveals faster rates of protein-coding gene and long noncoding RNA turnover and neofunctionalization within Cucurbita. مول. مصنع 12, 506–520 (2019).

Sun, H. et al. Karyotype stability and unbiased fractionation in the paleo-allotetraploid cucurbita genomes. مول. مصنع 10, 1293–1306 (2017).

Montero-Pau, J. et al. De novo assembly of the zucchini genome reveals a whole-genome duplication associated with the origin of the Cucurbita genus. التكنولوجيا الحيوية النباتية. ج. 16, 1161–1171 (2018).

Wu, S. et al. The bottle gourd genome provides insights into Cucurbitaceae evolution and facilitates mapping of a Papaya ring-spot virus resistance locus. مصنع J. 92, 963–975 (2017).

Urasaki, N. et al. Draft genome sequence of bitter gourd (Momordica charantia), a vegetable and medicinal plant in tropical and subtropical regions. الدقة DNA. 24, 51–58 (2017).

Garcia-Mas, J. et al. The genome of melon (كوكوميس ميلو L.). بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 109, 11872–11877 (2012).

Guo, S. et al. The draft genome of watermelon (Citrullus lanatus) and resequencing of 20 diverse accessions. نات. جينيه. 45, 51–58 (2013).

Itkin, M. et al. The biosynthetic pathway of the nonsugar, high-intensity sweetener mogroside V from Siraitia grosvenorii. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 113, E7619–E7628 (2016).

Xia, M. et al. Improved de novo genome assembly and analysis of the Chinese cucurbit Siraitia grosvenorii, also known as monk fruit or luo-han-guo. جيجاسينس 7, giy067 (2018).

Wang, J. et al. An Overlooked paleotetraploidization in Cucurbitaceae. مول. بيول. Evol. 35, 16–26 (2018).

Yang, L. M. et al. Chromosome rearrangements during domestication of cucumber as revealed by high-density genetic mapping and draft genome assembly. مصنع J. 71, 895–906 (2012).

Shang, Y. et al. Biosynthesis, regulation, and domestication of bitterness in cucumber. علم 346, 1084–1088 (2014).

Wu, G. A. et al. Sequencing of diverse mandarin, pummelo and orange genomes reveals complex history of admixture during citrus domestication. نات. التكنولوجيا الحيوية. 32, 656–662 (2014).

Wang, X. et al. Genomic analyses of primitive, wild and cultivated citrus provide insights into asexual reproduction. نات. جينيه. 49, 765–772 (2017).

Zhang, Y., Barthe, G., Grosser, J. W. & Wang, N. Transcriptome analysis of root response to citrus blight based on the newly assembled Swingle citrumelo draft genome. علم الجينوم BMC 17, 485 (2016).

Wang, L. et al. Genome of wild mandarin and domestication history of mandarin. مول. مصنع 11, 1024–1037 (2018).

Xu, Q. et al. The draft genome of sweet orange (Citrus sinensis). نات. جينيه. 45, 59–66 (2013).

Shimizu, T. et al. Draft sequencing of the heterozygous diploid genome of satsuma (Citrus unshiu Marc.) using a hybrid assembly approach. أمام. جينيه. 8, 180 (2017).

Wu, G. A. et al. Genomics of the origin and evolution of الحمضيات. طبيعة سجية 554, 311–316 (2018).

Li, Y. H. et al. De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits. نات. التكنولوجيا الحيوية. 32, 1045–1052 (2014).

Golicz, A. A. et al. The pangenome of an agronomically important crop plant Brassica oleracea. نات. كومون. 7, 13390 (2016).

Ou, L. J. et al. Pan-genome of cultivated pepper (الفليفلة) and its use in gene presence-absence variation analyses. فيتول جديد. 220, 360–363 (2018).

Gao, L. et al. The tomato pan-genome uncovers new genes and a rare allele regulating fruit flavor. نات. جينيه. 51, 1044–1051 (2019).

Jung, S. et al. The Genome Database for Rosaceae (GDR): year 10 update. الدقة الأحماض النووية. 42, D1237–D1244 (2014).

Stein, L. D. Using GBrowse 2.0 to visualize and share next-generation sequence data. موجز Bioinform. 14, 162–171 (2013).

Westesson, O., Skinner, M. & Holmes, I. Visualizing next-generation sequencing data with JBrowse. موجز Bioinform. 14, 172–177 (2013).

Hofmeister, B. T. & Schmitz, R. J. Enhanced JBrowse plugins for epigenomics data visualization. المعلوماتية الحيوية BMC 19, 159 (2018).

Buels, R. et al. JBrowse: a dynamic web platform for genome visualization and analysis. جينوم بيول. 17, 66 (2016).

Johnson, M. et al. NCBI BLAST: a better web interface. الدقة الأحماض النووية. 36, W5–W9 (2008).

Deng, W., Nickle, D. C., Learn, G. H., Maust, B. & Mullins, J. I. ViroBLAST: a stand-alone BLAST web server for flexible queries of multiple databases and user’s datasets. المعلوماتية الحيوية 23, 2334–2336 (2007).

Potter, S. C. et al. HMMER web server: 2018 update. الدقة الأحماض النووية. 46, W200–W204 (2018).

Caspi, R. et al. The MetaCyc database of metabolic pathways and enzymes. الدقة الأحماض النووية. 46, D633–D639 (2018).

Fernandez-Pozo, N. et al. The Sol Genomics Network (SGN)-from genotype to phenotype to breeding. الدقة الأحماض النووية. 43, D1036–D1041 (2015).

Foerster, H. et al. SolCyc: a database hub at the Sol Genomics Network (SGN) for the manual curation of metabolic networks in Solanum and Nicotiana specific databases. قاعدة البيانات 2018, bay035 (2018).

Toronto International Data Release Workshop Authors et al.Prepublication data sharing. طبيعة سجية 461, 168–170 (2009).

Zheng, Y. et al. Cucurbit Genomics Database (CuGenDB): a central portal for comparative and functional genomics of cucurbit crops. الدقة الأحماض النووية. 47, D1128–D1136 (2019).

Cheng, F. et al. BRAD, the genetics and genomics database for Brassica plants. بيول مصنع بيول. 11, 136 (2011).

Wang, X. et al. HMOD: an omics database for herbal medicine plants. مول. مصنع 11, 757–759 (2018).

Lee, T. H., Tang, H. B., Wang, X. Y. & Paterson, A. H. PGDD: a database of gene and genome duplication in plants. الدقة الأحماض النووية. 41, D1152–D1158 (2013).

Qiao, X. et al. Gene duplication and evolution in recurring polyploidization-diploidization cycles in plants. جينوم بيول. 20, 38 (2019).

Tang, H. B. Disentangling a polyploid genome. نات. النباتات 3, 688–689 (2017).

Zhu, T. et al. Sequencing a Juglans regia×J. microcarpa hybrid yields high-quality genome assemblies of parental species. Hortic. الدقة. 6, 55 (2019).

Wu, G. A. & Gmitter, F. G. Novel assembly strategy cracks open the mysteries of walnut genome evolution. Hortic. الدقة. 6, 57 (2019).

Smedley, D. et al. بوابة مجتمع BioMart: بديل مبتكر لمستودعات البيانات المركزية الكبيرة. الدقة الأحماض النووية. 43, W589–W598 (2015).

Yano, K. et al. Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice. نات. جينيه. 48, 927–934 (2016).

Simao, F. A., Waterhouse, R. M., Ioannidis, P., Kriventseva, E. V. & Zdobnov, E. M. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. المعلوماتية الحيوية 31, 3210–3212 (2015).

Parra, G., Bradnam, K. & Korf, I. CEGMA: a pipeline to accurately annotate core genes in eukaryotic genomes. المعلوماتية الحيوية 23, 1061–1067 (2007).

Li, X. et al. Improved hybrid de novo genome assembly of domesticated apple (Malus x domestica). جيجاسينس 5, 35 (2016).

Daccord, N. et al. High-quality de novo assembly of the apple genome and methylome dynamics of early fruit development. نات. جينيه. 49, 1099–1106 (2017).

Bowers, R. M. et al. Minimum information about a single amplified genome (MISAG) and a metagenome-assembled genome (MIMAG) of bacteria and archaea. نات. التكنولوجيا الحيوية. 35, 725–731 (2017).


Marsupials versus mammals

Marsupials, our mammalian brethren, are found mostly in Australia and New Guinea. They have many weird features that separate them from other mammals, including a very short pregnancy, after which they shelter their very immature offspring in a pouch.

Sequences of the kangaroo and other marsupials have shed light on how these features have developed after the placental mammal-marsupial split 150 million years ago. The genome sequencing of an opossum and a small kangaroo species called the tammar wallaby show that the group may have evolved in South America, not Australia.

Analysis of the tammar wallaby genome indicates that large areas of the marsupial genome are similar to the genome of normal, placental mammals.


Human Genome Sequencing: Approaches and Applications

A list of different methods used for mapping of human genomes is given below. These techniques are also useful for the detection of normal and disease genes in humans.

1. DNA sequencing : Physical map of DNA can be identified with highest resolution.

2. Use of probes : To identify RFLPs, STS and SNPs.

3. Radiation hybrid mapping: Fragment genome into large pieces and locate markers and genes. Requires somatic cell hybrids.

4. Fluorescence in situ hybridization (FISH) : To localize a gene on chromosome.

5. Sequence tagged site (STS) mapping : Applicable to any part of DNA sequence if some sequence information is available.

6. Expressed sequence tag (EST) mapping : A variant of STS mapping expressed genes are actually mapped and located.

7. Pulsed-field gel electrophoresis (PFGE) : For the separation and isolation of large DNA fragments.

8. Cloning in vectors (plasmids, phages, variable lengths, cosmids, YACs, BACs).: To isolate DNA fragments of variable length.

9. Polymerase chain reaction (PCR) : To amplify gene fragments.

10. Chromosome walking : Useful for cloning of overlapping DNA fragments (restricted to about 200 kb).

11. Chromosome jumping : DNA can be cut into large fragments and circularized for use in chromosome walking.

12. Detection of cytogenetic abnormalities : Certain genetic diseases can be identified by cloning the affected genes e.g. Duchenne muscular dystrophy.

13. Databases : Existing databases facilitate gene identification by comparison of DNA and protein sequences.

For elucidating human genome, different approaches were used by the two HGP groups. IHCSC predominantly employed map first and sequence later approach. The principal method was hierarchical shotgun sequencing. This technique involves fragmentation of the genome into small fragments (100-200 kb), inserting them into vectors (mostly bacterial artificial chromosomes, BACs) and cloning. The cloned fragments could be sequenced.

Celera Genomics used whole genome shotgun approach. This bypasses the mapping step and saves time. Further, Celera group was lucky to have high-throughput sequenators and powerful computer programmes that helped for the early completion of human genome sequence.

Whose Genome was Sequenced?

One of the intriguing questions of human genome project is whose genome is being sequenced and how will it relate to the 6 billion or so population with variations in world? There is no simple answer to this question.

However, looking from the positive side, it does not matter whose genome is sequenced, since the phenotypic differences between individuals are due to variations in just 0.1% of the total genome sequences. Therefore many individual genomes can be used as source material for sequencing.

Much of the human genome work was performed on the material supplied by the Centre for Human Polymorphism in Paris, France. This institute had collected cell lines from sixty different French families, each spanning three generations. The material supplied from Paris was used for human genome sequencing.

Human Genome Sequence -Results Summarised:

The information on the human genome projects is too vast, and only some highlights can be given below. Some of them are briefly described.

Major Highlights of human Genome:

1. The draft represents about 90% of the entire human genome. It is believed that most of the important parts have been identified.

2. The remaining 10% of the genome sequences are at the very ends of chromosomes (i.e. telomeres) and around the centromeres.

3. Human genome is composed of 3200 Mb (or 3.2 Gb) i.e. 3.2 billion base pairs (3,200,000,000).

4. Approximately 1.1 to 1.5% of the genome codes for proteins.

5. Approximately 24% of the total genome is composed of introns that split the coding regions (exons), and appear as repeating sequences with no specific functions.

6. The number of protein coding genes is in the range of 30,000-40,000.

7. An average gene consists of 3000 bases, the sizes however vary greatly. Dystrophin gene is the larget known human gene with 2.4 million bases.

8. Chromosome 1 (the target human chromosome) contains the highest number of genes (2968), while the Y chromosome has the lowest. Chromosomes also differ in their GC content and number of transposable elements.

9. Genes and DNA sequences associated with many diseases such as breast cancer, muscle diseases, deafness and blindness have been identified.

10. About 100 coding regions appear to have been copied and moved by RNA-based transposition (retro- transposons).

11. Repeated sequences constitute about 50% of the human genome.

12. A vast majority of the genome (

97%) has no known functions.

13. Between the humans, the DNA differs only by 0.2% or one in 500 bases.

14. More than 3 million single nucleotide polymorphisms (SNPs) have been identified.

15. Human DNA is about 98% identical to that of chimpanzees.

16. About 200 genes are close to that found in bacteria.

Most of the Genome Sequence is Identified:

About 90% of the human genome has been sequenced. It is composed of 3.2 billion base pairs (3200 Mb or 3.2 Gb). If written in the format of a telephone book, the base sequence of human genome would fill about 200 telephone books of 1000 pages each. Some other interesting analogs/ sidelights of genome are given in Table 12.3.

Individual differences in genomes:

It has to be remembered that every individual, except identical twins, have their own versions of genome sequences. The differences between individuals are largely due to single nucleotide polymorphisms (SNPs). SNPs represent positions in the genome where some individuals have one nucleotide (i.e. an A), and others have a different nucleotide (i.e. a G). The frequency of occurrence of SNPs is estimated to be one per 1000 base pairs. About 3 million SNPs are believed to be present and at least half of them have been identified.

Benefits/Applications of Human Genome Sequencing:

It is expected that the sequencing of human genome and the genomes of other organisms will dramatically change our understanding and perceptions of biology and medicine. Some of the benefits of human genome project are given.

Identification of human genes and their functions:

Analysis of genomes has helped to identify the genes, and functions of some of the genes. The functions of other genes and the interaction between the gene products needs to be further elucidated.

Understanding of polygenic disorders:

The biochemistry and genetics of many single- gene disorders have been elucidated e.g. sickle-cell anemia, cystic fibrosis, and retinoblastoma. A majority of the common diseases in humans, however, are polygenic in nature e.g. cancer, hypertension, diabetes. At present, we have very little knowledge about the causes of these diseases. The information on the genome sequence will certainly help to unravel the mysteries surrounding polygenic diseases.

Improvements in gene therapy:

At present, human gene therapy is in its infancy for various reasons. Genome sequence knowledge will certainly help for more effective treatment of genetic diseases by gene therapy.

Improved diagnosis of diseases:

In the near future, probes for many genetic diseases will be available for specific identification and appropriate treatment.

Development of pharmacogenomics:

The drugs may be tailored to treat the individual patients. This will become possible considering the variations in enzymes and other proteins involved in drug action, and the metabolism of the individuals.

Genetic basis of psychiatric disorders:

By studying the genes involved in behavioural patterns, the causation of psychiatric diseases can be understood. This will help for the better treatment of these disorders.

Understanding of complex social trait:

With the genome sequence now in hand, the complex social traits can be better understood. For instance, recently genes controlling speech have been identified.

Knowledge on mutations:

Many events leading to the mutations can be uncovered with the knowledge of genome.

Better understanding of developmental biology:

By determining the biology of human genome and its regulatory control, it will be possible to understand how humans develop from a fertilized eggs to adults.

علم الجينوم المقارن:

Genomes from many organisms have been sequenced, and the number will increase in the coming years. The information on the genomes of different species will throw light on the major stages in evolution.

Development of biotechnology:

The data on the human genome sequence will spur the development of biotechnology in various spheres.


شاهد الفيديو: Its a great time to be a Christian! Creation Magazine LIVE! 4-17 (قد 2022).


تعليقات:

  1. Schuyler

    وماذا نفعل بدون أفكارك الرائعة

  2. Galeno

    موضوع لا تضاهى ، أحب :)



اكتب رسالة