معلومة

هل تتوفر بيانات حيود الأشعة السينية الأصلية

هل تتوفر بيانات حيود الأشعة السينية الأصلية


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

هل من المعتاد أن ينشر المحققون بيانات حيود الأشعة السينية الأصلية المستخدمة في التحديد الهيكلي الجزيئي؟ إذا لم يكن كذلك ، فلماذا؟ وإذا كان الأمر كذلك ، فهل توجد قاعدة بيانات على الإنترنت حيث يمكن تنزيل هذه البيانات؟


في كثير من الحالات تكون متاحة. كان أحد المبادئ التأسيسية لبنك بيانات البروتين (PDB) هو تخزين ليس فقط النماذج (المواقع والهويات الذرية) للجزيئات الكبيرة والبروتينات ، ولكن أيضًا بيانات الأشعة السينية الأصلية ، مؤخرًا في عوامل الهيكل.

إذا كان السؤال هو "لماذا يقدمون فقط عوامل الهيكل وليس البيانات الأصلية التي أخذوها" - فإن مثل هذه المهمة ستتطلب الكثير من جهود التنظيم لتحقيق فائدة علمية قليلة جدًا. كان قياس المجموعات الفردية من البيانات من الكاشف بمثابة دب مهمة. يستلزم هيكل الميوغلوبين الأصلي أفلامًا ممسوحة ضوئيًا بتنسيق قديم من الخمسينيات. لن يتمكن أي شخص من استخدام ذلك الآن دون اختراق تنسيق الصورة ، إذا لم يكن على شريط ورق أو بطاقات. في الواقع في هذه الحالة لا تتوفر عوامل الهيكل. غالبًا ما تم إجراء تحجيم العديد أو العديد من مجموعات البيانات معًا باستخدام تعديلات مخصصة في السبعينيات ، ثم أصبح جمع البيانات في التسعينيات أكثر روتينية ، لكن عدة أجيال من أجهزة الكشف بالأشعة السينية أصبحت شائعة ثم تلاشت من السوق. كان لكل منها غريب الأطوار ومتطلبات خاصة به لدمج مجموعات البيانات من قراءات متعددة.

الغرض من وجود عوامل هيكل متاحة هو السماح لأي شخص بإعادة بناء كثافة الإلكترون وتقييم الفعل التفسيري الذي يتتبع الببتيد من خلال كثافة الإلكترون. نظرًا لأن هذا التنسيق مستقل بشكل أساسي عن الكاشف وكان ثابتًا إلى حد ما على مر السنين ، فإنه يوفر قدرًا كبيرًا من الدوي العلمي للباطل.

إذا كنت تريد بيانات صورة أولية أو بيانات مملوكة للكاشف قبل مجموعات بيانات متعددة من بلورات مختلفة قبل دمجها ، فسيتعين عليك الاتصال بالمؤلفين ، الذين ربما يتعين عليهم التدقيق في بحر من أقراص DVD للوصول إليها. في الحالات القديمة قد تكون الأشرطة.

فيما يتعلق بعوامل الهيكل ، والتي تمثل أساسًا قيمة الجذر التربيعي لبيانات الكثافة المجمعة والمقاسة ، فهي متاحة وجزءًا من كل إرسال إلى pdb:

انظر إلى أي صفحة لهيكل الأشعة السينية في RCSB. على سبيل المثال هذا.

يوجد مربع يسمى "تفاصيل تجريبية" ويمكنك تنزيل عوامل الهيكل هناك بالنقر فوق ارتباط.

إذا كنت تبحث عن أكثر من واحد في وقت واحد ، فهناك تنزيلات مجمعة متاحة من خلال صفحة التنزيل الخاصة بهم. حدد مربع "عوامل الهيكل". يجب أن تكون بيانات الكثافة الأولية متاحة إذا بحثت عنها أيضًا.

اقتراح آخر: كنت أفكر أنه إذا نظرت إلى برنامج القياس الذي يأتي مع أجهزة الكشف عن الأشعة السينية ، فقد تجد بعض البرامج التعليمية التي تحتوي على بيانات أولية غير مقيسة. لقد وجدت مثالًا واحدًا في Marresearch - ليسوزيم بياض بيض الدجاج.


قاعدة بيانات عامة لتجارب الحيود الجزيئي

تتشكل كل نقطة من التداخل البناء للأشعة السينية التي تمر عبر البلورة. يمكن استخدام البيانات لفحص بنية البلورة. الائتمان: M. Grabowski وآخرون.

جذبت إمكانية استنساخ النتائج التجريبية المنشورة الانتباه مؤخرًا في العديد من المجالات العلمية المختلفة. يمثل عدم توفر البيانات العلمية الأولية الأصلية عاملاً رئيسياً يساهم في مشاكل التكاثر ، ومع ذلك ، فقد اتخذ مجتمع البيولوجيا الهيكلية خطوات مهمة نحو إتاحة البيانات التجريبية.

قاد علم البلورات بالأشعة السينية الجزيئية الطريق في طلب النشر العام للإحداثيات الذرية ومجموعة كبيرة من البيانات التجريبية عبر بنك بيانات البروتين (PDB) والمشاريع المماثلة ، مما يجعل هذا المجال واحدًا من أكثر المجالات قابلية للتكاثر في العلوم البيولوجية.

كلف IUCr مجموعة عمل ترسيب بيانات الحيود (DDDWG) في عام 2011 لفحص فوائد وجدوى أرشفة صور الحيود الخام في علم البلورات. قدم تقرير DDDWG كل ثلاث سنوات 2011-2014 العديد من التوصيات الرئيسية المتعلقة بالحفاظ على بيانات الانعراج الخام. ومع ذلك ، لا يزال هناك أي تفويض للإفصاح العام عن بيانات الحيود الأصلية.

يعد المورد المتكامل لإمكانية التكاثر في علم البلورات الجزيئي (IRRMC) جزءًا من برنامج البيانات الضخمة إلى المعرفة التابع للمعاهد الوطنية للصحة وقد تم تطويره لأرشفة البيانات الأولية من تجارب الانعراج ، والأهم من ذلك ، توفير البيانات الوصفية ذات الصلة. قاعدة البيانات [Grabowski et al. (2016). اكتا كريست. D72، 1181-1193، DOI: 10.1107 / S2059798316014716] ، يحتوي في وقت كتابة هذا التقرير على 3070 تجربة حيود جزيئي كبير (5983 مجموعة بيانات) والبيانات الوصفية المقابلة المنسقة جزئيًا ، والتي تمثل حوالي 3٪ من جميع الترسبات في بنك بيانات البروتين. يمكن الوصول إلى المورد على http://www.proteindiffraction.org ويمكن البحث فيه باستخدام معايير مختلفة عبر واجهة بسيطة ومبسطة. جميع البيانات متاحة للوصول غير المقيد والتنزيل. يعمل المورد كدليل على المفهوم ويوضح جدوى أرشفة بيانات الحيود الخام والبيانات الوصفية المرتبطة بها من الدراسات البلورية للأشعة السينية للجزيئات البيولوجية.

في حديثه مع مراسل حول المشروع ، قال قائد الفريق ولاديك مينور ، "هناك الكثير من الأبحاث الجارية بحيث لا يمكن نشرها كلها ، وغالبًا لا تظهر نتائج الدراسات غير الناجحة في الأدبيات. أعتقد أن مفتاح النجاح هو معرفة التجارب غير الناجحة ، ونريد أن نعرف سبب فشلها ".

الهدف من المشروع هو توسيع IRRMC وتضمين مجموعات البيانات التي فشلت في إنتاج هياكل الأشعة السينية. يمكن أن يسهل هذا الجهود التعاونية لتحسين طرق تحديد بنية البروتين وأيضًا ضمان توفر البيانات "اليتيمة" التي خلفها المحققون الأفراد و / أو مشاريع الجينوميات الهيكلية المنقرضة.


أجهزة حيود مسحوق الأشعة السينية (XRD) - كيف تعمل؟

هندسة مقياس حيود الأشعة السينية هي أن العينة تدور في مسار شعاع الأشعة السينية الموازاة بزاوية & # 952 بينما يتم تثبيت كاشف الأشعة السينية على ذراع لتجميع الأشعة السينية المنعرجة وتدويرها بزاوية 2 & # 952. الأداة المستخدمة للحفاظ على الزاوية وتدوير العينة تسمى أ المنقل مقياس الزوايا. بالنسبة لأنماط المسحوق النموذجية ، يتم جمع البيانات في 2 & # 952 من

5 & ​​# 176 إلى 70 & # 176 ، الزوايا المحددة مسبقًا في مسح الأشعة السينية.


هل تتوفر بيانات حيود الأشعة السينية الأصلية - علم الأحياء

شهدت السنوات الأخيرة نموًا في الاهتمام بالاحتفاظ بمجموعات بيانات الحيود الخام التي تم جمعها لتحديد الهياكل البلورية والجزيئية. نشأ هذا الاهتمام بشكل عفوي داخل المجتمع البلوري على عدد من الجبهات. على سبيل المثال ، تعد مجموعات البيانات الأولية ذات قيمة لتطوير طرق جديدة لتحديد الهيكل ولإجراء قياس معياري لخوارزميات البرامج (Terwilliger & # 38 Bricogne ، 2014) فهي مهمة في بعض الأحيان للتحقق من صحة تفسير الميزات الهيكلية وتسدد بشكل متزايد دراسة أقرب ، سواء من أجل السماح بتحليل البيانات بدقة أعلى من المستخدمة في العمل الأصلي ، وفهم وجود العديد من المشابك الموجودة في البلورة ، أو استنتاج تفاصيل الحركات أو الاضطراب المترابط من التشتت المنتشر الذي يتم تجاهله إلى حد كبير في تحديد مواضع وخصائص ذروة Bragg.

في موازاة ذلك ، يدفع تطور السياسة العلمية في العالم الأوسع إلى التدقيق الدقيق في الممارسة الكاملة لإدارة بيانات البحث ، وهناك عدد متزايد من الولايات للاحتفاظ بالبيانات الأولية التي تقوم عليها أي دراسة تجريبية وإتاحتها للباحثين الآخرين . بحلول أوائل عام 2016 ، أعلنت جميع مجالس البحث العلمي في المملكة المتحدة مواقفها بشأن إدارة البيانات والوصول إليها والتنظيم طويل الأجل (مركز التنظيم الرقمي ، 2016 مجالس البحوث في المملكة المتحدة ، 2015). تستضيف مكتبة جامعة نورث وسترن (2016) ملخصًا مفيدًا لمتطلبات وكالة التمويل الفيدرالية الأمريكية لإدارة البيانات العلمية. يدعو الاقتراح الأخير الجدير بالملاحظة إلى إنشاء سحابة أوروبية مفتوحة للعلوم للبحوث (جونز ، 2015).

المجتمعات المختلفة لديها أفكار مختلفة عن البيانات التي تقدرها أكثر & # 8211 ، وفي الواقع ، لما يشكل "البيانات". توضح المؤسسة الوطنية للعلوم بالولايات المتحدة (NSF) هذا الأمر في "الأسئلة المتكررة" المنشورة (National Science Foundation ، 2010):

1. ما هي "البيانات" التي تغطيها خطة إدارة البيانات؟

سيتم تحديد مكونات هذه البيانات من قبل المجتمع المعني من خلال عملية مراجعة الأقران وإدارة البرنامج. قد يشمل ذلك ، على سبيل المثال لا الحصر: البيانات والمنشورات والعينات والمجموعات المادية والبرامج والنماذج.

نتيجة لذلك ، هناك تنوع كبير بين التخصصات العلمية المختلفة في مناهجها لإدارة البيانات والاحتفاظ بها ، وبالتالي في توافر المستودعات العامة وأدوات البرمجيات لإدارة الإيداع والوصول وإعادة الاستخدام. ومع ذلك ، يتكرر موضوعان في مختلف الولايات المنشورة والمبادئ التوجيهية لأفضل الممارسات: أهمية المحددات المستمرة لمجموعات البيانات ، والحاجة الحيوية إلى توصيفها على أكمل وجه ممكن من خلال البيانات الوصفية المناسبة.

يعتبر علم البلورات عمومًا علمًا له منزله في حالة جيدة فيما يتعلق بإدارة البيانات والتحقق من صحتها والوصول إليها وإعادة استخدامها. هذا صحيح إلى حد كبير فيما يتعلق بالبيانات "المشتقة" (التي نعني بها إحداثيات الموضع الذري ومعلمات الإزاحة الناتجة عن تحديدات الهيكل) والمنشورات المرتبطة بها. إنه أكثر إثارة للجدل عندما يتعلق الأمر ببيانات الانعراج المعالجة & # 8211 البيانات المعالجة بعد التجربة (عادة عوامل الهيكل) التي تشكل أساس تحديد البنية الذرية والجزيئية والتحسين اللاحق الذي يؤدي إلى نموذج هيكلي. تتطلب بعض المجلات ترسيب عوامل الهيكل لدعم أي منشور ، وبنك بيانات البروتين (PDB Berman وآخرون. ، 2000) يتطلب ترسيب عوامل الهيكل مع الإحداثيات الذرية. ومع ذلك ، فهذه عادة ما تكون المجموعة النهائية من عوامل الهيكل المستخدمة في الصقل ، وقد تفتقر إلى المعلومات التي يتم تجاهلها عند دمج قمم الانعراج المرتبطة بالتناظر ، أو يتم استبعادها لأسباب أخرى من الدورات المبكرة للتنقيح. PDB إرادة قبول بيانات الكثافة المعالجة غير المدمجة ، وهناك توصيات مجتمعية تشجع على ترسبهم (المنظمة الدولية لعلم الجينوم الإنشائي ، 2001) ، لكن هذه الممارسة ليست عالمية بعد في علم البلورات الجزيئي. بالنسبة للهياكل البلورية ذات الخلية الصغيرة ، حتى المجلات التي تقبل عوامل البنية لم تتطلب حتى الآن شدة غير مدمجة. ومع ذلك ، هناك اعتراف متزايد بأهميتها ، سواء بالنسبة لمزيد من التطوير لـ checkCIF تم إجراء التحقق من الصحة أثناء عملية مراجعة الأقران ، ولتشجيع الباحثين المستقبليين على إعادة النظر في النتائج المنشورة وإعادة تقييمها ، ربما عند توفر أفكار أو أدوات جديدة (أ. ليندن ، التواصل الشخصي).

ومع ذلك ، من الناحية التاريخية ، لم يكن هناك تقليد للاحتفاظ بصور حيود الأشعة السينية الخام التي تم جمعها بواسطة أجهزة الكشف الإلكترونية ، على الرغم من أن مرافق النيوترونات المركزية لها تقاليد طويلة الأمد في حفظ البيانات الخام. في السنوات الأخيرة ، كانت الممارسات التي ترعاها المرافق النيوترونية تنشر كل نوع من المرافق الآلية المركزية واسعة النطاق (السنكروترونات وأخيراً ليزر الإلكترون الحر ، وكذلك المفاعلات النيوترونية) بدأت في التحرك نحو حفظ البيانات الخام. وقد تم تشجيع هذا الاتجاه من خلال التحسن السريع في إجراءات معالجة البيانات الإلكترونية.

في عام 2011 ، أنشأ الاتحاد الدولي لعلم البلورات (IUCr) مجموعة عمل لاستكشاف مزايا وتحديات الاحتفاظ بالبيانات التجريبية الأولية. أجرت هذه المجموعة ، مجموعة عمل ترسيب بيانات الحيود (DDDWG) ، عددًا من المشاورات واجتماعات المناقشة وورش العمل لاستكشاف الموضوع. تم نشر مجموعة من الأوراق في اكتا Crystallographica القسم د (Terwilliger، 2014) لمحة عامة عن أسباب أرشفة البيانات الأولية في مجال علم البلورات الجزيئي ، ونماذج للقيام بذلك على أساس روتيني أو واسع النطاق ، والمبادرات العملية الحالية ، والفوائد المحتملة لتحسين نماذج البنية الجزيئية.

سلطت هذه الأوراق الضوء أيضًا على أهمية تعيين معرفات ثابتة لمجموعات البيانات لتسهيل إدارتها ومعالجتها على المدى الطويل ، ولضمان أن كل مجموعة بيانات تتميز ببيانات وصفية غنية ، وذلك لتسهيل الاكتشاف والسماح بإعادة الاستخدام العلمي الفعال (Guss & # 38 مكماهون ، 2014 Kroon-Batenburg & # 38 Helliwell، 2014).

في ما تبقى من هذا مقدمة ، نقدم ورشة عمل حديثة ركزت على البيانات الوصفية في التجارب البلورية والتجارب ذات الصلة ، ونراجع الحجج الخاصة بإيداع البيانات الأولية كممارسة روتينية ونضع هذه الأنشطة في سياق مبادرات سياسة العلوم العالمية. ثم تبحث الورقة بمزيد من التفصيل في الآليات الحالية والمتطورة لترسيب البيانات التجريبية الأولية (خاصة صور حيود الأشعة السينية) في المتطلبات التفصيلية للبيانات الوصفية التي تصف مجموعات البيانات المؤرشفة ، من أجل ضمان استنساخ النتائج العلمية المشتقة وفي الخطوات التالية إلى الأمام.

1.2 تحسين البيانات الوصفية

للتركيز على قضايا البيانات الوصفية ، أجرت DDDWG ورشة عمل لمدة يومين في روفينج ، كرواتيا ، في أغسطس 2015. يتم الاحتفاظ بسجل كامل لورشة العمل عبر الإنترنت على http://www.iucr.org/resources/data/dddwg/ rovinj-Workshop وعدد من المقالات الناشئة عن الاجتماع قيد الإعداد. نحن بالتفصيل هنا بعض النتائج المحددة من ورشة العمل.

1.2.1. جهود لجان IUCr

يدير IUCr مهمته العلمية من خلال عدد من اللجان ، كل منها مسؤول عن مجال موضوع معين داخل علم البلورات. طلب DDDWG من كل لجنة النظر في احتياجاتها الخاصة لتحديد البيانات الوصفية للبيانات التجريبية الأولية في مجالها. من بين أولئك الذين كانوا أكثر نشاطا في الاستجابة لهذا الطلب لجنة XAFS (Ravel وآخرون. ، 2012) لجنة تشتت الزوايا الصغيرة (جاك وآخرون. ، 2012) لجنة الضغط العالي (الشكل 1) ولجنة الجزيئات البيولوجية الكبيرة ( على سبيل المثال جوتماناس وآخرون. , 2013 ).


شكل 1
مونتاج شرائح من عرض كامل دزيوبك في ورشة روفينج ، يوضح جوانب تجارب الانعراج تحت الضغط العالي والظروف غير المحيطة الأخرى التي تحتاج إلى وصف وتسجيل جيد. (الرسومات مقدمة من رونالد ميليتش-باوليتشيك ، جامعة فيينا.)

كان المركز الدولي لبيانات الحيود (ICDD ، بنسلفانيا ، الولايات المتحدة الأمريكية http://www.icdd.com) نشطًا في تسخير مجموعات بيانات حيود المسحوق الخام لبعض الوقت وأبلغنا في ECM29 في روفينج (أغسطس 2015) لقد قاموا الآن بدمج أكثر من 10 & # 8197000 مجموعات بيانات حيود المسحوق الخام في ملف حيود المسحوق. لاحظوا أن مجموعات البيانات أحادية الأبعاد تتميز بشكل عام بشكل معقول بشكل جيد من حيث البيانات الوصفية التجريبية المفهرسة في قاموس مسحوق CIF (pdCIF) (توبي ، 2005) ، لكن تفسير صور الحيود ثنائية الأبعاد يعوقه نقص الاتساق في الإبلاغ عن خصائص مثل محاور مقياس الزوايا ، والتيار المظلم للكاشف ، والتشويه والتصحيحات الأخرى (T. Fawcett ، الاتصال الشخصي انظر أيضًا القسم 1.2.2). تخطط لجنة حيود المسحوق لمزيد من العمل على البيانات الأولية لانحراف مسحوق النيوترون وستتواصل مع لجنة تشتت النيوترونات حسب الاقتضاء. كان لدى لجنة الكيمياء الإنشائية مشاركين متحمسين في الأحداث التي عقدتها DDDWG في مدريد وبيرغن وروفيني.

1.2.2. توصيف صور حيود الأشعة السينية

فئة مجموعات البيانات التجريبية التي تناسب بشكل وثيق الاختصاص الأصلي لـ DDDWG هي صور حيود الأشعة السينية التي تم جمعها من CCD أو كاشفات البكسل. تم تقديم كتالوج جيد للبيانات الوصفية اللازمة ، بشكل عام ، لتفسير ملف بيانات الصورة الأولية بواسطة Kroon-Batenburg & # 38 Helliwell (2014). تم تعريف العديد من العناصر الفردية المطلوبة في قاموس imgCIF (بيرنشتاين ، 2005) ، وكانت هناك تطبيقات جزئية لبعضها في ما يسمى برؤوس "CBF المصغرة" لملفات الصور المكتوبة بواسطة عدد من أنظمة الكشف التجارية. ومع ذلك ، لم يتم ذلك بطريقة متسقة بين البائعين ولا حتى عبر مجموعة المنتجات الكاملة للبائعين الأفراد. (يعتبر CBF ، الملف الثنائي البلوري ، و imgCIF ، نظيره النقي ASCII ، تطبيقات مكافئة لعلم الوجود CIF لصور الحيود.)

يتم تخزين الصور بشكل متزايد باستخدام تنسيق بيانات HDF5 / NeXus (K & # 246nnecke وآخرون. ، 2015) ، وعلى الرغم من أن التنسيق المادي لملف البيانات لا ينبغي أن يؤثر على قدرته على تخزين معلومات منظمة محددة (Hester ، 2016) ، إلا أنه ستكون هناك حاجة إلى بعض الجهود لضمان أن تمثيلات بيانات CIF و NeXus قادرة على تخزين البيانات المناسبة. البيانات الوصفية التجريبية. تم بالفعل استثمار جهود كبيرة لتحقيق ذلك على المستوى الفني بعد المشاركة في ورشة عمل سابقة من قبل ممثلي COMCIFS (لجنة صيانة معيار CIF) و NIAC (اللجنة الاستشارية الدولية NeXus) ، والهيئات المسؤولة عن إدارة CIF و تنسيقات بيانات NeXus ، على التوالي (Bernstein وآخرون. ، 2013). ومع ذلك ، أكدت العروض التقديمية في ورشة عمل Rovinj التي قدمها Kroon-Batenburg (https://youtu.be/XXFDlNn21SY) و Minor (https://youtu.be/eQbs9sB_pOM) أنه لا يزال هناك طريق طويل لنقطعه قبل الاختلاف الذي لا يحصى. تحتوي التنسيقات التي تم إنشاؤها بواسطة أجهزة الكشف الإلكترونية التجارية الحساسة للموضع على البيانات الوصفية المشتركة الضرورية للسماح بسهولة التفسير والإدارة (انظر المزيد من المناقشة في القسم 3.2).

سلط وصول كاشف Dectris Eiger pixel الجديد ، مع الزيادة الهائلة في معدلات بيانات صورة الحيود ، الضوء على أهمية تنسيق البيانات الفعال وتسجيل البيانات الوصفية ، ليس فقط لمعالجة بيانات الانعراج على خط أشعة ليزر السنكروترون أو الأشعة السينية ، ولكن أيضًا للمعالجة اللاحقة خارج المنشأة ، وفي النهاية لإعادة المعالجة / إعادة التحليل من أرشيف البيانات الخام حسب الحاجة. تم تسليط الضوء على القضايا المختلفة بالتفصيل في سلسلة مناقشة على القائمة البريدية CCP4bb في أوائل مارس 2016 (بما في ذلك ، من بين أمور أخرى ، G. Winter ، A. F & # 246rster ، H. J. Bernstein ، C. Vonrhein and G. Bricogne)

1.3 حالة ترسيب البيانات الخام

نلخص حالة التخزين الروتيني واسترجاع البيانات الخام للتأكيد على قيمتها المحتملة للمجتمع. في الوقت نفسه ، نعترف بالتكلفة والقيود العملية الأخرى لتخزين جميع مجموعات البيانات التي تم جمعها إلى أجل غير مسمى ، ولا يمكننا إعطاء إشارة نهائية إلى أين يمكن أن يكمن التوازن بين أرشفة البيانات الأولية وتجاهلها. ومع ذلك ، نوضح في القسم 1.4 أن هناك اتجاهات واضحة نحو تخزين مجموعات بيانات أكثر مما كنا نتوقعه في العمل المبكر لـ DDDWG.

هناك وجهة نظر فلسفية واسعة حول أهمية الوصول إلى بيانات الحيود الخام ، أي أن العلم يتطلب القدرة على إجراء تحليل شامل من خلال عين المرء وليس من منظور شخص آخر. توفر صور الحيود الخام العديد من الفرص لتحسين العلم أو ابتكاره. أنها تسمح بتحليل البيانات بدقة أعلى من المستخدمة في العمل الأصلي [مما يسمح بإجراء مقارنات ليس فقط بين برامج معالجة البيانات (تانلي وآخرون. ، 2013) ، ولكن أيضًا في فعالية تحديد الهيكل وصقله مع بيانات أضعف من أي وقت مضى تتجاوز الحدود العادية]. يمكن أن تكون مجموعات البيانات الأولية بمثابة معايير في تطوير أساليب التحليل المحسّنة. إنها تسمح بالتحقق من تفسير تناظرات البلورات ، والتحليل التفصيلي للانعراج من المشابك المتعددة الموجودة في البلورات. وبشكل أعم ، فإنها تعزز دراسة التشتت المنتشر الذي يعكس الحركات المترابطة أو اضطراب الذرات في البلورات ، أي "الديناميات الهيكلية".

يمكن اعتبار الاحتفاظ بالبيانات الخام مكملاً للأرشيفات الواسعة للبيانات المشتقة ( بمعنى آخر. معلمات الخلية ، والإحداثيات الجزيئية ، ومعلمات الإزاحة متباينة الخواص) والبيانات المعالجة (عوامل الهيكل ، ملفات تعريف صقل ريتفيلد) في قواعد البيانات البلورية. مساهمات الأول مفهومة جيدًا: فهي تشكل جزءًا من السجل العلمي ، وتؤدي إلى اكتشاف يعتمد على قواعد البيانات ، على سبيل المثال في فهم تفاعلات البروتين و # 8211ligand ، فإنها تؤدي إلى مسارات جديدة للتوليف ، وتحسينات في التصنيع وفهم أفضل لعلم الطاقة ، كما أنها تستخدم في تحديد التطبيقات والفهرسة ( على سبيل المثال في علم الطب الشرعي).

حتى ظهور CIF والتحقق الآلي من صحة الهيكل مع checkCIF جناح (Strickland وآخرون. ، 2005) التي مكنتها ، تم نشر العديد من الهياكل التي تطلبت تصحيحًا لاحقًا. في كثير من الأحيان ، ينتج عن تفسير النتائج بنى جزيئية كانت صحيحة على نطاق واسع ، لكنها تغاضت عن التماثلات الشبكية الأعلى. تم اكتشاف هذه الأمثلة وتصحيحها بشكل أفضل من خلال الوصول إلى عوامل الهيكل المودعة (موضحة جيدًا بواسطة Marsh وآخرون. , 2002 ).

لذلك ، بشكل عام ، يمكن إجراء التحقق من صحة الهيكل (مصداقية النموذج الهيكلي ، سواء في التزامه بمعايير التكوين الهندسي واشتقاقه من صور حيود الأشعة السينية) بالرجوع إلى مجموعات البيانات المشتقة (الإحداثيات الهيكلية) وعوامل التركيب وحدها ، وقد كانت هذه هي الممارسة في مجلات علم البلورات المختلفة لفترة طويلة من الزمن. ومع ذلك ، فإن توافر البيانات الخام ( بمعنى آخر. صور الحيود الأصلية) يمكن أن تعزز التحقق من صحة الهيكل بالطرق التالية:

(ط) يمكن إعادة صقل الهيكل ، ربما باستخدام قمم الانعراج التي تم استبعادها لأن بيانات الانعراج المعالجة تم اقتطاعها عند حد دقة تعسفي. يسمح الاحتفاظ بالبيانات الأصلية أيضًا بإعادة تقييم تناظر المجموعة الفضائية ، والذي يتم تسويته عادةً خلال مرحلة مبكرة من التنقيح التقليدي.

(2) غالبًا ما يتم إجراء تخفيض البيانات وفقًا للبروتوكولات المعمول بها ، ولكن الاحتفاظ بالصور الأصلية يتيح الفرصة لاختبار تلك البروتوكولات ، خاصة إذا كان هناك أي اشتباه في التحيز المنهجي. في الواقع ، قد يسمح التحليل الإحصائي لمجموعة من الصور الخام المخزنة باكتشاف التحيزات المنهجية التي لا تظهر على الإطلاق في التجارب الفردية. علاوة على ذلك ، فإن توافر مجموعات كبيرة من مجموعات البيانات الأولية يسمح بإعادة المعايرة الدورية لطرق الحل وتطوير طرق جديدة لمعالجة مجموعات البيانات التي كانت مقاومة للحلول التقليدية في السابق.

(3) الانتباه إلى التشتت المنتشر بين بقع الحيود يسمح بإلقاء نظرة ثاقبة على الحركات المترابطة أو اضطراب الذرات في البلورات. قد يشمل ذلك سلوك شبه بلوري ، أو تحديد تعديل غير متكافئ أو تمثيل متعدد المراحل ، أو حركات جزيئية كبيرة ، أو تغييرات توافقية إلخ .

لاحظ أن هذه الفوائد قد لا تكون واضحة لكل هيكل ، ولا يزال يتعين تحديد التكلفة & # 8211 فائدة حساب التفاضل والتكامل لسياسات الإيداع الروتيني من قبل المجتمع وهيئات التمويل (Guss & # 38 McMahon ، 2014). قد تكون هناك نقاط دخول مختلفة حيث يمكن تحقيق الفوائد المحتملة بسهولة أكبر ، على سبيل المثال بإتاحة البيانات التجريبية عن "الهياكل الصعبة" التي ثبت استحالة صقلها على نحو مرض.

ومع ذلك ، فإن الترسيب الروتيني إلى حد ما للبيانات الأولية من شأنه أن يساعد في تحسين جودة وموثوقية السجل العلمي (ثانوي وآخرون. ، 2016). سيسمح بفحص دقيق للاستنتاجات العلمية من قبل المراجعين النظراء قبل النشر ، سيسمح بإعادة النظر في النماذج الهيكلية الموجودة بالفعل في قواعد البيانات ومراجعتها ، حيث يتم تطوير تقنيات جديدة & # 8211 على سبيل المثال تسمح فكرة "التحسين المستمر لنماذج البنية الجزيئية" (Terwilliger ، 2012) بإعادة تحليل بنية أو سلسلة من الهياكل المستقلة عن التحيز التفسري للمؤلف (BD Bax ، الاتصال الشخصي) وتوفر الدليل التجريبي اللازم لدعم أي ادعاءات الذي أدلى به المؤلف الناشر. في هذا الدور الأخير ، يساعد في الحماية من استخدام مجموعة بيانات خاطئة ، إما من خلال الخطأ أو النية المتعمدة.

1.4 ضرورات وفرص الترسيب

كما ذكرنا سابقًا ، كانت هناك تطورات منذ إنشاء DDDWG في المناخ من أجل ترسيب البيانات ومشاركتها ، في كل من العالم العلمي الأوسع وفي مجال علم البلورات والعلوم الهيكلية ذات الصلة. فوائد البيانات المفتوحة ( بمعنى آخر. جمع البيانات البحثية الناشئة عن البحث العلمي الممول من القطاع العام وإتاحته لإعادة الاستخدام دون مقابل للمستخدم النهائي) قد تم التأكيد عليه في السنوات الأخيرة في مناقشات السياسة الدولية والحكومية والعلمية والمبادرات العملية. من بين عدد قليل من مواقع الويب الجديرة بالملاحظة بوابة بيانات الأمم المتحدة (UNdata: http://data.un.org) وموقع البيانات المفتوحة للحكومة الأمريكية (https://www.data.gov) والموقع العالمي بوابة العلوم 'http://worldwidescience.org. تشمل دعوات التنفيذ "خطة النمو الجيد" ، وهو تعاون من أجل التنمية الزراعية يشارك فيه معهد البيانات المفتوحة بالمملكة المتحدة (ODI https://theodi.org) و Syngenta the European Open Science Cloud (EOSC) ، وهي استراتيجية الاتحاد الأوروبي لربط البحوث الشبكات ومرافق تخزين البيانات وموارد الحوسبة عبر القارة (جونز ، 2015 الشكل 2) واتفاق البيانات المفتوحة (Science International ، 2015) الذي أطلقه المجلس الدولي للعلوم (ICSU) والشراكة بين الأكاديميات (IAP) والعالم أكاديمية العلوم (TWAS) والمجلس الدولي للعلوم الاجتماعية (ISSC).


الشكل 2
رسم بياني يربط نشر البيانات وسير عمل الإدارة بمكونات البنية التحتية البحثية في الاتحاد الأوروبي. جزء من عرض تقديمي يقدم سحابة العلوم الأوروبية المفتوحة للبحث (رسم توضيحي مقدم من ناتاليا مانوفا لمشروع OpenAIRE الأوروبي).

على الرغم من أن هذه المبادرات المختلفة متنوعة للغاية في أهدافها ، إلا أنها مجتمعة ترفع من الأهمية المتصورة لمستودعات البيانات لممولي الأبحاث ، والباحثين الذين يتم تشجيعهم أو في بعض الحالات المكلفين بإيداع بياناتهم في مستودعات قوية ودائمة ، والباحثين الآخرين الذين أصبحوا مدركين بشكل متزايد لتوافر مجموعات البيانات الأخرى وفائدتها المحتملة لعملهم. يحدث تغيير تدريجي في المواقف الثقافية تجاه بيانات البحث.

منذ أن تم إنشاء DDDWG في عام 2011 ، كان هناك عدد من التطورات ، بعضها حفزته هذه المبادرات رفيعة المستوى ، والتي زادت من خيارات ترسيب صور الحيود:

(ط) توسع عدد ونطاق مستودعات البيانات الجامعية.

(2) أطلق مرفق الإشعاع السنكروتروني الأوروبي (ESRF Grenoble ، فرنسا) أرشيف بيانات ، حيث يمكن ربط كل مجموعة بيانات أولية يتم قياسها بـ DOI مسجل.

(3) لقد اكتسب أرشيف بيانات Zenodo العلمي ، المستضاف على نظام تخزين CERN عالي السعة للغاية ، زخمًا.

(4) تم إنشاء مستودع لتجارب الحيود المستخدمة لتحديد هياكل البروتين كجزء من برنامج BD2K (البيانات الكبيرة إلى المعرفة) التابع للمعهد الوطني الأمريكي للصحة (Grabowski وآخرون. ، 2016) تديره مجموعة Wladek Minor في جامعة فيرجينيا ، الولايات المتحدة الأمريكية (http://www.proteindiffraction.org/).

(5) تم إنشاء شبكة بيانات البيولوجيا الإنشائية (SBDG) كنظام لنشر ونشر بيانات الحيود للبيولوجيا الهيكلية (Meyer وآخرون. , 2016 ).

(6) يطلب بنك بيانات البروتين (PDB) الآن DOI (معرف الكائن الرقمي) للبيانات الخام والبيانات الوصفية للبيانات الخام أثناء الترسيب (الشكل 3).


الشكل 3
نموذج عبر الإنترنت يسمح لمودعي PDB بربط مجموعات البيانات التجريبية والبيانات الوصفية المرتبطة بها ببنية جزيئية كبيرة.

(السابع) IUCrData (خدمة بيانات IUCr ، تتعامل مبدئيًا مع مجموعات البيانات المشتقة).

تم وصف بعضها بمزيد من التفصيل في القسم 2.2.

2. آليات الحفاظ على بيانات الحيود الخام

نستعرض بعض من بحكم الواقع المستودعات التي تستضيف حاليًا ، وفي كثير من الحالات توفر الوصول إلى مجموعات البيانات التجريبية في مجالنا.

2.1. مستودعات البيانات المؤسسية. دراسة حالة: جامعة مانشستر

إن النهج الدقيق الذي تتبعه جامعة مانشستر يجعل أحدنا (JRH) يشعر بأنه محظوظ جدًا للعمل في بيئة البحث هذه. أثناء البحث في ارتباط العامل المضاد للسرطان سيسبلاتين بالهيستيدين [الذي حظي باهتمام شديد ، انظر ، على سبيل المثال ، Messori & # 38 Merlino (2016)] ، جعلت مجموعة الأبحاث التابعة لـ JRH بيانات الحيود الخام الوصول المفتوح في جامعة مانشستر مؤسسية مستودع البيانات. يوضح الشكل 4 سجل الوصول إلى البيانات داخل نظام المكتبة ، بينما يوضح الشكل 5 البيانات الوصفية على مستوى التصنيف التي يتطلبها هذا المستودع. هذا النوع من الفهرسة والأرشفة المؤسسية هو سمة متزايدة لمبادرات أرشفة البيانات الحديثة. بالإضافة إلى ذلك ، فقد اتبعنا متطلبات ترسيب بيانات المجتمع القياسية لإيداع الإحداثيات ومعالجة بيانات الحيود في بنك بيانات البروتين. للسماح بأوسع وصول ممكن إلى عملنا ، تمكنا أيضًا ، عبر تمويل EPSRC الذي حصلنا عليه ، لنشر الجزء الأكبر من مقالاتنا التي تبلغ عن نتائجنا على أنها وصول مفتوح "ذهبي" ( بمعنى آخر. يمكن الوصول إلى المقالات الكاملة التي راجعها النظراء دون اشتراك في المجلة) في أقسام Acta Crystallographica د و F .


الشكل 4
سجل الوصول إلى مكتبة جامعة مانشستر لمجموعات البيانات التجريبية المرتبطة بمقالة بحثية منشورة. يتم توفير روابط للمقالة المنشورة في عمود "الموارد ذات الصلة".

الشكل 5
البيانات الوصفية على مستوى التصنيف المرتبطة بمجموعات البيانات التجريبية المؤرشفة في مكتبة بيانات جامعة مانشستر. تحدد هذه مجموعات البيانات المؤرشفة وتوفر روابط إلى الموارد ذات الصلة.

في أن نصبح روادًا في جعل كل من بيانات الحيود الخام وبياناتنا وتفسيرات النماذج مفتوحة بالكامل (الجدول رقم 1601) ، وبالتالي تحقيق اتساع نادر وعمق من الانفتاح ضمن موضوع بحث مركّز ، تلقى بحثنا قدرًا مرضيًا من الاهتمام التفصيلي. تم تنزيل العديد من هذه البيانات الأولية ، سواء من موقع الويب الأصلي الخاص بهم في جامعة أوتريخت ومن ثم من جامعة مانشستر. كانت إجماليات التنزيل لكل عام من أوتريخت: 2012 17 & # 8197GB ، 2013 47 & # 8197GB ، 2014 57.69 & # 8197GB و 2015 31.47 & # 8197GB معلومات التنزيل المكافئة غير متوفرة من جامعة مانشستر. ظهر أحد هذه البيانات الأولية في منشور جديد (Shabalin وآخرون. ، 2015) ، نقد واسع النطاق للحقل الكامل لربط سيسبلاتين ببروتينات مختلفة. اقترحت هذه المقالة تحسينات على ثلاثة من نماذج سيسبلاتين & # 8211lysozyme في PDB عبر ثلاثة من التفسيرات البديلة الخاصة بهم تضمنت اثنتان منها استخدام بيانات الانعراج المعالجة المحفوظة في PDB (4xan و 4 mwk) وواحدة من بياناتنا الخام (4g4a في الجدول 1 والشكل 4). لقد قبلنا بعض توصياتهم ورفضنا البعض الآخر (تانلي وآخرون. ، 2016). تشير بعض نقاط "نقاش البيانات" هذه أيضًا إلى الافتقار إلى معايير المجتمع الناضج ، حتى داخل مجلة واحدة (Tanley وآخرون. ، 2015) ، لكنها تظهر أيضًا طريقة للمضي قدمًا لإجراء المناقشات ، على سبيل المثال ضمن مجلات IUCr. في جوانب أخرى ، يُظهر فوائد السعي المستمر لتحسين طرق التحليل وفهم أفضل لدور البيانات الضعيفة في تحسين تحسينات نموذج البروتين (Diederichs & # 38 Karplus ، 2013) ، والتي استخدمناها بالتفصيل في Tanley وآخرون. (2016). ظهرت مثل هذه التحسينات حتى في السنوات القليلة الماضية فقط ، وهي توضح "صغر سن" علم البلورات الجزيئي ، وهو مجال لا يزال ينضج بشكل واضح كتقنية.

الجدول 1
جمع البيانات الأولية الموضوعية كمثال: مجموعة الدراسات البحثية المتعلقة بالبلاتين المرتبطة بالهيستيدين ، والتي عقدت في مكتبة بيانات جامعة مانشستر

2.2. مستودعات البيانات العامة للبيولوجيا الهيكلية

تم التعرف على أهمية التقاط البيانات وأرشفتها على نطاق واسع في جميع أنحاء العالم ، وهناك العديد من المستودعات المتاحة الآن حيث يمكن لأي باحث تقريبًا ، أو سيتمكن قريبًا ، إيداع بياناته الأولية والبيانات الوصفية المرتبطة بها لأي شخص في العالم لعرضها وتنزيلها ، تخضع بالطبع للقيود الطبيعية لحجم الملف وعرض النطاق الترددي للشبكة.

اثنان من المستودعات الرئيسية الممولة من القطاع العام هما المورد المتكامل للتكاثر في علم البلورات الجزيئي الكبير (http://www.proteindiffraction.org) ومستودع Zenodo (https://zenodo.org) للبيانات العلمية العامة. تم تطوير الأول بواسطة مجموعة Minor في جامعة فرجينيا (http://olenka.med.virginia.edu/CrystUVa) وهو مدعوم من قبل المعاهد الوطنية الأمريكية لمبادرة البيانات الضخمة إلى المعرفة (https: // datascience .nih.gov / bd2k). تم تطوير Zenodo بواسطة CERN (http://www.cern.ch) كجزء من مبادرة الاتحاد الأوروبي OpenAIREplus (http://www.openaire.eu).

يتوفر مستودعين خاصين إضافيين للاستخدام العام. قامت منظمة SBGrid ومقرها هارفارد (https://sbgrid.org) بتطوير شبكة بيانات البيولوجيا الإنشائية (https://data.sbgrid.org) والتي يمكن استخدامها من قبل أي عضو في SBGrid لأرشفة البيانات الأولية والبيانات الوصفية. يسمح موقع الشبكة العلمية ResearchGate (https://www.researchgate.net) للباحثين بمشاركة البيانات (https://www.researchgate.net/blog/post/present-all-your-research-in-a-click) .

2.2.1. المورد المتكامل للتكاثر في علم البلورات الجزيئي

المورد المتكامل لإمكانية التكاثر في علم البلورات الجزيئي (Grabowski وآخرون. ، 2016) هي قاعدة بيانات حيود البروتين التي تتناول الحاجة إلى أرشفة الصور الخام البلورية ، على النحو المبين في المناقشة أعلاه وفي اكتا كريست. د مجموعة من المقالات التي تم نشرها مؤخرًا (Terwilliger ، 2014). تتضمن قاعدة البيانات هذه حاليًا أكثر من 2900 مجموعة بيانات بلورية خام وبيانات وصفية مرتبطة بها. يرتبط معظمها بإيداع في بنك بيانات البروتين (http://www.pdb.org Berman ، 2000) ويمثل الكثير منها عملاً من مشاريع الجينوميات الهيكلية (http://csgid.org، http: // ssgcid.org ، http://www.jcsg.org ، http://mcsg.anl.gov ، http://thesgc.org). قاعدة البيانات منظمة للغاية ، مع البيانات الوصفية البلورية المرتبطة بكل مجموعة بيانات. ميزة مفيدة للغاية لهذه الخدمة هي أن واجهة الويب لقاعدة البيانات تعرض صورة حيود تمثيلية من كل مجموعة بيانات ، مما يسمح للباحث أن يلاحظ بسرعة خصائص الانعراج من البلورات المستخدمة في كل مجموعة بيانات ، على سبيل المثال الترتيب في نمط الحيود ، ووجود تشتت منتشر ومدى تباين في نمط الحيود. يمكن البحث في قاعدة البيانات بناءً على معرف PDB ، ودقة الانعراج ، والموقع الذي تم فيه جمع البيانات ، والمؤلفون ، والعديد من الخصائص الأخرى. من المخطط أن تكون قاعدة البيانات متاحة للودائع والتنزيلات من قبل أي شخص. يحتوي كل إدخال في قاعدة البيانات على DOI معين يمكن استخدامه للإشارة إلى البيانات والذي يوفر رابطًا ثابتًا دائمًا للبيانات ، والبيانات المودعة ليست محدودة في حجم الملف. تعد البيانات الوصفية المرتبطة بالبيانات الأولية جزءًا لا يتجزأ من قاعدة البيانات ، لذلك قد يكون من العملي في المستقبل إعادة معالجة الكثير من البيانات الخام تلقائيًا في قاعدة البيانات حيث تصبح الخوارزميات الجديدة لتحليل البيانات متاحة ( راجع Terwilliger & # 38 Bricogne ، 2014).

2.2.2. زينودو

أرشيف Zenodo هو أرشيف علمي عام طوره باحثون في CERN كجزء من مبادرة الإطار 7 للاتحاد الأوروبي. يوفر مستودعًا لمجموعات البيانات العلمية في أي مجال ولديه الميزة الفريدة التي تتمتع ، كجزء من CERN ، بإمكانية الوصول إلى سعة استثنائية لتخزين البيانات وأرشفتها. على الرغم من أنه مدعوم من قبل الاتحاد الأوروبي ، يمكن للباحثين من أي مكان في العالم أرشفة بياناتهم ويمكن لأي شخص الوصول إلى البيانات. تم تصميم أرشيف Zenodo لتوفير مورد للعديد من المشاريع العلمية الصغيرة في العالم التي ليس لديها طريقة سهلة لإتاحة بياناتها للمجتمع العلمي ، وعلى عكس قواعد البيانات الأخرى التي تمت مناقشتها هنا ، تخطط لفرض رسوم أكبر المستخدمين على نطاق. يحتوي الأرشيف حاليًا على أكثر من 2500 مجموعة بيانات من جميع مجالات العلوم. يمكن أن تحتوي مجموعات البيانات على ملفات متعددة ، وعادة ما يصل الحد الأقصى للحجم الإجمالي إلى 50 & # 8197GB يمكن أن يصل حجم الملفات الفردية إلى 2 & # 8197GB كحد أقصى. يتم تخصيص DOI لكل مجموعة بيانات للأرشفة والاكتشاف بشكل دائم ، ويتم ربطها بالبيانات الوصفية التي يوفرها الباحث.

2.2.3. شبكة بيانات البيولوجيا الإنشائية

توفر منظمة SBGrid وصولًا للباحثين في العديد من مختبرات البيولوجيا الهيكلية حول العالم إلى مجموعة حزم من البرامج التي يمكن استخدامها في العديد من مجالات البيولوجيا الهيكلية ، بما في ذلك علم البلورات بالأشعة السينية ، والفحص المجهري للإلكترون بالتبريد ، وانحراف الإلكترون ، والتشتت بزاوية صغيرة ومناطق أخرى.يوفر SBGrid أيضًا الوصول إلى موارد الحوسبة السحابية التي تنفذ حسابات البيولوجيا الهيكلية. شبكة بيانات البيولوجيا الهيكلية هي خدمة بدأها SBGrid مؤخرًا والتي تسمح لأي باحث SBGrid بأرشفة البيانات الأولية من أي من مجالات البيولوجيا الهيكلية SBGrid. تحتوي قاعدة البيانات هذه حاليًا على أكثر من 240 مجموعة بيانات من 62 مؤسسة مختلفة. يمكن لأي شخص عرض البيانات ويمكن لأي شخص تنزيل مجموعات البيانات البلورية ، باستخدام نصوص قص ولصق لسهولة تنزيل مجموعات البيانات الفردية. يحتوي كل إدخال بيانات على معرف معرف فريد معين ، ولا توجد قيود على أحجام الملفات ، ويتم توفير البيانات الوصفية التي تصف كيفية تحليل البيانات.

2.2.4. بوابة البحث

ResearchGate هي خدمة شبكات اجتماعية علمية تجارية توفر آلية بسيطة للباحثين لنشر أوراقهم العلمية ومعلومات عن أنفسهم ، وللباحثين للتواصل حول الموضوعات العلمية ومناقشتها. يسمح ResearchGate أيضًا للباحثين بأرشفة مجموعات البيانات العلمية ليتمكن أي شخص من تنزيلها. يتم تخصيص DOI لمجموعات البيانات ، ويكون حجم الملفات الفردية محدودًا.

2.3 خيارات منشأة الليزر السنكروترون والنيوترون والأشعة السينية

يوجد الآن العديد من الأمثلة اللافتة للنظر للممارسات الحالية والمتطورة في التقاط البيانات وإدارتها عبر مجموعة من المرافق واسعة النطاق التي تستوعب مجموعة متنوعة من التقنيات والعلوم. من بين أولئك الذين نعرفهم هو السنكروترون الأسترالي (كلايتون ، فيكتوريا ، أستراليا) ، ESRF ، معهد Laue & # 8211Langevin (ILL ، غرينوبل ، فرنسا) ، مصدر الضوء الماسي (ديدكوت ، المملكة المتحدة) ومصدر ISIS النيوتروني في مختبر رذرفورد أبليتون (ديدكوت ، المملكة المتحدة). قادت شركة السنكروترون الأسترالية السنكروترونات في العالم في أرشفة البيانات من خلال Store.Synchrotron data storage service for macromolecular crystallography (Meyer) وآخرون. ، 2014). بالإضافة إلى أرشفة بيانات صور الحيود ، فإنه يدعم أيضًا المستخدمين في منشوراتهم بالربط بمجموعات البيانات الأولية عبر تسجيلات DOI ، وأخيرًا ، إصدار مجموعات البيانات للتحليل العام & # 8211 ، وهو أمر يقوم به ILL أيضًا في مجتمع النيوترونات. هناك أيضًا أمثلة رائعة مثل Diamond التي احتفظت حتى الآن بجميع بياناتها المقاسة. نشر ESRF ملخصًا لآرائه حول عصر البيانات الضخمة في منشآت الإشعاع السنكروتروني بشكل عام والتحديات التي تواجه اليوم ESRF نفسه (ESRF ، 2013). في بيان حديث مشجع ، أعلنت عن سياسة استباقية لأرشفة البيانات (Andy G & # 246tz وزملاء من ESRF ، الاتصال الشخصي).

لا تزال هناك تحديات كبيرة للغاية لإدارة البيانات في المختبرات المنزلية ولمقدمي الخدمات متوسطي النطاق مثل خدمة علم البلورات الوطنية بالمملكة المتحدة (ساوثهامبتون ، المملكة المتحدة). في جميع هذه الأماكن ، يجب التعامل مع جميع البيانات من التجربة في سياق إدارة الموارد ، والمصدر ، والتحقق من الصحة والتخزين بالجملة ، وكلها تتطلب أحجامًا أكبر من البيانات الوصفية التي يجب أن تتوافق مع المعايير المقبولة على نطاق واسع.

2.4 طوفان البيانات

أحد التحذيرات التي نطبقها على مسحنا المشجع لحلول المستودعات هو أنه مع تقدم التكنولوجيا ، فإن حجم البيانات التي يتم جمعها يتزايد بمعدل كبير. ومن ثم ، في حين أن إجمالي التنزيلات الكاملة من جامعة أوتريخت في عام 2015 كان 31 & # 8197 جيجابايت ، فإن مجموعة البيانات الفردية التي تم إنتاجها بواسطة كاشف Eiger 16M الذي يعمل حاليًا على خط شعاع السنكروترون يمكن أن يزيد عن 70 & # 8197 جيجابايت. يشير هذا إلى أن المرافق التجريبية المركزية ، بقدراتها الكبيرة لتخزين البيانات وشبكاتها الداخلية جيجابت ، ستستمر في لعب دور مهم كمستودعات الاختيار الأول للاحتفاظ شبه الروتيني بمجموعات البيانات. ومع ذلك ، قد يصبح من الضروري أيضًا تطبيق مبادئ "الفرز" ، إما عند نقطة جمع البيانات أو في تخصيص التخزين اللاحق طويل الأجل. قد يؤدي هذا الفرز إلى حذف مجموعات بيانات معينة أو الاحتفاظ ببعض المجموعات الفرعية ، وفقًا لمجموعة متنوعة من المعايير الممكنة. تم اقتراح اقتراح مبدئي لمجموعة من هذه المعايير في منتدى DDDWG عبر الإنترنت في عام 2011 (http://forums.iucr.org/viewtopic.php؟f=21&t=57) ولكن لم يتم تطويره من قبل المجتمع بعد .

3. البيانات الوصفية لمتطلبات البيانات الخام

3.1. إطار بيانات وصفية شامل لعلم البلورات

علم البلورات والعلوم الهيكلية ذات الصلة محظوظون في وجود نهج موحد لتوصيف البيانات وإدارتها ، والمعروف باسم إطار المعلومات البلورية (CIF Hall & # 38 McMahon ، 1995). يتكون هذا من مكونين: تنسيق ملف قياسي ونموذج بيانات (Hall وآخرون. ، 1991 برنشتاين وآخرون. ، 2016) ، والتي تسهل تبادل البيانات بين البرامج وقواعد البيانات الهيكلية وأنظمة النشر ومجموعة من "القواميس" التي تتحكم في معنى العلامات المرتبطة بقيم البيانات ، والتي يمكن أن تفرض قيودًا على أنواع البيانات والقيم عند الاقتضاء. تشكل هذه القواميس بشكل جماعي المفردات المضبوطة والتعريفات المرتبطة بها التي تمثل المعنى الدلالي لملف بيانات أو تيار & # 8211 ما يسمى على نحو عصري ب "علم الوجود" لمجال علمي معين.

يحتوي كل قاموس CIF على تعريفات ذات صلة بمجال معين أو منطقة موضوع ، مثل هياكل الخلايا الصغيرة التي يحددها قياس الحيود أحادي البلورة (ما يسمى بالقاموس "الأساسي") ، وانحراف المسحوق ، والتركيبات الجزيئية البيولوجية ، والهياكل غير المتكافئة المعدلة ، كثافة الإلكترون متعددة الأقطاب أو صور الحيود (Hall & # 38 McMahon ، 2016). تأخذ هذه المجموعات بحسب الموضوع نظرة شاملة لما يمكن تسميته "بيانات". وبالتالي ، يحتوي القاموس الأساسي على عناصر متنوعة مثل إحداثيات موضعية ذرية واحدة ، ودرجة الحرارة المحيطة في وقت إجراء التجربة ، ومقاييس التقارب لصقل المربعات الصغرى ، والبرنامج المستخدم لتوليد الرسومات الجزيئية ، أو النص الكامل لـ منشور علمي مرتبط. أي أنه لا يوجد تمييز بين العناصر التي يمكن تصنيفها عادة على أنها بيانات "أولية" أو "معالجة" أو "مشتقة" ، أو يمكن وصفها بأنها "بيانات وصفية".

ميزة هذا النقص في التمايز هي أن الكل يمكن تخزين المعلومات اللازمة لتفسير أو التحقق من صحة أو إعادة استخدام مجموعة بيانات في ملف واحد وهذا يمكن أن يسهل جمع هذه المعلومات والتحقق منها أثناء سير العمل التجريبي. يوضح الشكل 6 كيف تُعلم الأنطولوجيا CIF "تدفق المعلومات المتماسك" في كل مرحلة من مراحل دورة حياة معالجة المعلومات في تجربة نموذجية لتحديد البنية. في الممارسة العملية ، لا تستخدم جميع تدفقات العمل في العالم الحقيقي CIF كآليتها الفعلية لالتقاط البيانات والبيانات الوصفية. على سبيل المثال ، في مرافق الأدوات الكبيرة ، يمكن جمع المعلومات حول تجربة معينة ضمن نظام إدارة محتوى موحد طورته المنشأة لاستيعاب مجموعة واسعة من التجارب العلمية المختلفة (ماثيوز وآخرون. ، 2010). وبالمثل ، لإدارة متطلبات الحصول على البيانات عالية الإنتاجية لأجهزة الكشف الحديثة ، يمكن إنشاء الصور كملفات HDF5 ثنائية ، أو في تنسيقات خاصة.


الشكل 6
تدفق معلومات متماسك في علم البلورات. تميز الأنطولوجيا CIF البيانات في كل مرحلة من مراحل دورة حياة معالجة المعلومات ، من الجهاز التجريبي إلى الورق المنشور وإيداع قاعدة البيانات المنسقة.

ومع ذلك ، يمكن ، من حيث المبدأ ، تحويل جميع مجموعات البيانات الأولية والبيانات الوصفية المرتبطة إلى تمثيلات CIF ، والتي قد تكون مفيدة عملية لأغراض الأرشفة ( بمعنى آخر. لاستخدام تمثيل معياري واحد) ، أو على الأقل يمكن أن يوضح ما هي البيانات الوصفية المهمة المفقودة ، بالمقارنة مع خلاصة القاموس CIF الشاملة لما يمكن وينبغي جمعه.

تستمر لجان IUCr المختلفة في تجميع تعريفات البيانات الوصفية ذات الصلة بمجال اهتمامهم في شكل قواميس CIF. بالإضافة إلى تلك المدرجة في Hall & # 38 McMahon (2016) ، تم مؤخرًا نشر قاموس تشتت صغير الزاوية (sasCIF) (Kachala وآخرون. ، 2016) تقدمت بشكل جيد من قبل لجنة IUCr على الهياكل المغناطيسية لتوصيف الهياكل المغناطيسية والتماثلات الأساسية (magCIF) ولجنة الضغط العالي لديها مجموعة عمل نشطة تحدد الجوانب الأساسية للإعداد التجريبي المطلوب في علم البلورات غير المحيط.

كما ذكرنا سابقًا ، يصف قاموس imgCIF تنسيقًا فعليًا لتخزين بيانات الحيود الأولية. ومع ذلك ، فإنه يتضمن أيضًا مجموعة كاملة إلى حد ما من عناصر البيانات التي ، إذا تم ملؤها بالكامل واستخدامها بالاقتران مع عناصر أخرى في قواميس CIF الأساسية أو الجزيئية الكبيرة ، يمكنها وصف الجهاز التجريبي ومعلمات التشغيل بشكل كامل ، وبالتالي السماح بتفسير كامل للصور المؤرشفة بهذا الشكل. تنسيق imgCIF نفسه قليل الاستخدام نسبيًا ، ويرجع ذلك إلى حد كبير إلى متطلبات السرعة في أجهزة الكشف الحديثة التي تتطلب استراتيجيات مختلفة للحصول على البيانات. ومع ذلك ، هناك جهد مستمر لتعريف مصطلحات البيانات الوصفية في تنسيق NeXus الشائع بشكل متزايد (K & # 246nnecke وآخرون. ، 2015) المتوافقة مع عناصر البيانات الوصفية التجريبية المحددة في قاموس imgCIF.

3.2 تنوع الأجهزة

في هذا القسم ندرس تفاصيل بعض المشاكل التي نواجهها في الممارسة مع البيانات الوصفية المفقودة أو سيئة التوصيف. تمت مناقشة مدى توفر البيانات الوصفية في رؤوس الصور وتفسيرها من قبل مطوري البرامج سابقًا (Tanley، Schreurs وآخرون. ، 2013 Kroon-Batenburg & # 38 Helliwell ، 2014). يمكن الاستنتاج بأمان أن معلومات البيانات الوصفية غالبًا ما تكون غير متوفرة أو غامضة ، بمعنى آخر. يمكن تفسيرها بطرق مختلفة. قد يستخدم مصنعو الأجهزة كلمات مختلفة لنفس المعلمة المادية أو وحداتها ، وكل ذلك في أيدي مطوري البرامج لتحقيق الاستخدام الصحيح لمعلومات البيانات الوصفية وملء الأجزاء المفقودة ، ببساطة عن طريق المعرفة المكتسبة أو عن طريق التجربة والخطأ . نشير إلى المعلومات الداعمة في الورقة التي أعدها Kroon-Batenburg & # 38 Helliwell (2014) لإجراء مناقشة بين Kay Diederichs و Toine Schreurs و Loes Kroon-Batenburg حول & # 966 عمليات المسح حول محور غير عمودي على حزمة الأشعة السينية على مقياس الزوايا & # 967 الثابت. على الرغم من توفر معلومات كافية في العنوان ، فإن ملف XDS تجاهل البرنامج (Kabsch ، 2010) معظمه واستخدم المعرفة بالإعداد الآلي (المعتاد) ، والذي لم يكن كافياً في هذه الحالة. في البداية ، تم تخزين البيانات الأولية ، الموجودة الآن في أرشيف مكتبة جامعة مانشستر ، على موقع ويب في جامعة أوتريخت (http://rawdata.chem.uu.nl) وقمنا بإضافة صورة للإعداد التجريبي كبيانات وصفية إلى حل الغموض في مقياس الزوايا ، على سبيل المثال هل محور المغزل يشير لأعلى أو لأسفل؟

يجب أن نميز بين معدات الحيود المصممة للاستخدام مع برنامج الشركة المصنعة ، والتي تتعامل بشكل مناسب مع معلومات البيانات الوصفية ، والأدوات المُجمَّعة مثل تلك الموجودة على خط إشعاع السنكروترون. في الحالة الأولى ، قد يؤدي نقل البيانات إلى مكان آخر لاستخدامها مع برنامج جهة خارجية إلى حدوث مشكلات ، كما وصفها تانلي ، ديدريتش وآخرون. (2013). تحتوي رؤوس الصور في أفضل الأحوال على نوع مقياس الزوايا ( على سبيل المثال ` MACH3 مع KAPPA 'لـ Bruker Proteum) ولكن نادرًا ما يتم إعطاء توجهات وتبعيات المحاور الأربعة. في الحالة الثانية ، أجهزة الكشف التجارية ( على سبيل المثال Pilatus من Dectris) مثبتة على خط شعاع وهو برنامج التحكم في خط الحزمة ، بالتفاعل الوثيق مع برنامج الكاشف ، هو المسؤول عن كتابة المعلومات في رؤوس الصور. في هذه البيئة المختلطة ، لا يتم التقاط جميع البيانات الوصفية. عادةً ، ولكن ليس دائمًا ، يتم إعطاء الطول الموجي والمسافة من الكاشف إلى العينة وحجم البكسل وعدد البكسل في أي من الاتجاهين وزاوية بدء الدوران والزيادة ووقت التعرض.

ومع ذلك ، فإن المشاكل الأكثر شيوعًا في البيانات الوصفية تتعلق بتوجهات محاور مقياس الزوايا واتجاهات الدوران ، وتعريف الاتجاهات الأسرع والأبطأ في إحداثيات البكسل فيما يتعلق بمحاور المختبر وأصل إحداثيات البكسل أمر مزعج بشكل خاص عدم وجود مركز شعاع غير صحيح (انظر أدناه). يعطي الجدول رقم 1602 تعريفات مقياس الزوايا المعروفة لـ EVAL برنامج (Schreurs وآخرون. ، 2010) ويظهر تنوعها الكبير.

الجدول 2
تنفيذ أنواع مقياس الزوايا في EVAL (شريورز وآخرون. , 2010 )

جدولة مثيرة للاهتمام لإعدادات خط الشعاع للتشغيل autoPROC (Vonrhein وآخرون. ، 2011) على الموقع http://www.globalphasing.com/autoproc/wiki. قيم مثل BeamCentreFrom = الرأس: x ، -y , ReversePhi = "نعم" و TwoThetaAxis = "-1" من أجل التعامل مع مشاكل مماثلة لتلك المذكورة أعلاه (الجدول 2). هناك ثماني طرق محتملة ترتبط بها قيم البكسل في ملف الصورة بواجهة جهاز الكشف المادي ، ويستخدم بائعو الكاشف جميع الاصطلاحات الثمانية الممكنة (Wladek Minor ، اتصال خاص). يمكن لمركز شعاع خاطئ أن يعيق خطوة الفهرسة. يمكن للمرء تقدير مركز الحزمة عن طريق الفحص اليدوي ، والمعايرة باستخدام حيود المسحوق ، عن طريق أخذ لقطة شعاع مباشرة أو عن طريق إزالة بقع براج واستخدام حلقة انتشار المذيب للعثور على مركز الحزمة (Vonrhein وآخرون. ، 2011) وإلا يتعين على المرء أن يلجأ إلى التجربة والخطأ. يوضح الشكل 7 رأس CBF المصغر الذي يستخدمه Dectris لأجهزة الكشف عن Pilatus. معظم المعلومات موجودة ولكن بعض المعلمات غامضة: شعاع : انظر المناقشة أعلاه التذبذب_المحور تعطى كـ " X ': ما هو ملف X اتجاه؟ الاستقطاب يكون 0.990 : أي طائرة لها شدة قوية؟ لقد واجهنا موقفًا محيرًا بشكل خاص حيث تم تركيب مقياس الزوايا الثابت & # 967 من Bruker مع دوران 90 & # 176 على Argonne beamline 15ID-B ، بينما تم تحويل الصور إلى اتجاه أداة Bruker العادي. لذلك ظهر اتجاه الاستقطاب القوي على طول محور التذبذب ، لكنه لم يكن (Jozef Ko & # 382 & # 237 & # 353ek ، اتصال خاص) فقط السلسلة الهدف التزامن في رأس حذرنا.

أكثر بداهة غالبًا ما تكون المعرفة مطلوبة لتفسير بيانات صورة الحيود. على سبيل المثال ، هناك اتفاقيات مختلفة حول كيفية تسجيل المناطق الميتة على الكاشف: يُشار إلى الشرائط بين لوحات الكاشف على أجهزة الكشف بيلاتوس بـ `` -1 '، بينما في ملفات صور كاشف ADSC يشار إليها بعلامة `` 0 ". يجب أن يفسر برنامج معالجة البيانات بيانات البكسل هذه بشكل صحيح. قد تؤدي تصحيحات الصور المظلمة وعدم الانتظام إلى شدة سلبية وتستخدم بعض معالجات قراءة الكاشف ما يسمى بإزاحة خط الأساس: تمت إضافة رقم صحيح ثابت إلى جميع شدة البكسل لتجنب الاضطرار إلى تخزين الأرقام السالبة. تعد إزالة إزاحة خط الأساس أمرًا مهمًا في تقدير الانحرافات المعيارية لشدة انعكاس Bragg الصافية ولقياس شدة الانتشار بين قمم Bragg. عادةً ما يتم إجراء تصحيحات التشويه المكاني ولا يمكن التراجع عنها أو تصحيحها عن طريق برامج المعالجة ، ولكنها تؤثر على الانحرافات المعيارية (Waterman & # 38 Evans ، 2010) ويجب نقل هذه المعلومات في البيانات الوصفية.

يتم تطوير أجهزة الكاشف من أجل تجارب علم البلورات التسلسلي عالية السرعة في تركيبات ليزر الإلكترون الحر بالأشعة السينية (XFEL) أو خطوط الأشعة السينكروترونية عالية التدفق التي تتطلب الحصول على البيانات بسرعة فائقة. تم تصميم تنسيق حاوية HDF5 ، غالبًا مع طبقة تنسيق بيانات NeXus في الأعلى ، لإدخال / إخراج (I / O) مرن وفعال لمثل هذه الأحجام الكبيرة من البيانات. حزم برامج معالجة البيانات الجديدة مثل كريستفيل (أبيض وآخرون. , 2012 ), cctbx.xfel (سوتر وآخرون. ، 2013) و الاتصال (الماء وآخرون. ، 2013) لعلم البلورات التسلسلي قيد التطوير وهذا يوفر الفرصة لمعالجة قضايا البيانات الوصفية من جديد.

قام Dectris بتركيب كاشف Eiger في العديد من خطوط الأشعة السنكروترونية. يتم تضمين البيانات الوصفية في ملف منفصل ( سيد h5 ) ربط ملفات بيانات الصورة. تمثيل بيانات NeXus (K & # 246nnecke وآخرون. ، 2015) ، مثل CIF ، مرن للغاية ويمكن التقاط جميع البيانات الوصفية المطلوبة من خلال تحديد مجموعات وحقول وسمات NeXus. يتم توفير مثال جيد لكيفية تخزين البيانات الوصفية المتسقة والشاملة في ملف imgCIF / CBF في الشكل 8 (J & # 246rg Kaercher ، Bruker AXS ، اتصال خاص). في الملكية Bruker .sfrm تنسيق زوايا البداية 2 & # 952 ، & # 969 ، & # 966 و & # 967 معطاة (` الزوايا:. '). لم يتم تحديد اتجاهات المحور الخاصة بهم ، بينما هم بتنسيق CBF: يتم تقديم الاتجاهات والتبعيات في اللوحة اليسرى من الشكل .8 ( ب ). في .sfrm محور الدوران ` المحور: 2 'يشير إلى & # 969 ، ويتم العثور على زاوية البداية والزيادة في ` بداية: "و" يكريم: تم العثور على القيم المكافئة في رأس CBF في ` _diffrn_scan_axis.displacement_angle "و" _diffrn_scan_axis.displacement_increment (الشكل 8 ب ، اللوحة اليمنى).

4. قلق وإجراء ناشئ عن ورشة عمل Rovinj Diffraction Data Deposition Workshop

تم الإعراب عن القلق خلال المناقشة المفتوحة في ورشة العمل عبر السؤال " هل يمكننا الابتعاد عن قاعدة المعرفة في حزم البرامج المختلفة ، والاستفادة من تنسيقات البيانات الوصفية المطورة جيدًا مثل CIF أو NeXus؟ ', بمعنى آخر. من شأن تنسيق بيانات صورة الحيود الخام المعياري أن يجعل الحياة أسهل لمطوري البرامج ولكنه يتطلب التنسيق بين الشركات المصنعة للكاشف. وقد أدى ذلك مباشرة إلى تجدد الدعوات للحصول على تنسيق موحد للصورة من الجاذبية عبر المجتمع بأسره. بالتزامن مع هذا السؤال ، يعمل DDDWG على تحديد الحد الأدنى من المتطلبات للبيانات الوصفية. نحن ندرك أنه سيستمر وجود تنوع كبير في تنسيقات الصور (لأسباب ليس أقلها القاعدة المثبتة الحالية لأجهزة الكشف ومجموعات البيانات القديمة التي تم أرشفتها) ، وأدوات التحويل مثل eiger2cbf (https://github.com/biochem-fan/eiger2cbf) ستستمر الحاجة إليه. ومع ذلك ، من المهم أن يكون أي شخص يسعى إلى تطوير المزيد من التنسيقات الجديدة على دراية تامة بالحاجة إلى توصيف البيانات الوصفية الملائمة وقابلية التشغيل البيني التي وصفناها أعلاه ، وقد يخفف هذا الوعي من انتشار المزيد من التنسيقات الجديدة دون قيمة معينة يمكن إثباتها.

في مناقشة منفصلة ، تم الاتفاق على أن هناك حاجة لمجموعة من المعايير لالتقاط والتحقق من صحة البيانات الوصفية التجريبية الأساسية لاستنساخ النتائج العلمية من أي مجموعة بيانات أولية معينة. أشار الاقتراح إلى هذا باسم ` checkCIF بالنسبة للبيانات الخام ، وقد تم إنشاء تعاون وثيق في هذا الشأن مع IUCr COMCIFS (برئاسة جيمس هيستر ، الذي حضر أيضًا ورشة عمل روفينج). لتطوير هذه الأفكار بشكل أكبر ، من المقرر عقد ورشة عمل يديرها DDDWG في مؤتمر ACA 2017 في نيو أورلينز في مايو 2017.

5. ملاحظات ختامية

في هذا الاستعراض الموضعي ، قدمنا ​​أوصافًا للاهتمامات سريعة التطور وخيارات التخزين لحفظ وإعادة استخدام البيانات الخام ضمن المجال العلمي الذي يشرف عليه IUCr ولجانه. لقد سلطنا الضوء على مبادرات صانعي السياسات العلمية نحو نموذج "العلم المفتوح" الذي سيعمل من خلاله علماء البلورات في المستقبل ، وهذا سيوفر فرصًا جديدة للتمويل ولكن أيضًا مدونات إجراءات جديدة ضمن أطر علمية مفتوحة. ستكون هناك حاجة إلى تعليم المهارات والتدريب لخبراء البلورات ومناقشة صريحة. بشكل عام ، لدينا الآن الوسائل والتنظيم للحفاظ على بياناتنا الأولية ، ولكن لا تزال هناك حاجة ملحة للتفكير بعناية في واصفات البيانات الوصفية لكل من لجان IUCr. نلاحظ أن اللجان تعمل ضمن مجموعة متنوعة من الأجهزة ، وبالتالي هناك حاجة إلى مجموعة من الإجراءات لتحسين هذا الوضع الحالي.

لقد حددنا على وجه التحديد الحاجة إلى إعادة النظر في ضرورة تبني المجتمع لتنسيق موحد للصورة ، والموافقة على الأقل على مجموعة صغيرة من البيانات الوصفية الأساسية لإمكانية التكاثر. قاموس imgCIF (هامرسلي وآخرون. ، 2005) هي نقطة البداية الطبيعية للأول ، والتفاعل بين COMCIFS و NIAC (K & # 246nnecke وآخرون. ، 2015) جدوى تطبيق علم الوجود المشترك عبر الأشكال المادية المختلفة. هناك أيضًا أسباب للتفاؤل بأن فكرة checkCIF للحصول على البيانات الأولية "سوف يروق لكل من الباحثين وبائعي الأجهزة ، نظرًا للتمثيل الحماسي لكليهما في ورشة عمل روفينج. كما هو الحال مع جميع هذه المبادرات ، سيعتمد معدل الاستيعاب على العوامل المحركة داخل المجتمع. في حالة ملف checkCIF بالنسبة للبيانات المشتقة ، قدمت مجلات العلوم الهيكلية (خاصة تلك الخاصة بـ IUCr) التي تطلبت البيانات الوصفية ذات الصلة والتحقق من الاتساق أحد المحركات المهمة. في حالة البيانات الأولية ، التي تدعم جميع الاستنتاجات والاشتقاقات العلمية اللاحقة ، نشجعنا السياسات الناشئة حول إدارة بيانات البحث التي لخصناها في هذه المقالة ، وبالعديد من مبادرات الأرشفة التي ظهرت حول حيود الأشعة السينية صور في الفضاء في السنوات القليلة الماضية.

شكر وتقدير

نحن ممتنون لـ IUCr لدعمه المستمر لأنشطة DDDWG ، بما في ذلك ورشة العمل في Rovinj التي أدت إلى هذا وعدد من المقالات الأخرى. نحن ممتنون جدًا للعديد من المعاهد البحثية والجامعات التي أرسلت موظفيها للمشاركة في تلك الورشة. ساهمت Dectris و IUCr Journal و CODATA و Cambridge Crystallographic Data Center و Bruker و FIZ Karlsruhe / ICSD و Oxford Cryosystems و Wiley بتقديم الدعم للخدمات الفنية وتكاليف التوظيف المرتبطة بها ، ونحن ممتنون جدًا لهم. نحن مدينون أيضًا للرابطة الكرواتية لعلماء البلورات لمساعدتهم النشطة في تأمين أفضل ورشة عمل ممكنة لمعالجة هذا الموضوع المهم.

مراجع

Berman ، H.M ، Westbrook ، J. ، Feng ، Z. ، Gilliland ، G. ، Bhat ، T. N. ، Weissig ، H. ، Shindyalow ، I.N & # 38 Bourne ، P. E. (2000). الدقة الأحماض النووية. 28 ، 235 & # 8211242. شبكة العلوم CrossRef PubMed CAS Google Scholar
برنشتاين ، إتش ج. (2005). تصنيف واستخدام بيانات الصورة . الجداول الدولية لعلم البلورات ، المجلد. ز تعريف وتبادل البيانات البلورية ، حرره S.R Hall and B. McMahon ، pp.199 & # 8211205. دوردريخت: سبرينغر. منحة جوجل
Bernstein ، HJ ، Bollinger ، JC ، Brown ، ID ، Gra & # 382ulis ، S. ، Hester ، J. & # 160R. ، McMahon ، B. ، Spadaccini ، N. ، Westbrook ، JD & # 38 Westrip ، SP (2016) . J. أبل. كريست. 49 ، 277 & # 8211284. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
برنشتاين ، إتش جيه ، سلون ، جيه إم ، وينتر ، جي ، ريختر ، تي إس ، نياك آند # 38 كومسيفس (2013). التعامل مع تنسيقات صور البيانات الكبيرة: تكامل CBF و NeXus و HDF5 . اجتماع الجمعية الأمريكية لعلم البلورات ، 20 & # 821124 يوليو 2013 ، هونولولو ، هاواي ، الولايات المتحدة الأمريكية. ملصق T-16. منحة جوجل
Diederichs، K. & # 38 Karplus، P. A. (2013). اكتا كريست. د 69 ، 1215 & # 82111222. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
مركز التنظيم الرقمي (2016). نظرة عامة على سياسات بيانات الممولين. http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies. منحة جوجل
ESRF (2013). أخبار ESRF ، كانون الأول (ديسمبر) ، ص 14 & # 821121. ESRF ، غرونوبل ، فرنسا. منحة جوجل
Grabowski، M.، Langner، KM، Cymborowski، M.، Porebski، PJ، Sroka، P.، Zheng، H.، Cooper، DR، Zimmerman، MD، Elsliger، M.-A.، Burley، SK & # 38 مينور ، دبليو (2016). اكتا كريست. د 72 ، 1181 & # 82111193. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
جوس ، جيه إم & # 38 مكماهون ، ب. (2014). اكتا كريست. د 70 ، 2520 & # 82112532. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
Gutmanas، A.، Oldfield، T. J.، Patwardhan، A.، Sen، S.، Velankar، S. & # 38 Kleywegt، G.J. (2013). اكتا كريست. د 69 ، 710 & # 8211721. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
Hall، S.R، Allen، F.H & # 38 Brown، I. D. (1991). اكتا كريست. أ 47 ، 655 & # 8211685. CSD CrossRef CAS Web of Science IUCr المجلات الباحث العلمي من Google
Hall ، S.R & # 38 McMahon ، B. (1995). المحررين. الجداول الدولية لعلم البلورات ، المجلد. ز تعريف وتبادل البيانات البلورية . دوردريخت: سبرينغر. منحة جوجل
Hall ، S.R & # 38 McMahon (2016). علوم البيانات. ج. 15 3. الباحث العلمي من Google
هامرسلي ، إيه بي ، برنشتاين ، إتش جيه & # 38 ويستبروك ، جيه دي (2005). قاموس الصور (imgCIF) . الجداول الدولية لعلم البلورات ، المجلد. ز تعريف وتبادل البيانات البلورية ، الذي حرره S. & # 160R. هول و ب مكماهون ، ص 444 & # 8211458. دوردريخت: سبرينغر. منحة جوجل
هيستر ، ج.ر. (2016). علوم البيانات. ج. 15 ، 12. CrossRef Google Scholar
المنظمة الدولية لعلم الجينوم الإنشائي (2001). تقرير فريق العمل المعني بالمعايير العددية في الجينوم الإنشائي. http://www.isgo.org/organization/members07/010410.html. منحة جوجل
جاك ، دي إيه ، جوس ، جي إم ، سفرجون ، دي آي & # 38 تريوهيلا ، ج. (2012). اكتا كريست. د 68 ، 620 & # 8211626. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
جونز ، ب. (2015). نحو سحابة العلوم الأوروبية المفتوحة . http://doi.org/10.5281/zenodo.16001. منحة جوجل
كبش ، و. (2010). اكتا كريست. د 66 ، 125 & # 8211132. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
كاشالا ، إم ، ويستبروك ، جيه آند # 38 سفرجون ، دي (2016). J. أبل. كريست. 49 ، 302 & # 8211310. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
K & # 246nnecke، M. وآخرون. (2015). J. أبل. كريست. 48 ، 301 & # 8211305. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
Kroon-Batenburg، L.M.J & # 38 Helliwell، J.R (2014). اكتا كريست. د 70 ، 2502 & # 82112509. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
مارش ، آر إي ، كابون ، إم ، هو ، إس آند # 38 هيربستين ، إف إتش (2002). اكتا كريست. ب 58 ، 62 & # 821177. CSD CrossRef CAS IUCr المجلات الباحث العلمي من Google
ماثيوز ، ب ، صوفي ، س ، فلانيري ، د ، ليروس ، إل ، جريفين ، ت. ، جليفز ، إم. & # 38 كليس ، ك. (2010). كثافة العمليات J. ديجيت. معالجة , 5 ، 106 & # 8211118. CrossRef Google Scholar
Messori ، L. & # 38 Merlino ، A. (2016). تنسيق. تشيم. القس. 315 ، 67 & # 821189. شبكة العلوم CrossRef CAS Google Scholar
Meyer، GR، Arag & # 227o، D.، Mudie، NJ، Caradoc-Davies، TT، McGowan، S.، Bertling، PJ، Groenewegen، D.، Quenette، SM، Bond، CS، Buckle، AM & # 38 Androulakis ، س. (2014). اكتا كريست. د 70 ، 2510 & # 82112519. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
ماير ، ب. وآخرون. (2016). نات. كومون. 7 ، 10882. Web of Science CrossRef PubMed Google Scholar
مينور ، دبليو ، داوتر ، زد ، هيليويل ، جي آر ، جاسكولسكي ، إم & # 38 ولودوير ، أ. (2016). بنية , 24 ، 216 & # 8211220. شبكة العلوم CrossRef CAS PubMed Google Scholar
مؤسسة العلوم الوطنية (2010). إدارة البيانات ومشاركة الأسئلة المتداولة (FAQs). http://www.nsf.gov/bfa/dias/policy/dmpfaqs.jsp. منحة جوجل
مكتبة جامعة نورث وسترن (2016). إدارة البيانات: متطلبات وكالة التمويل الفيدرالية. http://libguides.northwestern.edu/datamanagement/federalfundingagency. منحة جوجل
رافيل ، ب ، هستر ، ج.ر. ، سول & # 233 ، ف.أ. & # 38 نيوفيل ، م. (2012). J. سينكروترون راد. 19 ، 869 & # 8211874. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
مجالس الأبحاث في المملكة المتحدة (2015). إرشادات حول أفضل الممارسات في إدارة بيانات البحث. http://www.rcuk.ac.uk/documents/documents/rcukcommonprinciplesondatapolicy-pdf/. منحة جوجل
Sauter، N.K، Hattne، J.، Grosse-Kunstleve، R.W & # 38 Echols، N. (2013). اكتا كريست. د 69 ، 1274 & # 82111282. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
Schreurs ، A.M. ، Xian ، X. & # 38 Kroon-Batenburg ، L.MJ (2010). J. أبل. كريست. 43 ، 70 & # 821182. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
العلوم الدولية (2015). البيانات المفتوحة في عالم البيانات الضخمة. باريس: المجلس الدولي للعلوم (ICSU) ، المجلس الدولي للعلوم الاجتماعية (ISSC) ، الأكاديمية العالمية للعلوم (TWAS) ، الشراكة بين الأكاديميات (IAP). منحة جوجل
Shabalin، I.، Dauter، Z.، Jaskolski، M.، Minor، W. & # 38 Wlodawer، A. (2015). اكتا كريست. د 71 ، 1965 & # 82111979. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
ستريكلاند ، ب.ر. ، هويلاند ، إم إيه & # 38 مكماهون ، ب. (2005). نشر بنية بلورية جزيئية صغيرة باستخدام CIF . الجداول الدولية لعلم البلورات ، المجلد. ز تعريف وتبادل البيانات البلورية ، حرره S.R Hall and B. McMahon ، pp. 557 & # 8211569. دوردريخت: سبرينغر. منحة جوجل
تانلي ، S.W.M ، Diederichs ، K. ، Kroon-Batenburg ، L.MJ ، Levy ، C. ، Schreurs ، A.M. & # 38 Helliwell ، J.R (2015). اكتا كريست. د 71 ، 1982 & # 82111983. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
تانلي ، S.W.M ، Diederichs ، K. ، Kroon-Batenburg ، L.M.J ، Schreurs ، A.M.M & # 38 Helliwell ، J.R (2013). J. سينكروترون راد. 20 ، 880 # 8211883. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
تانلي ، S.W.M ، Schreurs ، A.M M. ، Helliwell ، J.R & # 38 Kroon-Batenburg ، L.MJ (2013). J. أبل. كريست. 46 ، 108 & # 8211119. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
تانلي ، إس دبليو إم ، شريورز ، إيه إم إم ، كرون باتنبرج ، إل إم جي & # 38 هيليويل ، جي آر (2016). اكتا كريست. F 72 ، 253 & # 8211254. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
تيرويليجر ، تي سي (2012). التحسين المستمر للهياكل البلورية لماكرومول و # 173 عقيدية . رؤى ICSTI: المنشور الحي ، ص 16 & # 821129 (http://www.icsti.org/IMG/pdf/Living_publication_Final-2.pdf). باريس: ICSTI. منحة جوجل
تيرويليجر ، تي سي (2014). اكتا كريست. د 70 ، 2500 # 82112501. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
تيرويليجر ، T.C & # 38 Bricogne ، G. (2014). اكتا كريست. د 70 ، 2533 & # 82112543. Web of Science CrossRef IUCr المجلات الباحث العلمي من Google
توبي ، ب.إتش (2005). تصنيف واستخدام بيانات حيود المسحوق . الجداول الدولية لعلم البلورات ، المجلد. ز تعريف وتبادل البيانات البلورية ، تم تحريره بواسطة S.R Hall and B. McMahon ، pp. 117 & # 8211130. دوردريخت: سبرينغر. منحة جوجل
Vonrhein، C.، Flensburg، C.، Keller، P.، Sharff، A.، Smart، O.، Paciorek، W.، Womack، T. & # 38 Bricogne، G. (2011). اكتا كريست. د 67 ، 293 & # 8211302. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
Waterman ، D. & # 38 Evans ، G. (2010). J. أبل. كريست. 43 ، 1356 & # 82111371. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google
Waterman، D.G، Winter، G.، Parkhurst، J.M، Fuentes-Montero، L.، Hattne، J.، Brewster، A.، Sauter، N.K & # 38 Evans، G. (2013). أخبار CCP4 بلورات البروتين. 49 ، 16 & # 821119. منحة جوجل
White ، T.A ، Kirian ، R.A ، Martin ، A.V ، Aquila ، A. ، Nass ، K. ، Barty ، A. & # 38 Chapman ، H.N (2012). J. أبل. كريست. 45 ، 335 & # 8211341. Web of Science CrossRef CAS IUCr المجلات الباحث العلمي من Google

هذا مقال مفتوح الوصول يتم توزيعه بموجب شروط ترخيص Creative Commons Attribution (CC-BY) ، والذي يسمح بالاستخدام والتوزيع والاستنساخ غير المقيد بأي وسيلة ، بشرط ذكر المؤلفين الأصليين والمصدر.


العنوان: تجارب إتاحة بيانات صورة الحيود: ما هي البيانات الوصفية التي نحتاجها لأرشفتها؟

تم توفير أرشيف `` صور بيانات الحيود '' الخام المحلي وتم استرداد بعض مجموعات البيانات وإعادة معالجتها ، مما أدى إلى تحليل كثافات الفرق الشاذة لذرتين من الكلور المشغولين جزئيًا في سيسبلاتين بالإضافة إلى إعادة تقييم الدقة المقطوعة في هذه البيانات الحيود. تمت مناقشة الأسئلة العامة حول تخزين البيانات الأولية. من الواضح أيضًا أنه غالبًا ما يحتاج المرء إلى معرفة مسبقة لا لبس فيها لقراءة تنسيق الكاشف (الثنائي) وإعداد هندسات مقياس الزوايا. في الآونة الأخيرة ، بدأ IUCr (الاتحاد الدولي لعلم البلورات) في تشكيل مجموعة عمل ترسيب بيانات الحيود بهدف تطوير معايير لتمثيل بيانات الحيود الخام المرتبطة بنشر الأوراق الهيكلية. تخدم أرشفة البيانات الأولية عدة أهداف: تحسين سجل العلوم ، والتحقق من إمكانية التكاثر ، والسماح بإجراء فحوصات تفصيلية للبيانات العلمية ، والحماية من الاحتيال ، والسماح بإعادة التحليل باستخدام التقنيات المحسّنة في المستقبل. من وسائل دراسة هذه المسألة تقديم منشورات نموذجية مع البيانات الأولية والبيانات الوصفية المرتبطة بها. في دراسة حديثة لربط السيسبلاتين والكاربوبلاتين بالهيستيدين في بلورات الليزوزيم تحت عدة ظروف ، تمت مقارنة التأثيرات المحتملة للمعدات وبرامج معالجة بيانات حيود الأشعة السينية على المزيد من الإشغالات والعوامل B لمركبات Pt المرتبطة. في البداية ، تم نقل 35.3 جيجا بايت من البيانات من مانشستر إلى أوترخت لتتم معالجتها باستخدام EVAL. تم نشر وصف ومناقشة تفصيليين لتوافر البيانات الوصفية في ورقة تم ربطها بأرشيف بيانات خام محلي في جامعة أوتريخت وعكس أيضًا في أرشيف بيانات حيود TARDIS الخام في أستراليا. من خلال إتاحة مجموعات بيانات الحيود الأولية هذه مع المقالة ، يمكن لمجتمع الحيود إجراء تقييمهم الخاص. أدى ذلك إلى قيام أحد مؤلفي XDS (K. Diederichs) بإعادة دمج البيانات من البلورات التي من المفترض أنها تحتوي فقط على الكربوبلاتين المرتبط ، مما أدى إلى تحليل كثافة إلكترون شاذة للكلور المشغولة جزئيًا بالقرب من مواقع ربط Pt واستخدام عدة معايير لتقييم حد دقة الانعراج بدقة أكبر. تتم مناقشة الحجج العامة لأرشفة البيانات الخام وإمكانيات القيام بذلك ومتطلبات الموارد. تمت مناقشة المشكلات المرتبطة بإعداد تجريبي غير معروف جزئيًا ، ويفضل أن يكون متاحًا كبيانات وصفية. يتم تلخيص الأفكار الحالية حول ضغط البيانات ، والذي يمكن أن يكون حلاً خاصةً لمجموعات بيانات جهاز البكسل مع التقطيع الدقيق الذي قد يقدم بطريقة أخرى كمية غير قابلة للإدارة من البيانات. وقوو أقل


قاعدة بيانات عامة لتجارب الحيود الجزيئي

جذبت إمكانية استنساخ النتائج التجريبية المنشورة الانتباه مؤخرًا في العديد من المجالات العلمية المختلفة. يمثل عدم توفر البيانات العلمية الأولية الأصلية عاملاً رئيسياً يساهم في مشاكل التكاثر ، ومع ذلك ، فقد اتخذ مجتمع البيولوجيا الهيكلية خطوات مهمة نحو إتاحة البيانات التجريبية.

قاد علم البلورات بالأشعة السينية الجزيئية الطريق في طلب النشر العام للإحداثيات الذرية ومجموعة كبيرة من البيانات التجريبية عبر بنك بيانات البروتين (PDB) والمشاريع المماثلة ، مما يجعل هذا المجال واحدًا من أكثر المجالات قابلية للتكاثر في العلوم البيولوجية.

كلف IUCr مجموعة عمل ترسيب بيانات الحيود (DDDWG) في عام 2011 لفحص فوائد وجدوى أرشفة صور الحيود الخام في علم البلورات. قدم تقرير DDDWG كل ثلاث سنوات 2011-2014 العديد من التوصيات الرئيسية المتعلقة بالحفاظ على بيانات الانعراج الخام. ومع ذلك ، لا يزال هناك أي تفويض للإفصاح العام عن بيانات الحيود الأصلية.

يعد المورد المتكامل لإمكانية التكاثر في علم البلورات الجزيئي (IRRMC) جزءًا من برنامج البيانات الضخمة إلى المعرفة التابع للمعاهد الوطنية للصحة وقد تم تطويره لأرشفة البيانات الأولية من تجارب الانعراج ، والأهم من ذلك ، توفير البيانات الوصفية ذات الصلة. قاعدة البيانات [Grabowski et al. (2016). اكتا كريست. D72، 1181-1193، doi: 10.1107 / S2059798316014716] ، يحتوي في وقت كتابة هذا التقرير على 3070 تجربة حيود جزيئي كبير (5983 مجموعة بيانات) والبيانات الوصفية المقابلة المنسقة جزئيًا ، والتي تمثل حوالي 3 ٪ من جميع الترسبات في بنك بيانات البروتين. المورد متاح على http: // www. انحراف البروتين. org ويمكن البحث عنها باستخدام معايير مختلفة عبر واجهة بسيطة ومبسطة. جميع البيانات متاحة للوصول غير المقيد والتنزيل. يعمل المورد كدليل على المفهوم ويوضح جدوى أرشفة بيانات الحيود الخام والبيانات الوصفية المرتبطة بها من الدراسات البلورية للأشعة السينية للجزيئات البيولوجية.

في حديثه مع مراسل حول المشروع ، قال قائد الفريق ولاديك مينور ، "هناك الكثير من الأبحاث الجارية بحيث لا يمكن نشرها كلها ، وغالبًا لا تظهر نتائج الدراسات غير الناجحة في الأدبيات. أعتقد أن مفتاح النجاح هو معرفة التجارب غير الناجحة ، ونريد أن نعرف سبب فشلها ".

الهدف من المشروع هو توسيع IRRMC وتضمين مجموعات البيانات التي فشلت في إنتاج هياكل الأشعة السينية. يمكن أن يسهل هذا الجهود التعاونية لتحسين طرق تحديد بنية البروتين وأيضًا ضمان توفر البيانات "اليتيمة" التي خلفها المحققون الأفراد و / أو مشاريع الجينوميات الهيكلية المنقرضة.

تنصل: AAAS و EurekAlert! ليست مسؤولة عن دقة النشرات الإخبارية المرسلة على EurekAlert! من خلال المؤسسات المساهمة أو لاستخدام أي معلومات من خلال نظام EurekAlert.


هل تتوفر بيانات حيود الأشعة السينية الأصلية - علم الأحياء

أ علوم الحياة ، مصدر ضوء الماس ، حرم هارويل للعلوم والابتكار ، ديدكوت ، أوكسفوردشاير OX11 0DE ، المملكة المتحدة ، و ب قسم البيولوجيا الهيكلية ، جامعة أكسفورد ، مركز ويلكوم للوراثة البشرية ، أكسفورد ، أوكسفوردشاير OX3 7BN ، المملكة المتحدة
* البريد الإلكتروني للمراسلات: [email protected]، [email protected]

أصبح تطوير طرق لتحديد الهياكل عالية الدقة من بلورات البروتين الميكرومترية أو حتى دون الميكرومتر مهمًا بشكل متزايد في السنوات الأخيرة. ينطبق هذا على كل من المجمعات البروتينية الكبيرة والبروتينات الغشائية ، حيث يكون إنتاج البروتين والنمو اللاحق للبلورات المتجانسة الكبيرة أمرًا صعبًا في كثير من الأحيان ، وعلى العينات التي تنتج فقط البلورات الدقيقة أو النانوية مثل بروتينات الأميلويد أو البروتينات متعددة الهيدرين الفيروسية. يتخصص خط الأشعة متعدد الاستخدامات في مجال التصوير البلوري الجزيئي (VMXm) في Diamond Light Source في قياسات حيود الأشعة السينية من البلورات الدقيقة والنانوية. نظرًا لإمكانية قياس البيانات من العينات البلورية التي تقترب من حد الدقة للفحص المجهري للضوء المرئي ، فإن تصميم خط الأشعة يتضمن مجهرًا إلكترونيًا مسحًا (SEM) لتصور البلورات وتحديد موقعها وتوسيطها بدقة لتجارب حيود الأشعة السينية. للتأكد من أن الفحص المجهري الإلكتروني هو طريقة مناسبة لتصور العينة ، تم إجراء اختبارات لتقييم تأثير إشعاع SEM على جودة الانعراج. تعرضت بلورات بروتين البولي هيدرين لفيروس تعدد التعرق السيتوبلازمي المبرد على شبكات المجهر الإلكتروني لإشعاع SEM قبل جمع بيانات حيود الأشعة السينية. بعد معالجة البيانات بامتداد الاتصال ، لم يتم العثور على فرق ذي دلالة إحصائية في جودة البيانات بين مجموعات البيانات التي تم جمعها من البلورات المعرضة وغير المعرضة لإشعاع SEM. تدعم هذه الدراسة استخدام SEM كأداة لتصور بلورات البروتين وكأداة تصور متكاملة على خط إشعاع VMXm.

1 المقدمة

في العقد الماضي ، سهلت خطوط الأشعة السينية ذات التركيز الدقيق الدقيق التقدم في علم الأحياء البنيوي من خلال توفير حزم صغيرة مكثفة بشكل متزايد من الأشعة السينية. تعتبر الأحجام البلورية التي تتراوح من عشرات الميكرومترات إلى بضعة ميكرومترات الآن بشكل عام أهدافًا يمكن الوصول إليها ، وإن كانت تمثل تحديًا ، أهدافًا لمشاريع البيولوجيا الهيكلية للبروتين. وقد دفعت مناهج ليزر الإلكترون الحر بالأشعة السينية (XFEL) في علم البلورات التسلسلي فيمتو ثانية هذا الحد أيضًا ، باستخدام عشرات الآلاف من البلورات الدقيقة [للمراجعة ، انظر Martin-Garcia وآخرون. (2016)] وحتى البلورات النانوية (Gati وآخرون. ، 2017) لتحديد هياكل البروتين عالية الدقة. ومع ذلك ، فإن التقنيات القائمة على XFEL تواجه تحدياتها بما في ذلك العدد الكبير من البلورات المطلوبة ، وعدم القدرة على جمع بيانات الدوران ، وكذلك التكلفة والتوافر المحدود لوقت شعاع XFEL. تتطور أيضًا طرق علم البلورات التسلسلي السنكروتروني ، ولكنها تتطلب في كثير من الأحيان أعدادًا كبيرة من البلورات (إبراهيم). وآخرون. ، 2019 Diederichs & # 38 Wang ، 2017). حيود الإلكترون هو تقنية متنامية أخرى لتحديد البنية من بلورات البروتين التي يبلغ حجمها بضع مئات من النانومترات (شي وآخرون. ، 2013 نانينجا وآخرون. ، 2014 يونيكورا وآخرون. ، 2015 كلابرس وآخرون. ، 2017 شو وآخرون. ، 2018) ، مع حد أعلى لسماكة العينة & # 8764400 & # 8211500 & # 8197nm (شي وآخرون. ، 2013). يعد طحن الشعاع الأيوني المركّز بطريقة للتحايل على حد السماكة هذا عن طريق طمس عينة الكريستال الزائدة بشكل انتقائي لإعطاء صفيحة رقيقة (& # 8764200 & # 8197 نانومتر) يمكن من خلالها جمع البيانات (Duyvesteyn) وآخرون. ، 2018 Martynowycz وآخرون. ، 2019). ومع ذلك ، فإن مجاهر cryoEM المجهزة بكواشف وبرامج مخصصة لدراسات حيود الإلكترون منخفضة الجرعة من البروتين نادرة بشكل معقول.

يهدف خط الأشعة متعدد الاستخدامات لعلم البلورات الجزيئي (VMXm) في Diamond Light Source ، وهو جزء من مجموعة شعاع VMX ، إلى زيادة نطاق أحجام البلورات المتاحة لعلم البلورات بالأشعة السينية المستندة إلى السنكروترون. تم تصميم VMXm لتمكين جمع مجموعات بيانات الدوران من البلورات التي يقل حجمها عن 0.5 & # 8197 & # 181 م في الحجم ، وبالتالي تقليل مادة العينة المطلوبة لتحديد بنية البروتين ، مقارنة بالطرق التسلسلية ، من خلال تحسين جودة البيانات المسجلة من كل فرد كريستال. بالإضافة إلى ذلك ، قد تواجه البلورات التي يبلغ قياسها عدة ميكرومتر أو أقل معدلًا منخفضًا من الضرر الإشعاعي أثناء تجارب حيود الأشعة السينية من خلال تسخير تأثيرات هروب الإلكترونات الضوئية المحتملة (Nave & # 38 Hill ، 2005). اقترحت مناقشة من Holton & # 38 Frankel (2010) أنه من الممكن ، في ظل ظروف مثالية ، تحديد بنية دقة 2.0 & # 8197 & # 197 من بلورة كروية واحدة من بروتين الليزوزيم بقطر & # 87641.2 & # 8197 & # 181 م. تجاهلت هذه المحاكاة جميع المساهمات في التشتت الخلفي الناتج عن المذيبات ذات الترتيب المتقطع داخل البلورة. يهدف VMXm إلى سد الفجوة بين النظرية وما هو ممكن حاليًا في علم البلورات الجزيئي باستخدام الأشعة السينية السنكروترونية. حتى الآن ووفقًا لمعرفتنا ، تم الإبلاغ عن أصغر بلورات تم قياسها باستخدام طريقة الدوران عند السنكروترون لإنتاج بنية بواسطة Ginn وآخرون. (2015) ، حيث تم تسجيل بيانات الحيود من بلورات بحجم 768 & # 87641.0 & # 8197 & # 181 م 3 في Diamond beamline I24 ، وتم تحليلها ودمجها لإنتاج مجموعة بيانات كاملة بدقة 2.2 & # 8197 & # 197.

ستوفر بصريات خط الشعاع VMXm حجم حزمة أشعة سينية عمودية متغيرة مركزة تبلغ 0.3 & # 821110 & # 8197 & # 181 م باستخدام مرآة واحدة ذات طول بؤري ثابت مخصصة (Laundy وآخرون. ، 2016). يجب تحقيق أحجام الشعاع الأفقي 0.5 & # 82115 & # 8197 & # 181 م باستخدام مخطط إزالة التكبير على مرحلتين وفتحة مصدر ثانوي متغير. يسمح أحادية اللون أحادية البلورة المنحرفة أفقياً بطاقات تتراوح بين 6 و 28 & # 8197 كيلو فولت ، واعتمادًا على التكوين البصري ، ستوفر ما بين 10 11 و 10 12 & # 8197 فوتونات & # 8197s & # 87221 إلى العينة عند التشغيل عند 12 & # 8197keV. عادةً ما يتم تحضير عينات لـ VMXm على شبكات المجهر الإلكتروني باستخدام تقنيات مستعارة من cryoEM. لزيادة تحسين الإشارة إلى ضوضاء الأشعة السينية المنعرجة ، سيتم الاحتفاظ ببيئة العينة تحت فراغ & # 876410 & # 87226 & # 8197mbar. اعتبارًا من يناير 2020 ، تم الانتهاء من البناء الرئيسي لخط الأشعة ، مع استمرار تشغيل مكوناته.

يفرض جمع بيانات الدوران ، على عكس الصور الثابتة الفردية ، من بلورات البروتين التي يقل قياسها عن ميكرومتر ، العديد من التحديات العملية التي تتجاوز حدود الأضرار الإشعاعية الواضحة ، على وجه الخصوص ، تحديد موقع بلورات بهذا الحجم وتوسيطها في حزمة الأشعة السينية. لتمكين جمع بيانات الدوران من البلورات في نطاق الحجم هذا ، يهدف VMXm إلى إنتاج كل من موضع الشعاع وموضع العينة ، مستقرًا في حدود 50 & # 8197 نانومتر. تفرض مواصفات التصميم هذه دقة عالية ودقة في التصوير لموضع العينة لضمان تطابق الحزمة والعينة. لذلك ، لمحاذاة وتصور البلورات الدقيقة والنانوية ، والتي يمكن أن تكون أقل من قوة التحليل لمجهر الضوء الضوئي ، تم دمج المجهر الإلكتروني الماسح (SEM) في بيئة عينة محطة نهاية VMXm. على الرغم من استكشاف طرق أخرى لتصور بلورات البروتين وتمركزها في مكان آخر (للمراجعة ، انظر Becker وآخرون. ، 2017) ، جودة الحل الفائقة لـ SEM واستقلالية جودة صورة SEM عن مجموعة الفضاء البلورية ، والتشكل ، والتوجيه وتسلسل البروتين ، شكلت أساس قرار التصميم هذا. ومع ذلك ، فإن أحد الاعتبارات في استخدام SEM بهذه الطريقة هو احتمال تلف العينات الناتج عن تفاعلات الإلكترون. في تحليل بواسطة Hattne وآخرون. (2018) ، الأضرار الإشعاعية العالمية والمحددة بالموقع الناتجة عن استخدام شعاع الإلكترون 200 & # 8197keV تشير إلى أن جرعة إلكترونية عابرة من & # 87643 & # 8197e & # 8722 & # 8197 & # 197 & # 87222 أدت إلى الخسارة للمعلومات عالية الدقة (مصنفة على أنها انعكاسات للدقة 3 & # 8197 & # 197 وما فوق). يتماشى هذا مع التحليلات السابقة التي قيمت الضرر الإشعاعي الناجم عن الإلكترون لبلورات البروتين (Chiu ، 2006 Henderson ، 1995).

تستخدم تطبيقات CryoSEM للعينات البيولوجية غير المطلية طاقات إثارة ذات أوامر من حيث الحجم أقل من تلك الموجودة في طرق المجهر الإلكتروني للإرسال (TEM) التي وصفها Hattne وآخرون. (2018). بدلاً من الحاجة إلى اختراق الحجم البلوري بأكمله كما هو الحال في التجارب المستندة إلى TEM ، يحتاج شعاع SEM فقط إلى التفاعل مع الطبقة السطحية للبلورة من أجل تكوين الصورة. على الرغم من وجود القليل من البيانات المنشورة لأحجام تفاعل SEM لبلورات البروتين عند استخدام طاقات منخفضة (& # 605 & # 8197keV) للإلكترونات ، فإن تقدير Kanaya & # 8211Okayama لنصف الكرة التفاعلية للكربون غير المتبلور النقي هو & # 8764110 & # 8197nm عند 2 & # 8197keV (Kanaya & # 38 Okayama ، 1972). محاكاة مونت كارلو التي قام بها بارنيت وآخرون. تشير إلى أن عمق اختراق الإلكترونات 2 & # 8197keV في جليد الماء هو & # 8764150 & # 8197nm ، على الرغم من أن التجارب الإضافية التي أجرتها نفس المجموعة تشير إلى أن هذه المحاكاة ربما تقلل من هذا العمق (بارنيت وآخرون. ، 2012). أخيرًا ، قدمت محاكاة تفاعل الإلكترونات 2 & # 8197keV مع الكيتين المطلي بالجرافين أقصى عمق اختراق يبلغ 140 & # 8197nm (Park وآخرون. ، 2016). بالنظر إلى هذه البيانات ، من المرجح أن يكون عمق تفاعل إلكترون 2 & # 8197keV داخل بلورة بروتينية من 100 إلى 200 & # 8197 نانومتر.

في هذه الدراسة ، بلورات البروتين متعدد الوجوه من ديسبار ليمانتريا تم تصوير فيروس تعدد التعرق السيتوبلازمي (CPV14) باستخدام SEM غير متصل بالإنترنت ، حيث سيتم دمج العمود مباشرة في محطة نهاية VMXm لتمكين التصور المستقبلي وتمركز بلورات البروتين. تم جمع بيانات حيود الأشعة السينية لاحقًا من هذه البلورات المصوّرة بواسطة SEM. كان الهدف هو تحديد ما إذا كان جمع صور SEM ضارًا بجودة الحيود لبلورات CPV14. تم تنفيذ ذلك من خلال تقييم ما إذا كان هناك فرق كبير يمكن ملاحظته بين بيانات الانعراج المقاسة من عينات الكريستال المعرضة للإلكترونات مقابل تلك التي لم تكن كذلك. لقد أثبتنا أن التصوير بجرعة منخفضة من SEM هو طريقة قابلة للتطبيق لتحديد موقع بلورات البروتين بدقة ومواءمتها دون التأثير على جودة الانعراج قبل جمع بيانات الأشعة السينية.

2. المواد والأساليب

2.1. محاكاة مونت كارلو

البرنامج كازينو (هوفينجتون وآخرون. ، 1997 دروين وآخرون. ، 2007) لمحاكاة المسار وعمق الاختراق للإلكترونات 2 & # 8197keV في بلورة البروتين. تمت محاكاة ما مجموعه 200 & # 8197 إلكترونًا على شكل شعاع 10 & # 8197nm. تم وصف عينة الكريستال البروتينية بسمك 1000 & # 8197 نانومتر بالصيغة C. 1284 ح 2695 ن 351 ا 748 س 12 وكثافة 1.35 & # 8197g & # 8197cm & # 87223. يحاكي هذا القياس المتكافئ التركيب الكيميائي لبلورات CPV14 مع 22٪ محتوى مذيب [PDB ID 5a96 (Ji وآخرون. , 2015 )].

2.2. تحضير البروتين وتبلوره

تم التعبير عن متعدد الوجوه CPV14 وتنقيته كما هو موضح سابقًا (Hill وآخرون. ، 1999 Anduleit وآخرون. ، 2005 جي وآخرون. ، 2015). تم قياس بلورات CPV14 المكعبة المنقاة 2 & # 82114 & # 8197 & # 181 م في كل بُعد وتم تخزينها كملاط في H 2 يا في 4 & # 176 درجة مئوية.

2.3 تركيب العينة

تم تخفيف الملاط البلوري CPV14 بنسبة 1 من 12 في محلول من ethyl & # 173ene glycol لإعطاء تركيز نهائي من ethyl & # 173ene glycol بنسبة 50٪ ( الخامس / الخامس ). تمت إضافة Ethyl & # 173ene glycol للسماح بالتحكم الدقيق في عملية النشاف اللاحقة ولضمان الحماية من البلورات بالتبريد.

تم تبريد البلورات بالتبريد على شبكات المجهر الإلكتروني استعدادًا لمزيد من التحليل. تم تفريغ شبكات شبكة Cu 200 المغلفة بغشاء كربون Quantifoil R 2/2 (Quantifoil) أو شبكات البحث عن H7 Cu 400 mesh بالكربون المخرم (AgarScientific) قبل تطبيق العينة. قسامة 2 & # 8197 & # 181l 50٪ ( الخامس / الخامس ) تم تطبيق ethyl & # 173ene glycol على جانب Cu من الشبكة ، متبوعًا بتطبيق 2 & # 8197 & # 181l من الملاط البلوري المخفف على فيلم الكربون. تم مسح الشبكة بعد ذلك لـ 3.0 & # 82115.5 & # 8197s من جانب النحاس من الشبكة باستخدام Leica EM GP (20 & # 176C ، الرطوبة 90 ٪). تم بعد ذلك غمر الشبكات المنشفة مجمدة في الإيثان السائل. تم تخزين الشبكات تحت سائل nitro & # 173gen لحين الحاجة.

2.4 علاج العينة

تم تقسيم العينات إلى أربع مجموعات معالجة: غير مُعالجة ، ومحمل SEM ، و SEM غير مكشوف ، و SEM مكشوف ، والتي تم وصف تفاصيلها في القسمين 2.4.1 & # 82112.4.3. تم إجراء اختبارات لتقييم الضرر الإشعاعي نتيجة التعرض لشعاع الإلكترون باستخدام JEOL JSM-IT100 SEM المجهز بنظام Quorum PP3000T للتجميد والنقل بالتبريد. تم تبريد جهاز التجميد PP3000T ومرحلة التحضير (مرحلة ما قبل المرحلة) ومضاد الملوثات إلى & # 8722180 & # 176C ، & # 8722180 & # 176C و & # 8722190 & # 176C ، على التوالي. تم استخدام مكوك زايس النحاسي المطلي بالذهب لمسح TEM لحمل العينات أثناء هذه التجارب.

2.4.1. غير معالج

تم تجميد العينات غير المعالجة في الإيثان السائل وتخزينها في سائل نيترو & # 173gen كما هو مفصل في القسم 2.3.

2.4.2. تحميل SEM

تم نقل العينات المحملة SEM بشكل إضافي إلى SEM باستخدام نظام النقل بالتبريد. تم تحميل العينات المجمدة الغاطسة في المكوك تحت سائل نيترو & # 173 جين. تم استخدام نظام النقل بالتبريد لنقل العينات إلى غرفة التحضير المبردة في SEM. تم وضع المكوك في المرحلة التمهيدية لمدة 30 & # 8197 ثانية قبل الانتقال إلى مرحلة SEM لمدة 2 & # 8197 دقيقة. ثم تم سحب المكوك مرة أخرى إلى مرحلة ما قبل المرحلة لمدة 30 & # 8197 ثانية قبل نقله من الفراغ إلى سائل النيترو & # 173gen باستخدام نظام النقل بالتبريد. تمت إزالة العينة بعد ذلك من المكوك وتخزينها تحت سائل nitro & # 173gen.

2.4.3. SEM غير مكشوف و SEM مكشوف

كانت البلورات الخاصة بتجارب حيود الأشعة السينية المعرضة لـ SEM وغير المعرضة لـ SEM كلها على نفس الشبكة للتحكم في تباين العينة بين الشبكات بسبب معالجة الشبكة. تمت معالجة هذه الشبكات بنفس طريقة العينات المحملة عبر SEM (انظر القسم 2.4.2) ومع ذلك ، بدلاً من الحضانة 2 & # 8197min في مرحلة SEM ، تم الاحتفاظ بالشبكات في هذه المرحلة لـ & # 87641.5 & # 8197h أثناء SEM تم إجراء عمليات التعرض. تم تصوير البلورات المعرضة لـ SEM بجهد متسارع يبلغ 2 & # 8197kV ، تيار مسبار يبلغ 40 (وحدات عشوائية) ومسافة عمل تبلغ 10 & # 8197 مم. للمساعدة في التنقل حول الشبكة وتقييم جودة الشبكة ، تم التقاط صورة عالمية للشبكة بتكبير 30 & # 215 باستخدام وقت اكتساب 0.5 & # 8197 ثانية (إجمالي الجرعة ، 4.6 & # 215 10 & # 87228 & # 8197e & # 8722 & # 8197 & # 197 & # 87222). ثم تم استخدام مربع شبكة واحد لتحسين التركيز والاستجماتيزم. كانت المعلمات المثلى هي تلك التي قدمت أوضح صورة وفقًا للحكم بالعين. تم تحسين تباين الصورة وسطوعها باستخدام ميزة التباين التلقائي والسطوع في InTouchScope حزمة البرامج (JEOL). تم التقاط صور لمربعات الشبكة الفردية التي تحتوي على بلورات عند تكبير 1900 & # 215 باستخدام وقت اكتساب 20 & # 8197 ثانية (7.6 & # 215 10 & # 87223 & # 8197e & # 8722 & # 8197 & # 197 & # 87222). تم تصوير ما بين 50 و 75 مربعًا شبكيًا مع هذه الظروف ، شكلت البلورات في هذه الصور السكان المعرضين لـ SEM. بقي ما تبقى من الشبكة دون تعريض للإلكترونات. شكلت البلورات في هذه المناطق السكان غير المعرضين ل SEM. يمكن العثور على وصف لحسابات جرعة الإلكترون لهذه الصور في المعلومات الداعمة.

2.5 جمع بيانات الأشعة السينية

تم تركيب شبكات المجهر الإلكتروني على مقياس الزوايا الخطي باستخدام دبوس عينة مصنوع خصيصًا. شكل الدبوس مشبكًا للأوعية الدموية (المنتج 14120 ، أدوات الدقة العالمية) على قاعدة دبوس مغناطيسية قياسية مثبتة في مكانها باستخدام لاصق 3M Scotch-Weld Ep & # 173oxy Adhesive 1838 [انظر الأشكال. & # 8197S1 ( أ ) & # 8211S1 ( ج ) في المعلومات الداعمة]. تم نقل الشبكات إلى الدبوس تحت سائل nitro & # 173gen ثم تغطيتها [Figs. S1 ( د ) & # 8211S1 ( F )]. تم تثبيت الدبوس المغطى على مقياس الزوايا باليد وتم إزالة الغطاء بسرعة بحيث تم تعريض الشبكة بسرعة لتيار التبريد قبل أن يتم تصريف السائل nitro & # 173 gen من الغطاء.

تم قياس البيانات في خطوط أشعة Diamond Light Source I24 و I04. في جميع الحالات ، تم جمع البيانات على شكل أسافين 5 & # 176 من البيانات المتجاورة بعرض تذبذب يبلغ 0.1 & # 176 ووقت تعرض يبلغ 0.05 & # 8197 ثانية. تم جمع البيانات من I24 على كاشف Dectris PILATUS3 6M باستخدام حجم شعاع الأشعة السينية 6 & # 215 9 & # 8197 & # 181 م [العرض الكامل بنصف الحد الأقصى (FWHM)] عند نقل 100٪ وطول موجي 0.9686 & # 8197 & # 197 ، إنتاج تدفق 3.0 & # 215 10 12 & # 8197 فوتونات & # 8197s & # 87221. تم تسجيل البيانات من I04 باستخدام كاشف Dectris PILATUS 6M-F بحجم شعاع يبلغ 11 & # 215 5 & # 8197 & # 181 م (FWHM) عند نقل 100 ٪ وطول موجي 0.9795 & # 8197 & # 197 ، مما ينتج عنه تدفق 2.8 & # 215 10 11 & # 8197 فوتونات & # 8197s & # 87221. لكل من الشروط الأربعة ، تم جمع البيانات من ثلاث شبكات معدة بشكل مستقل على الأقل. تم تحليل ما لا يقل عن 100 بلورة لكل حالة على كل شبكة. بالنسبة للبلورات المعرضة لـ SEM ، تم استخدام صور المجهر الإلكتروني بالاقتران مع مناظر المجهر الضوئي لموضع عينة خط الأشعة السينية لتحديد البلورات التي تعرضت للإلكترونات.

2.6. معالجة البيانات وتحليلها

من أجل تقييم الاختلافات المحتملة في جودة الحيود ، تمت معالجة البيانات باستخدام الاتصال (شتاء وآخرون. ، 2018) ثم تحليلها باستخدام يمزج (فوادي وآخرون. ، 2013). وضع التوليف يمزج ثم تم استخدامه لقياس ودمج البيانات التي تم جمعها من كل معاملة من شبكة واحدة.

من أجل البحث عن الاختلافات في جودة الحيود الأولية بين العلاجات المعرضة لـ SEM والمعالجات غير المكشوفة ، تم جمع جميع مجموعات البيانات من نفس خط الحزمة التي تم دمجها بنجاح باستخدام الاتصال تم تحجيمها معًا باستخدام الطلب . البرنامج الاتصال الهاتفي تم استخدامه لضمان الفهرسة المتسقة قبل التوسع (Gildea & # 38 Winter ، 2018). عامل القياس والنسبية ب تم بعد ذلك استخراج عامل الصورة الأولى لكل مجموعة بيانات باستخدام الاتصال الهاتفي لتنفيذ أ بايثون تم تطوير البرنامج النصي داخليًا.

أنتجت ثلاث شبكات مكررة ثلاث مجموعات بيانات كاملة مدمجة ومقاسة لكل مجموعات العلاج الأربع. تمت مقارنة القيم المتوسطة للإحصاءات البلورية الرئيسية عبر هذه التكرارات الثلاثة باستخدام طريقة تحليل التباين أحادي الاتجاه (ANOVA). تمت أيضًا مقارنة القيم المتوسطة للإحصاءات الرئيسية للعلاجات المعرضة لـ SEM و SEM غير المعرضة مع بعضها البعض باستخدام اختبارات الطالب. توزيعات المقياس والنسبية ب تمت مقارنة عوامل الصور الأولية من كل مجموعة بيانات لكل مجموعة من مجموعات العلاج باستخدام اختبارات Kolmogorov & # 8211Smirnov (KS). تم إجراء هذه التحليلات الإحصائية باستخدام GraphPad نشور زجاجي 8.0 (برنامج GraphPad ، لا جولا ، كاليفورنيا ، الولايات المتحدة الأمريكية).

3. النتائج والمناقشة

3.1. محاكاة مونت كارلو

كان متوسط ​​عمق الاختراق لإلكترونات 2 & # 8197keV في بلورة CPV14 المحاكاة 70.0 & # 177 19.8 & # 8197 نانومتر وكان أقصى عمق اختراق 109.8 & # 8197 نانومتر (الشكل S2). ومع ذلك ، تجدر الإشارة إلى أن التجارب التي أجراها بارنيت وآخرون. (2012) & # 8211 التي قيمت عمق اختراق الإلكترون داخل بلورات جليد الماء غير المتبلورة & # 8211 تشير إلى ذلك كازينو قد تقلل عمليات المحاكاة من عمق اختراق الإلكترونات عند هذه الفولتية المتسارعة المنخفضة. ومع ذلك ، توفر هذه المحاكاة تقديرًا لحجم التفاعل الإلكتروني لبلورات البروتين CPV14. على هذا الأساس ، بالنسبة لبلورة 2 & # 8197 & # 181m CPV14 (8 & # 8197 & # 181m 3) ، فإن الإلكترونات 2 & # 8197keV الممسوحة ضوئيًا عبر سطح البلورة بالكامل لديها القدرة على الاختراق ، في المتوسط ​​، & # 87643.5 ٪ من الإجمالي حجم الحيود. بالنسبة إلى بلورة 0.5 & # 8197 & # 181 م (0.125 & # 8197 & # 181 م 3) ، يزيد هذا إلى & # 876414٪ من إجمالي حجم الانعراج. ومع ذلك ، لا يقدم هذا التحليل معلومات عن تأثير الإلكترونات على جودة الحيود.

3.2 تحضير العينة والتعرض SEM

يوفر غمر بلورات CPV14 في الإيثان السائل باستخدام Leica EM GP طريقة قابلة للتكرار يمكن من خلالها تركيب البلورات على شبكات cryoEM. نتج عن التشكل المكعب للبلورات اتجاه تفضيلي للبلورات على الشبكات. توضع البلورات عمومًا ووجوهها موازية لفيلم الكربون على الشبكات ، ونادرًا ما تجلس البلورات على حافة أو قمة. على الرغم من عدم استكشافها هنا ، إلا أن الأساليب التي صممها Wennmacher وآخرون. (2019) نجح في مكافحة التوجه التفضيلي للبلورات على شبكات المجهر الإلكتروني. من المحتمل أن تكون هذه الطرق ذات فائدة خاصة في الحالات المستقبلية التي تتضمن بلورات من مجموعات فضاء منخفضة التماثل والتي تظهر توجهًا تفضيليًا. كانت هناك حاجة إلى معالجة يدوية كبيرة لنقل الشبكات المجمدة الغاطسة داخل وخارج SEM وبعد ذلك إلى خط حزمة الأشعة السينية مع الحفاظ على العينات في درجات الحرارة الباردة. قد يكون الجمع بين المعالجة الميكانيكية ونقل شبكات العينات داخل وخارج فراغ 1 & # 215 10 & # 87226 & # 8197mbar قد تسبب في تباين في معالجات العينة ويمكن أن يفسر الاختلافات في خصائص الكريستال بخلاف تلك التي تسببها الحزمة الإلكترونية مكشوف. من أجل التحكم في هذا الاختلاف من الشبكة إلى الشبكة في خصائص البلورات & # 8211 والتي يمكن أن تحجب تأثيرات التعرض لشعاع الإلكترون & # 8211 ، تم أخذ بيانات البلورات المكشوفة و SEM غير المكشوفة من شبكة واحدة . بالنسبة لهذه العينات ، تعرض جزء من الشبكة للإلكترونات ، حيث تشكل البلورات الموجودة في هذا القسم مجموعة البلورات المعرضة لـ SEM. لم يتعرض ما تبقى من الشبكة للإلكترونات والبلورات في هذا القسم لتكوين مجتمع SEM غير المكشوف.

3.3 جمع البيانات

يتم عرض صورة مثال SEM لبلورات CPV14 في الشكل 1 ( أ ). تشكل البلورات في هذه الصورة جزءًا من مجموعة البلورات التي تعرضت للإلكترونات قبل جمع بيانات الأشعة السينية. من أجل جمع بيانات حيود الأشعة السينية من هذه البلورات المعرضة لـ SEM ، كان لابد من تحديد موقع كل بلورة وتحديدها على خط الأشعة السينية باستخدام المجهر الضوئي على المحور (OAV). تم تحقيق ذلك باستخدام شبكات المجهر الإلكتروني "المكتشف" (انظر القسم 2.3) بحيث يمكن التعرف بسهولة على كل مربع شبكة فردي وقابل للفهرسة تحت كل من مخططات التكبير SEM و OAV. رسم بياني 1 ( ب ) يصور صورة OAV المقابلة للبلورات الموضحة في صورة SEM. التحسن في الدقة عند استخدام SEM واضح. من الأسهل أيضًا تحديد محلول التبلور الزجاجي المحيط بالبلورات الفردية ومناطق محلول التبلور الزجاجي بالقرب من قضبان شبكة النحاس.


شكل 1
تم تصوير بلورات CPV14 باستخدام الإلكترونات ومجهر الضوء المرئي. ( أ ) مثال على صورة cryoSEM لبلورات CPV14 مأخوذة بجهد تسارع 2 & # 8197kV بمسافة عمل 10 & # 8197mm وجرعة إلكترون 7.6 & # 215 10 & # 87223 & # 8197e & # 8722 & # 8197 & # 197 & # 87222. شكلت البلورات في هذه الصورة جزءًا من مجموعة المعالجة المعرضة لـ SEM. أقصى دقة يمكن تحقيقها في ظل هذه الظروف باستخدام هذا المجهر هي & # 87648 & # 8197nm. ( ب ) تُظهر الصورة التي تم التقاطها باستخدام المجهر الضوئي OAV لخط الأشعة I24 مربع الشبكة المقابل لتلك الموضحة في اللوحة ( أ ). أقصى دقة يمكن تحقيقها باستخدام هذا المجهر الضوئي هي 0.7 & # 8197 & # 181 م. في اللوحة ( ب ) ، يشير التقاطع الأحمر إلى موضع شعاع التركيز الدقيق على I24 قبل جمع بيانات حيود الأشعة السينية من بلورة CPV14 واحدة. المنصب المعادل في اللوحة ( أ ) يُشار إليه بدائرة بيضاء متقطعة. في كلا اللوحتين ، يشير شريط المقياس إلى 10 & # 8197 & # 181 م.

للتغلب على الاتجاه التفضيلي للبلورات على الشبكات ، تم بذل جهود متضافرة لجمع البيانات باستخدام زوايا بدء مختلفة فيما يتعلق بتوجيه الشبكة للأوتاد 5 & # 176. حددت الشبكات زوايا الدوران التي يمكن من خلالها جمع البيانات. باستخدام الشبكة المتعامدة مع الحزمة ، يمكن جمع البيانات & # 8764 & # 17760 & # 176 من كل من "الأمام" و "الخلف" للشبكة ، مما يوفر نطاقًا إجماليًا يمكن الوصول إليه يبلغ & # 8764240 & # 176. على الرغم من هذا القيد ، كان لا يزال من الممكن الحصول على بيانات كاملة بسبب التماثل العالي لبلورات CPV14 (مجموعة الفضاء أنا 23).

3.4. معالجة البيانات وتحليلها

الاتصال تم استخدامه لمعالجة 5 & # 176 أسافين من البيانات. حيث يمكن دمج البيانات بنجاح ، تم إدخال ملفات .mtz الناتجة في يمزج . جميع المجموعات من وضع التحليل يمزج تم تحجيمها ودمجها قبل نقل مجموعة بيانات واحدة مع الاكتمال الأمثل للأمام من البلورات التي تم قياسها من كل شبكة لمزيد من التحليل. لكل مجموعة بيانات ، تم اختيار القطع عالي الدقة بناءً على CC 1/2 > 0.3 (Karplus & # 38 Diederichs ، 2015) ، والتي تتطلب أحيانًا تشغيلًا إضافيًا للبرنامج بلا هدف في حدود يمزج خط انابيب. يتم عرض نتائج خطوة معالجة البيانات هذه في الجدولين 1 و 2.

الجدول 1
إحصاءات معالجة البيانات

وترد قيم الغلاف الخارجي بين قوسين.

الجدول 2
إحصاءات معالجة البيانات

وترد قيم الغلاف الخارجي بين قوسين.

القيم الإجمالية لأقصى دقة ، ص ص. و CC 1/2 تم رسمها من أجل البيانات التي تم جمعها لجميع مجموعات العلاج الأربع (الشكل 2). تم جمع ثلاث مجموعات بيانات كاملة على الأقل لكل مجموعة من مجموعات العلاج. في حالة مجموعات البيانات المعرضة لـ SEM وغير المعرضة لـ SEM ، تم جمع مجموعات البيانات الكاملة لكلتا مجموعتي العلاج من كل شبكة من الشبكات المكررة الثلاث ، بمعنى آخر. مجموعة بيانات واحدة مكشوفة عبر SEM وواحدة غير معرّضة لـ SEM لكل شبكة ، مما يوفر إجمالي ست مجموعات بيانات. ثم تم حساب متوسط ​​القيمة لكل من الإحصائيات المذكورة أعلاه لتكرارات كل معالجة عينة. تمت مقارنة القيم المتوسطة لكل من هذه الإحصائيات عبر جميع مجموعات العلاج من خلال استخدام طريقة ANOVA أحادية الاتجاه. أظهرت هذه التحليلات عدم وجود فروق ذات دلالة إحصائية بين القيم المتوسطة للدقة القصوى ، ص ص. أو CC 1/2 عبر أي من مجموعات العلاج. تم استخدام اختبار t آخر للطالب لمقارنة القيم المتوسطة لهذه الإحصائيات بين مجموعات البيانات المعرضة لـ SEM و SEM غير المكشوفة. باستخدام طريقة التحليل هذه ، لم يكن هناك فرق ذو دلالة إحصائية ( ص & # 62 0.05) تم قياسها بين هذه الإحصائيات البلورية للبيانات التي تم جمعها من البلورات التي تعرضت مسبقًا لشعاع SEM 2 & # 8197keV (مكشوف SEM) مقابل البلورات التي لم تتعرض (SEM غير مكشوفة).


الشكل 2
مخططات إحصائيات معالجة البيانات الرئيسية لمجموعات البيانات المدمجة من مجموعات المعالجة الأربع: غير المعالجة (سماوي) ، تحميل SEM (أخضر) ، SEM غير مكشوف (أزرق) و SEM مكشوف (أحمر). قطع من ( أ ) الدقة القصوى ، ( ب ) ص ص. و ( ج ) نسخة 1/2 اعرض كل مجموعة بيانات كدائرة ملونة ويشير الخط الأسود إلى متوسط ​​القيمة. بالنسبة لعينات SEM غير المكشوفة والمعرضة لـ SEM ، تشير الأرقام الموجودة بجوار الدوائر إلى أي من الشبكات الثلاث تم جمع البيانات منها. تم جمع البيانات من الشبكتين 1 و 2 على I24 ، وتم جمع البيانات من الشبكة 3 على I04.

لمزيد من التحقيق في الضرر المحتمل للبلورات الناجم عن التعرض المسبق لإشعاع SEM ، تم تحجيم مجموعات البيانات المتكاملة 1151 التي تم جمعها على I24 معًا. تم تحقيق ذلك باستخدام الاتصال الهاتفي (Gildea & # 38 Winter، 2018) ، لضمان مخطط فهرسة متسق ، يتبعه الطلب . في محاولة لتقييم ما إذا كانت معالجات العينة قد غيرت بشكل كبير الانحراف الأولي للبلورات ، سواء كان عامل القياس أو عامل القياس ب تم استخراج عامل نمط الحيود الأولي من كل مجموعة بيانات من البيانات ، ويمكن رؤية هذه القيم على شكل رسوم بيانية لكل مجموعة معالجة في الشكل 3.


الشكل 3
رسوم بيانية توضح عوامل المقياس الأولية والنسبية ب عوامل مجموعات البيانات التي تم جمعها من البلورات عبر معالجات مختلفة. عوامل الحجم ( أ )–( د ) والنسبية ب عوامل ( ه )–( ح ) للإطار الأول لكل مجموعة بيانات تم جمعها من بلورات CPV14 الفردية بعد وظيفة تحجيم واحدة لجميع مجموعات البيانات البالغ عددها 1151 باستخدام الاتصال . ثم تم رسم هذه العوامل كمدرج تكراري ، حيث يحتوي كل مدرج تكراري على توزيع إما عامل المقياس الأولي أو ب عامل ضمن مجموعة علاجية معينة. كانت مجموعات العلاج: غير المعالجة [السماوي ، ( أ ) و ( ه )] ، تم تحميل SEM [أخضر ، ( ب ) و ( F )] ، SEM غير مكشوف [أزرق ، ( ج ) و ( ز )] و SEM مكشوف [أحمر ، ( د ) و ( ح )].

كشفت مقارنة هذه التوزيعات بين مجموعات العلاج عن طريق اختبار KS أن توزيعات كل من المقياس و ب لم يكن عامل علاجات SEM غير المعرضة والمعرضة لـ SEM مختلفًا بشكل كبير عن بعضها البعض (عوامل مقياس ص > 0.05 و د = 0.07175 و ب عوامل ص > 0.05 و د = 0.07613) (أين د هي مسافة KS). يستنتج هذا التحليل أن التعرض المسبق للبلورات لجرعة الإلكترون المستخدمة هنا لم يغير بشكل كبير جودة الانعراج لهذه البلورات. مزيد من اختبارات KS التي تقارن توزيعات المقياس الأولي و ب تم أيضًا تنفيذ عامل بين مجموعات العلاج الأخرى. كانت توزيعات عوامل القياس للعينات غير المعالجة مختلفة اختلافًا كبيرًا عن توزيعات كل من العينات المحملة بـ SEM والعينات غير المعرضة لـ SEM ( ص & # 60 0.0001 في كلا الاختبارين). تشير هذه النتائج إلى أن معالجة الشبكة المتضمنة في وضع الشبكات داخل وخارج الفراغ في درجات الحرارة المبردة لها تأثير على جودة الحيود للبلورات. علاوة على ذلك ، كانت توزيعات العينات المحملة في SEM مختلفة بشكل كبير عن توزيعات عينات SEM غير المكشوفة ( ص & # 60 0.0001 في جميع الاختبارات). يشير هذا إلى أن الوقت الإضافي الذي يقضيه في التجميد SEM في حالة العينات غير المعرضة لـ SEM له تأثير على جودة الانعراج للبلورات. قد يكون هذا مرتبطًا ببيئة التفريغ أو تبريد العينات أثناء وجودها في SEM ، أو مزيجًا من الاثنين. تم إجراء تحليل لدرجة حرارة مكوك SEM (لم تظهر البيانات) مما يشير إلى أن المكوك يظل أقل من درجة حرارة إزالة التزجيج أثناء النقل وأثناء مرحلة SEM ومع ذلك ، لم يكن من الممكن إجراء قياسات لقياس درجة حرارة الشبكة نفسها أثناء النقل. بالنظر إلى أن الشبكة تعتمد على التلامس الحراري مع المكوك للتبريد الفعال ، فلا يمكن استبعاد أن الاتصال الحراري غير الفعال وبالتالي التبريد غير الكافي ساهم في هذه الاختلافات المهمة. تسلط هذه الدراسة الضوء على أهمية التوصيف التفصيلي لسير عمل المناولة المبردة عند التعامل مع العينات البيولوجية الحساسة.

من المهم ملاحظة أن CPV14 عبارة عن عينة مشتتة جيدًا وأن البلورات الأخرى ، مثل تلك التي تتكون من بروتينات غشاء ذات وزن جزيئي كبير ، قد تكون أكثر عرضة للتلف الإشعاعي. بالإشارة إلى هذه النقطة ، يوفر البحث الذي أجراه Holton & # 38 Frankel (2010) بعض المناقشات المفيدة ويقدم نظرة ثاقبة للعلاقة المحتملة بين CPV14 والبروتينات الأخرى التي يحتمل أن تكون أكثر اضطرابًا أو حساسة للإشعاع. يقارن نقاشهم حالة بروتين اختبار الليزوزيم مع بلورة بروتينية كبيرة (10 & # 8197MDa) مع ويلسون. ب عامل 61 & # 8197 & # 197 2. تشير الحسابات داخل المقالة إلى أن هذا البروتين الأكبر يحتوي على ويلسون ب يتطلب عامل ثلاثة أضعاف حجم بلورة الليزوزيم حجمًا قريبًا من أمرين من حيث الحجم أكبر لإنتاج دقة الانعراج والجودة المكافئة. يشير هذا إلى أن مثل هذه البلورة أكثر حساسية بمقدار درجتين تقريبًا لجرعة الأشعة السينية من نظير الليزوزيم الموصوف في المقالة. الطبيعة القابلة للذوبان لـ CPV14 ووزنه الجزيئي تجعله أكثر قابلية للمقارنة مع مثال الليزوزيم لهولتون & # 38 فرانكل (2010) من بروتين 10 & # 8197MDa. لذلك ، من الممكن أن يكون البروتين الأكثر اضطرابًا أو حساسية للإشعاع ، على سبيل المثال بروتين غشائي ، أكثر حساسية للضرر الإشعاعي مقارنة بـ CPV. بالنظر إلى ذلك ، نعتقد أن جرعات الإلكترون العارضة المستخدمة هنا لا تزال تضعنا ضمن عتبة الضرر حتى بالنسبة لأكثر البلورات حساسية ، خاصة وأن الإلكترونات منخفضة الطاقة المستخدمة من المتوقع أن تخترق ما لا يزيد عن 150 & # 8197 نانومتر في سطح عينات.

4 - نتائج

تدعم التحليلات الموصوفة هنا استخدام التصوير SEM منخفض الجهد كطريقة لتصور وتحديد بلورات البروتين بحجم ميكرومتر قبل تجارب حيود الأشعة السينية. باستخدام إلكترونات 2 & # 8197keV بالجرعات الموصوفة ، تشير النتائج المقدمة هنا إلى عدم وجود فرق كبير بين جودة بيانات حيود الأشعة السينية من البلورات التي تعرضت لشعاع SEM وتلك التي لم تكن كذلك. يتماشى هذا مع الأدبيات التي تنص على أن جرعات 3 & # 8197e & # 8722 & # 8197 & # 197 & # 87222 مطلوبة للتسبب في تقليل الانعكاسات عالية الدقة (الموصوفة بالانعكاسات & # 60 3 & # 8197 & # 197 القرار ) (تشيو ، 2006 هندرسون ، 1995 هاتني وآخرون. ، 2018). تم إجراء هذه التجارب باستخدام جرعات إلكترونية كانت أقل بعدة مرات من عتبة 3 & # 8197e & # 8722 & # 8197 & # 197 & # 87222 وطاقات الإلكترون التي تترك الجزء الأكبر من بلورات البروتين غير مخترقة. في الواقع ، فإن عدم وجود أضرار إشعاعية ذات دلالة إحصائية أو قابلة للقياس للعينات المعرضة لـ SEM يدعم استخدام هذه الجرعات وطاقات الإلكترون للتصوير. في الختام ، يعتبر تصوير SEM منخفض الجهد طريقة مناسبة للتصور والمحاذاة اللاحقة للعينات تحت دقة الفحص المجهري البصري.

5. المؤلفات ذات الصلة

تم الاستشهاد بالمرجع التالي في معلومات الدعم لهذه المقالة: Zheng وآخرون. (2009).


التقييم اليدوي

على الرغم من أن مجتمع البيولوجيا الهيكلية قد حقق مستوى عالٍ من الأتمتة في جمع البيانات ومعالجة البيانات وحل الهيكل في السنوات الأخيرة ، لا تزال عملية تحديد الهيكل تتطلب تفسيرًا من قبل الباحثين. ينطبق هذا بشكل خاص على الخرائط منخفضة الجودة ذات التوافق السيئ بين البيانات التجريبية والنماذج الهيكلية. يظل الفحص البصري للمخلفات عن طريق البقايا من قبل عالم الأحياء الهيكلية المتمرس هو أفضل طريقة للحكم على الجودة. لذلك نختار الهياكل التمثيلية لكل بروتين من بروتين SARS-CoV-2 ، بالإضافة إلى تلك ذات الأهمية الخاصة لتطوير الأدوية ، للتقييم اليدوي. هناك مشكلات معينة شائعة بشكل مدهش ، مثل تقلب رابطة الببتيد (الشكل 1 ج ، د) ، وأخطاء الروتامير ، ومشكلات الإشغال (الشكل 1 هـ) ، والتعرف الخاطئ على الجزيئات أو الأيونات الصغيرة ، على سبيل المثال ، الماء مثل المغنيسيوم والكلوريد مثل الزنك. من الجدير بالذكر أن الزنك يلعب دورًا مهمًا في العديد من بروتينات SARS-CoV-2. وجدنا أن العديد من مواقع تنسيق الزنك قد تم تشكيلها بشكل خاطئ ، مع فقدان أيون الزنك أو دفعه بعيدًا عن روابط الكثافة و / أو روابط ثاني كبريتيد الخاطئة بين بقايا السيستين المنسقة (الشكل 1 أ ، ب ، ح). بالإضافة إلى ذلك ، يتم غليكوزيلات العديد من بروتينات الفيروس التاجي في بقايا الأسباراجين السطحية ، ولكن غالبًا ما يتم قلب السكريات الجليكان عن اتجاهها الصحيح حول ن- رابطة الجليكوسيد (الشكل 1 و ، ز). يمكن تجنب ذلك باستخدام أدوات مثل Privateer 19 وأداة بناء الكربوهيدرات الآلية في Coot 20. من المهم ملاحظة أن الانحراف عن السلوك المتوقع ليس دائمًا خطأ ويمكن أن يكون أيضًا ميزة ذات صلة وظيفيًا ، على سبيل المثال ، الأشكال الهندسية المتوترة التي توجد غالبًا في المواقع التحفيزية. ومع ذلك ، يجب دعم هذه الانحرافات بقوة بواسطة البيانات التجريبية. من بين الهياكل التي فحصناها يدويًا ، تمكنا من تحسين 31 بشكل كبير من حيث جودة النموذج أو جودة البيانات أو كليهما. نقدم أدناه مثالين لتوضيح أهمية الفحص الدقيق للبيانات التجريبية والنماذج الناتجة.

كل الصور ماعدا أنا هي لقطات شاشة من الإصدار التجريبي Coot v0.9.9. تظهر الكثافة المتبقية وخرائط إعادة الإعمار باللون الأزرق الرمادي ، مع اختلاف كثافة الإلكترون باللونين الأحمر والأخضر. أ، SARS-CoV-1 Nsp14 – Nsp10 (PDB 5C8T) موقع تنسيق الزنك الهيستيدين (B603) ، بمستوى كفاف الكثافة المتبقية 0.445 ، جذر متوسط ​​الانحراف التربيعي (r.m.s.d.) 0.150. ب، الهيستيدين من أ تم استبداله في ISOLDE 25 ، مما أدى إلى تنسيق رباعي السطوح لـ Zn 2+ ، ثم تم إجراء التنقية باستخدام PDB-REDO 11 مع إضافة روابط يدوية. ج، تم تصميم Proline A505 كـ عبر في مجمع RdRp (PDB 7BV2 ، يسار) ، لكن الكثافة تشير إلى أ رابطة الدول المستقلة تشكيل السلسلة الرئيسية ، كما هو موضح في د. د، تم تحديث إدخال PDB المودع بعد أن اتصلنا بالمؤلفين الأصليين. ه، كثافة إلكترون عالية الاختلاف عند البقايا A165 في البروتياز الرئيسي SARS-CoV-2 (PDB 5RFA) بسبب شغل 0.44 فقط بدلاً من 1.00 بالقرب من المانع المحتمل (يسار). مستوى كفاف الخريطة المتبقية 0.54، r.m.s.d. 0.319 كثافة الفرق عند مستوى الكنتور 0.35 ، جذر متوسط ​​التربيع. 0.114. F، مجال ربط مستقبلات السارس- CoV-2 معقد مع ACE2 البشري (PDB 6VW1). هذه ن- ينقلب الجليكان المرتبط بحوالي 180 درجة حول ن-رابطة غليكوسيدية. بعد أن اتصلنا بالمؤلفين الأصليين ، تمت مراجعة هذا الإدخال (يظهر في ز). ز، التصحيح يحسن تناسب كثافة سلسلة السكر. الخريطة المتبقية عند مستوى الكنتور 0.311، r.m.s.d. 0.265. ح، رابطة ثنائي كبريتيد A226 – A189 في البروتياز الشبيه بغراء (PDB 6W9C) ، بكثافة الإلكترون عند مستوى محيطي 0.214 ، r.m.s.d. 0.136 تبقى بقايا السيستين الأخرى غير منسقة. في حين أن خريطة الكثافة لا تشير إلى الزنك ، إلا أنه مجال إصبع الزنك ، بينما تشتمل نسخ NCS الأخرى على زنك منسق في هذا الموضع. أنا، مؤامرة AUSPEX 8 للحلقات الجليدية الرئيسية لـ SARS-CoV (PDB 2HOB) تنعكس من خلال التحيز في توزيع الكثافة (الأحمر). ي، مؤامرة Ramachandran أو زوايا الالتواء في العمود الفقري للببتيد للمركب الديناميكي SARS-CoV Nsp10 – Nsp14 (PDB 5NFY). من حيث المبدأ ، يجب أن يكون هناك عدد قليل فقط من القيم المتطرفة (باللون الأحمر) ، حيث تلتزم معظم روابط الببتيد بالتوزيعات الزاويّة النموذجية. الصورة: CSTF / insidecorona.net.

الأنزيم البروتيني الشبيه بغراء

يحتوي بروتين SARS-CoV-2 غير الإنشائي 3 (Nsp3) على مجال بروتياز يشبه غراء وهو ضروري للعدوى لأنه يشق البولي ببتيد الفيروسي. تم إصدار الهيكل الأول للبروتياز الشبيه بـ SARS-CoV-2 (PDB 6W9C) في 1 أبريل 2020 ، بعد ثلاثة أشهر فقط من الإبلاغ عن الجينوم الفيروسي (GenBank MN908947.2). تم استخدام الهيكل على الفور في جهود تصميم الأدوية. ومع ذلك ، كان الاكتمال العام للبيانات المقاسة 57٪ فقط. كشف فحص البيانات الأولية ، المتاحة من https://proteindiffraction.org/ 10 ، عن أضرار إشعاعية قوية ، تفاقمت بسبب ضعف إستراتيجية جمع البيانات. لا يمكن استنتاج هذا من ترسب PDB ، مما يؤكد أهمية إتاحة البيانات الخام.

تحتوي البلورة على 3 أضعاف تناظر غير بلوري (NCS) ، مع كل مونومر مجال بروتياز شبيه بغراء يحتوي على أيون Zn 2+ مهم وظيفيًا مرتبطًا بأربعة بقايا سيستين مع C مماثلة.ßγ- زوايا Zn و Zn – Sγ أطوال السندات. بسبب الأضرار الإشعاعية ، فإن مواقع Zn-S ضعيفة الكثافة. في نسخة واحدة من NCS ، تم تصميم الموقع على هيئة رابطة ثنائي كبريتيد ومتبقي سيستين حرتين (الشكل 1 ساعة) ، بينما تنسق نسختا NCS الأخريان ذرة الزنك مع C متفاوتة بشدة.ßγ- زوايا Zn وأطوال روابط Zn-S. أعدنا معالجة الصور باستخدام XDS 22 ، وهو برنامج لمعالجة صور حيود الأشعة السينية أحادية البلورة. تم استخدام خادم STARANISO لتحديد وتطبيق حد متباين لبيانات الحيود. أدى هذا التدخل اليدوي الدقيق إلى تحسين الجودة الإجمالية للبيانات وزيادة الدقة من 2.7 إلى 2.6 ، لكن الاكتمال الإهليلجي الكلي المنقح كان 44.5٪ فقط. إضافة ذرات الزنك إلى جميع المواقع ، وتقييد أطوال الروابط والزوايا للقيم المتوقعة واستخدام قيود NCS ووزن أعلى بشكل عام للهندسة المثالية ، جنبًا إلى جنب مع إعادة تشكيل السلاسل الجانبية وجزيئات الماء ، وتحسين خرائط كثافة الإلكترون وخفض ص القيم بنسبة 4٪. يوضح هذا الترابط بين جمع البيانات ومعالجتها وبناء النماذج: حتى لو لم تكن استراتيجية جمع البيانات مثالية ، فإن أخذ المشكلات الناتجة في الاعتبار أثناء معالجة البيانات وصقلها يمكن أن يؤدي إلى تحسين النموذج النهائي بشكل كبير.

تم إصدار هيكل متحولة C111S من مجال البروتياز الشبيه بغراء (PDB 6WRH) بعد شهر واحد. في هذا الهيكل ، تم حل مواقع الزنك بوضوح في جميع الوحدات الفرعية. في غضون ذلك ، تم استخدام PDB 6W9C على نطاق واسع في تصميم عقار السيليكو. استخدم 20٪ من أكثر من 140 فريقًا بحثيًا في JEDI COVID19 GrandChallenge ، وهي مسابقة للعثور على أدوية COVID-19 المحتملة في السيليكو ، هذا النموذج. كان من الممكن أن يؤدي توفر بنية أفضل قبل شهر واحد إلى زيادة فرص نجاحهم وتوفير الحوسبة وساعات العمل.

مجمع بوليميراز الحمض النووي الريبي

يقوم SARS-CoV-2 بتكرار جينوم الحمض النووي الريبي أحادي السلسلة باستخدام مركب جزيئي كبير من بوليميريز الحمض النووي الريبي المعتمد على الحمض النووي الريبي (Nsp12 RdRp) و Nsp7 و Nsp8. تتضمن هياكل cryo-EM السابقة لمتناظرات SARS-CoV-1 (PDB 6NUR ، PDB 6NUS) حلقة غير مضطربة متبوعة بحلزون مرئي ولكنه قصير وغير منتظم ونهاية C مرنة. تم حل كثافة هذا اللولب بشكل سيئ ، لكن النموذج كان له هندسة صالحة. كشف تحليلنا لأحد الهياكل الأولى لمركب SARS-CoV-2 المكافئ (PDB 7BTF) أن التسلسل في هذه المنطقة الطرفية C (جزء من أخدود ربط الحمض النووي الريبي) كان منحرفًا بواسطة تسعة مخلفات (الشكل 2) . كان هذا الخطأ موجودًا في جميع هياكل SARS-CoV-1 و SARS-CoV-2 ذات الصلة ، ربما لأن تحديد الهيكل الجديد يبدأ عادةً من نموذج سابق عندما يكون واحدًا متاحًا.

أ، نظرة عامة مع الحلقة المفقودة الموضحة كخريطة خط متقطع (PDB 7BV2) عند 2.4 درجة. حسنًا ، تفاصيل اللولب الطرفي C عند 5σ. ب، خريطة ونموذج أقل دقة (PDB 6NUS). من الصعب الحكم على ملاءمة السلسلة الجانبية. ج، خريطة ونموذج عالي الدقة (PDB 7BV2) كما تم إيداعه ، فإن ملاءمة السلسلة الجانبية هي دون المستوى الأمثل بسبب خطأ التسجيل. د، نموذج معدل لـ PDB 7BV2 السلاسل الجانبية الآن تناسب الكثافة. يشار إلى تحول السجل بواسطة Tyr915 المسمى. الصورة: CSTF / insidecorona.net.

تم إطلاق هيكل مجمع RdRp المرتبط بالنيوكليوتيدات التماثلية remdesivir (PDB 7BV2 (المرجع 23)) بعد فترة وجيزة وقدم الأساس للتصميم العقلاني لمرشحي الأدوية ذات الصلة 24. تميز هذا الهيكل أيضًا باختلال تسلسل البقايا التسعة. أعدنا بناء الهيكل باستخدام ISOLDE 25 ، CaBLAM 6 والفحص البصري ، وتصحيح بعض الانعكاس أو رابطة الدول المستقلة عكس عبر الببتيدات (الشكل 1 ج ، د) وثلاثة مُطابِقات RNA بالقرب من ريمديزفير ، بما في ذلك قاعدة الأدينوزين المتخلفة. تمكنا أيضًا من إضافة العديد من المخلفات والمياه بكثافة وهندسة جيدة. يتم ربط Remdesivir تساهميًا بـ RNA ، ولكنه موجود فقط في ما يقدر بـ 50 ٪ من الجزيئات المقاسة 12. هذا يعني أن الموقع النشط عبارة عن مزيج من حالتين مختلفتين على الأقل ، لذلك ليس من المستغرب أن تكون أيونات Mg 2+ والبيروفوسفات النموذجية مدعومة بشكل سيئ من خلال الكثافة التجريبية وجهات الاتصال المحلية. هذا مصدر قلق لاحقًا في عملية الالتحام والسيليكو وتصميم الأدوية ، والذي غالبًا ما يأخذ جميع الذرات في الهيكل المترسب كإطار ثابت للبناء فيه. قد توفر الهياكل المعاد تشكيلها للمجمع أساسًا أكثر صلابة لتصميم الدواء ، حتى لو كان

50٪ من إشغال الموقع النشط لم تتم مناقشته على نطاق واسع 12. من الجدير بالذكر أنه على الرغم من الخطأ الكبير في التسجيل والعديد من المشكلات الأصغر ، إلا أنه من خلال مقاييس "الملخص" التقليدية ، بدا النموذج جيدًا للغاية ، مع عدم وجود قيم متطرفة لراماشاندران ولا دوارة ودرجة صدام 2 ، مما يبرز أن الفحص البصري المباشر يجب أن يظل خطوة رئيسية في أي عملية النمذجة.

على الرغم من أن المشكلات التي تمت مناقشتها أعلاه كانت موجودة في الهياكل المودعة في الأصل ، فقد تم الآن تصحيح جميع المشكلات تقريبًا. تم تحقيق ذلك جزئيًا على الأقل لأننا جعلنا النماذج المصححة متاحة على موقعنا على الويب واتصلنا بالمؤلفين الأصليين لهذه الهياكل مع أوصاف مفصلة ، ودعمهم لإيداع النسخ المنقحة إلى wwPDB وفقًا لتقديرهم.


العنوان: الحفاظ على بيانات حيود الخام وإعادة استخدامها: نظرة عامة ، وتحديث الإجراءات العملية ومتطلبات البيانات الوصفية

يتم تقديم استعراض موضعي للاهتمامات سريعة التطور وخيارات التخزين لحفظ وإعادة استخدام البيانات الخام ضمن المجال العلمي لـ IUCr ولجانه ، وكل منها يعمل ضمن تنوع كبير من الأجهزة. يتم تضمين السيرة الذاتية في حالة ترسيب بيانات الحيود الخام. يتم تحديد السياق العام من خلال تسليط الضوء على مبادرات صانعي السياسات العلمية نحو نموذج "العلم المفتوح" الذي سيعمل ضمنه علماء البلورات بشكل متزايد في المستقبل ، وهذا سيوفر فرصًا جديدة للتمويل ولكن أيضًا مدونات إجراءات جديدة ضمن أطر علمية مفتوحة. سوف تحتاج إلى التوسع في تعليم المهارات والتدريب لخبراء البلورات. بشكل عام ، هناك الآن وسائل وتنظيم للحفاظ على بيانات الحيود البلوري الخام أنواع مختلفة من الأرشيف ، مثل الجامعات ، والمستودعات الخاصة بالأنظمة (المورد المتكامل للتكاثر في علم البلورات الجزيئي ، وشبكة بيانات البيولوجيا الهيكلية) ، ومستودعات البيانات العامة العامة (Zenodo، ResearchGate) ومرافق مركزية للنيوترون والأشعة السينية. صياغة واصفات البيانات الوصفية المحسنة لأنواع البيانات الأولية لكل من لجان IUCr قيد التقدم وبعض الأمثلة التفصيلية المقدمة. أخيرًا ، تم تقديم عدد من دراسات الحالة المحددة ، بما في ذلك مثال على سلسلة بحث توفر وصولاً مفتوحًا كاملاً المزيد من & raquo إلى البيانات الأولية. وقوو أقل


الحواشي

↵ ¶ لمن ترسل المراسلات على العنوان *. البريد الإلكتروني: chris.jacobsenstonybrook.edu.

مساهمات المؤلفين: D. Shapiro ، T.B. ، V.E. ، M.H. ، CJ ، J.K. ، E.L. ، and D. Sayre ، Designed Research D. أجرى البحث D. Shapiro ، P.T. ، V.E. ، C.J. ، E.L. ، HM ، and A.M.N. تحليل البيانات D. Shapiro ، P.T. ، T.B. ، V.E. ، M.H. ، C.J. ، and E.L. ساهم بكواشف / أدوات تحليلية جديدة وكتبت الورقة البحثية كل من D. Shapiro و V.E. و MH و CJ و JK و D.

تم تقديم هذه الورقة مباشرة (المسار الثاني) إلى مكتب PNAS.

الاختصارات: XDM ، الفحص المجهري لحيود الأشعة السينية CCD ، جهاز الشحن المزدوج STXM ، مجهر الأشعة السينية الناقل.


شاهد الفيديو: حيود الاشعة السينية (قد 2022).