İnternette İstediğiniz Gibi Çevrimiçi Para Kazanma!

Büyük ölçekli biyomoleküler dinamikler için derin öğrenme: Harvard araştırması, önceden eğitilmiş büyük bir Allegro modelini birden fazla sistemde ölçeklendiriyor

Şu yazıyı okuyorsunuz: Büyük Ölçekli Biyomoleküler Dinamik için Derin Öğrenme: Harvard Araştırması, Önceden Eğitilmiş Büyük Bir Allegro Modelini Birden Fazla Sistemde Ölçeklendiriyor

Hesaplamalı biyoloji, kimya ve malzeme mühendisliği, maddenin atomik ölçekte zamansal evrimini tahmin etme yeteneğine dayanır. Kuantum mekaniği atomların ve elektronların titreşimlerini, yer değiştirmesini ve bağ ayrışmasını çok küçük bir düzeyde yönetirken, gözlemlenebilir fiziksel ve kimyasal süreçleri yöneten olgular genellikle çok daha büyük uzunluklarda ve daha uzun zaman ölçeklerinde meydana gelir. Hem exascale işlemcilere erişim sağlayan, yüksek derecede paralelleştirilebilir mimarilerde hem de bu boyutları köprülemek için kuantum etkileşimlerini yakalamaya yönelik hızlı, son derece doğru hesaplamalı yöntemlerde yenilik gereklidir. Mevcut hesaplamalı yaklaşımlar gerçekçi fiziksel ve kimyasal sistemlerin yapısal karmaşıklığını araştıramaz ve bunların gözlemlenebilir evriminin süresi atomistik simülasyonlar için çok uzundur.

Son yirmi yılda MLIP’ler (makine öğrenimi atomlar arası potansiyeller) üzerine pek çok araştırma yapıldı. Yüksek hassasiyetli referans verilerinden öğrenilen enerjiler ve kuvvetler, atom sayısına göre doğrusal olarak ölçeklenen MLIP’leri yönlendirmek için kullanılır. İlk girişimlerde, elle hazırlanmış tanımlayıcılarla birlikte bir Gauss süreci veya basit bir sinir ağı kullanıldı. İlk MLIP’lerin öngörü doğruluğu zayıftı çünkü eğitimde mevcut olmayan veri yapılarına genellenemiyorlardı ve bu da başka hiçbir yerde kullanılamayacak kırılgan simülasyonlara yol açıyordu.

Harvard laboratuvarında yapılan yeni araştırma, 44 milyona kadar atoma sahip biyomoleküler sistemlerin Allegro kullanılarak SOTA tarafından doğru bir şekilde modellenebileceğini gösteriyor. Ekip, atom sayısı DHFR için 23.000’den Faktör IX için 91.000, selüloz için 400.000, HIV kapsid için 44.000.000 ve diğerleri için 100.000’den fazla olan sistemler için büyük, önceden eğitilmiş bir Allegro modeli kullandı. Önceden eğitilmiş bir Allegro modeli, fantastik SPICE veri seti üzerinde hibrit işlevsel doğrulukla 1 milyon yapı üzerinde eğitim yapılarak elde edilen yalnızca 26 meV/A zorunlu hatayla 8 milyon ağırlıkla kullanılır. Bu veri ölçeğinde tüm inorganik malzeme ve organik molekül setlerini öğrenme potansiyeli sayesinde, daha önce hayal bile edilemeyen malzeme sistemlerinin büyük ölçekli hızlı simülasyonları mümkündür. Bu 8 milyon pesoyla çok büyük ve güçlü bir model.

Eğitim setlerinin otomatik olarak oluşturulması için aktif öğrenmeyi üstlenmek amacıyla araştırmacılar, derin eşdeğer modelin kuvvet ve enerji tahminlerinin belirsizliğini verimli bir şekilde ölçmenin mümkün olduğunu gösterdi. Eşdeğer modeller doğru olduğundan, doğruluk darboğazı artık MLIP’i eğitmek için gereken kuantum elektronik yapı hesaplamalarında yatmaktadır. Gauss karışım modelleri Allegro’ya kolayca uyarlanabildiğinden, büyük ölçekli belirsizliğe duyarlı simülasyonların bir topluluk yerine tek bir modelle çalıştırılması mümkün olacaktır.

Allegro, geleneksel mesaj aktarma ve transformatör tabanlı tasarımlardan daha iyi performans gösteren tek ölçeklenebilir yaklaşımdır. Birçok büyük sistemde, 100 adım/saniyeden fazla maksimum hız gösterirler ve sonuçlar 100 milyondan fazla atoma kadar ölçeklenir. Kusurların genellikle çok daha belirgin olduğu HIV kapsidinin 44 milyon atomluk büyük ölçeğinde bile simülasyonlar, kutudan çıktığı andan itibaren nanosaniyeler boyunca stabildir. Ekip üretim sırasında neredeyse hiç sorun yaşamadı.

Ekip, devasa biyomoleküler sistemlerin dinamiklerini ve proteinler ile ilaçlar arasındaki atomik seviyedeki etkileşimleri daha iyi anlamak için yaptıkları çalışmanın biyokimya ve ilaç keşfinde yeni yolların önünü açacağını umuyor.