Sztuczna inteligencja DeepMind stworzył bazę danych ze strukturami 3D prawie wszystkich białek znanych nauce

Autor: Michael Korgs | 29.07.2022, 16:44
Sztuczna inteligencja DeepMind stworzył bazę danych ze strukturami 3D prawie wszystkich białek znanych nauce

W zeszłym roku Google DeepMind opublikował bazę danych o otwartym kodzie źródłowym zawierającą obrazy 3D setek tysięcy białek, w tym wszystkich 20 000 znanych białek w ludzkim ciele. Teraz baza danych struktur białkowych AlphaFold została rozszerzona do 200 milionów rekordów, w tym prawie wszystkich odkrytych białek.

Białka to konie robocze żywych komórek, pełniące szeroki zakres funkcji krytycznych dla przetrwania. Powstają z łańcuchów aminokwasów, które zwijają się w złożone trójwymiarowe formacje, które determinują ich funkcję. Ważne jest, aby zrozumieć strukturę białek, aby zbadać, jak działają i jak coś może pójść nie tak, co ma kluczowe znaczenie dla badań w takich dziedzinach, jak nowe leki i metody leczenia oraz ochrona upraw i zwierząt.

Trudno jednak obliczyć strukturę białka na podstawie jego aminokwasów. Odkrycie tego rodzaju rzeczy zwykle wymaga dużej mocy obliczeniowej i ludzkiej pracy, co nazywa się „problemem fałdowania białek”. W rezultacie postęp w historii był stosunkowo powolny.

Jak dotąd, potężna sztuczna inteligencja DeepMind firmy Alphabet nie została przypisana do rozwiązania tego problemu. Początkowo przeszkolony na 100 000 znanych struktur białkowych, system był następnie w stanie przewidzieć struktury milionów innych białek, przy czym określenie każdego z nich trwało minuty lub sekundy, a nie miesiące lub lata.

W lipcu 2021 r. baza danych struktur białkowych AlphaFold została udostępniona naukowcom. Pierwotnie zawierał ponad 350 000 struktur białkowych, w tym około 98,5% białek ludzkich, a także białka muszki owocowej, myszy, drożdży i E. coli. Od tego czasu został poszerzony o ponad milion struktur białkowych z ponad 10 000 gatunków zwierząt, roślin, bakterii, grzybów i innych organizmów. Od tego czasu ponad 500 000 naukowców z całego świata korzystało z tej bazy danych w swojej pracy.

DeepMind właśnie wydało ogromną nową aktualizację bazy danych, która zawiera obecnie około 214 milionów struktur z miliona gatunków. Obejmuje to prawie każde białko znane nauce, zapewniając znaczący impuls do leczenia chorób i opracowywania szczepionek, a także odporności środowiskowej i na antybiotyki.

Całą bazę danych struktur białkowych można pobrać z Publiczne zbiory danych Google Cloud .

Źródło: newatlas.com