И им пришлось создать новые инструменты для обработки такого большого объема структурных моделей белков.

Недавний выпуск более 200 миллионов предсказанных белковых структур с помощью AlphaFold 2 компании DeepMind в сотрудничестве с Европейским институтом биоинформатики открыл новую эру исследований белков. Здесь я представляю краткое изложение результатов двух новаторских статей, опубликованных на этой неделе в журнале Nature, в которых исследуются глубины этой белковой вселенной. В этих статьях используются инновационные алгоритмы кластеризации, структурные сравнения и другие адаптации существующих инструментов для работы с большими объемами данных, чтобы пролить свет на структурное разнообразие, эволюционные взаимоотношения и функциональный потенциал белков в беспрецедентных масштабах.

Белки — это «рабочие лошадки» биологии, управляющие множеством клеточных процессов, от выработки энергии до деления клеток. Хотя секвенирование белков с годами бурно развивалось благодаря достижениям в области геномики, определение их трехмерных структур отставало из-за нехватки масштабируемых экспериментальных методов. Однако с появлением AlphaFold 2, революционной системы искусственного интеллекта, разработанной DeepMind, ситуация в предсказании структуры белков изменилась. База данных структур белков AlphaFold (AFDB) теперь содержит поразительные 200 миллионов предсказанных белковых структур, что знаменует собой важную веху в вычислительной биологии.



Теперь, буквально на этой неделе, две группы авторов написали в Nature, чтобы сообщить, как использовать белковые модели AlphaFold 2, чтобы открыть новое понимание белковой вселенной. В этих исследованиях используются инновационные версии существующих инструментов, адаптированные к огромному объему данных в AFDB; например, современные версии алгоритмов кластеризации и методов структурных сравнений. С помощью этих адаптированных инструментов работы исследуют обширные пространства белковых структур, их эволюционное происхождение и функциональные последствия.