Разработка нового лекарства часто требует тысяч химических экспериментов. Учёные перебирают разные комбинации веществ и условий, чтобы найти оптимальный способ синтеза активного соединения. Этот процесс долгий, дорогой и зависит от редких металлов-катализаторов, поставки которых могут быть нестабильными.

Исследователи из Мичиганского университета под руководством Тима Чернака (Tim Cernak) решили помочь искусственному интеллекту справляться с этой задачей эффективнее. Они создали открытую базу данных, содержащую более 50 тыс. тщательно спланированных химических экспериментов — на сегодняшний день это самая большая коллекция такого рода.
Что содержит новая база данных
Команда сосредоточилась на реакциях образования связей углерод–азот. Такие связи входят в состав огромного количества лекарственных молекул. Учёные систематически проверяли тысячи комбинаций реагентов, катализаторов и условий реакции, фиксируя, что работает, а что нет.
Данные полностью открыты и доступны всем исследователям через Open Reaction Database. По словам Тима Чернака, это только начало — в будущем база может вырасти в гораздо более крупную библиотеку условий химических реакций, которая будет «кормить» системы искусственного интеллекта.
ИИ уже помогает ускорять поиск новых лекарств, но он может учиться только на тех данных, которые ему дают. До сих пор качественных, больших и систематизированных наборов по химическим реакциям практически не существовало. Новая база решает эту проблему.
Альтернативы дорогим катализаторам
Одна из важных задач исследования — поиск замены палладию. Этот металл чаще всего используют в качестве катализатора при синтезе лекарств, но его запасы контролируются всего несколькими странами, что создаёт риски для цепочек поставок.
Учёные сравнили поведение палладия, никеля и меди в одинаковых условиях. Оказалось, что во многих случаях никель работает не хуже палладия, а иногда даже медь показывает хорошие результаты. Медь и никель гораздо доступнее и распределены по миру более равномерно.
Кроме того, в ходе экспериментов было замечено неожиданное явление: высокоактивные промежуточные соединения (арины) могут образовываться при более низких температурах, чем считалось ранее. Это открывает возможность проводить некоторые реакции без использования драгоценных металлов.
Что это даёт фармацевтике
Большие систематические наборы данных позволяют ИИ выявлять закономерности, которые трудно заметить при традиционном подходе «проверить несколько вариантов». В будущем такие базы помогут:
- быстрее находить оптимальные условия синтеза новых лекарств;
- снижать зависимость от редких и дорогих катализаторов;
- делать производство лекарств более устойчивым и экономичным.
«Большие систематически спланированные наборы данных о реакциях позволяют увидеть закономерности, которые сложно заметить в обычных исследованиях, — отметил Тим Чернак. — Например, я никогда бы не предположил, что высокоактивные промежуточные молекулы — арины — могут образовываться при таких низких температурах, но это повторялось сотни раз».
Работа опубликована в Journal of the American Chemical Society.
