Нейросети помогут в создании лекарств от рака

13 февраля 2017
Санкт-Петербург.ру
Людмила Кошкина

Использование технологий генеративных нейронных состязательных сетей, обученных «придумывать» молекулярные структуры, может многократно сокращать время и стоимость поиска веществ, потенциально обладающих лечебными свойствами.

На данный момент в базе данных неорганических молекул несколько сотен миллионов веществ, и только доля процента из них применяется в медицине. Фармакологические методы создания лекарств носят, в основном, наследственный характер. Например, фармакологи продолжают исследовать аспирин, который применяется уже много лет. Или что-то добавляют к известной молекуле, чтобы снизить побочные эффекты или повысить эффективность, но это все то же вещество. Как выбрать из сотен миллионов принципиально новую молекулу, обладающую лечебными свойствами?

Эту задачу исследователи из МФТИ и Insilico Medicine решили с помощью нейронной сети еще в начале 2016 года, опубликовав статью в журнале Molecular Pharmaceuticals. В этот раз исследователи решили пойти дальше и поставили себе иную цель — создать новые молекулы с заранее заданными свойствами и заставить глубокие нейронные сети "вообразить" новые структуры молекул, которые могли бы убивать раковые клетки при определенной концентрации, передает РИА АМИ.

За основу была взята архитектура состязательных автокодировщиков, являющаяся расширением принципиально нового подхода в глубоком обучении, генеративных состязательных сетей. Для обучения использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные. Она была составлена из трех структурных элементов — кодировщика, декодера и дискриминатора, — каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.

Обучение нейронных сетей зависит от количества входных данных и от размеров самой сети. В среднем нейронная сетка обучается в течение недели (зависит как от сети, так и от данных и технологических возможностей компьютера). То, насколько хорошо идет воспроизведение, влияет конфигурация слоев. Поиск наиболее оптимального решения архитектуры сети может занять от нескольких дней до нескольких месяцев, то есть настройка нейронной сети — это, без преувеличения, целое искусство.

Все молекулы имеют представление в виде "смайлзов" — буквенных аннотаций химического вещества, которые позволяют восстановить его структуру. Стандартная запись, которой обучали в школе, не подходит для обработки сетью, но и смайлз не очень подходит — он имеет произвольную длину от одной буквы до 200. Для обучения нейронной сети требуется одинаковая длина описания (вектора). Решает эту задачу фингерпринт, в переводе «отпечаток пальца» молекулы. Фингерпринт содержит в себе всю информацию о молекуле. Существует множество способов построения «отпечатка», исследователи использовали самый простой бинарный из 166 цифр. Они конвертировали смайлзы в фингерпринты и на них уже обучали сеть.

На вход нейронной сети подавались «отпечатки» известных лекарственных молекул. Сеть должна была распределить веса параметров внутренних нейронов так, чтобы при заданном входе получился заданный же выход. Эта операция повторялась много раз — так происходит обучение на большом количестве данных. В результате получается «черный ящик», который умеет при заданном входе давать заданный выход. Затем разработчики убрали первые слои, и сеть генерировала фингерпринты при обратном прогоне уже сама. Ученые построили «отпечатки» для всех 72 млн молекул и далее сравнивали сгенерированные сетью фингерпринты с базой.

Комментирует один из авторов, аспирант МФТИ Андрей Казеннов: «Мы разработали нейронную сеть генеративного типа, то есть умеющую создавать новые объекты по заданным параметрам, используя "накопленные знания" о миллионах объектах на которых она обучалась. Мы разработали и обучили модель сети, которая способна создавать новые молекулярные структуры с заданными свойствами».

Для проверки сети использовали базу известных противораковых лекарств. Исследовали сверили сгенерированные сетью соединения с общей базой. Из полученных 69 молекул многие являются активно используемыми противораковыми препаратами. А вот остальные потенциально могут стать основой новых лекарственных препаратов.

«Генеративные состязательные сети с применением обучения с подкреплением — это будущее фармакологии. Я очень надеюсь, что в скором времени мы сможем разрабатывать индивидуальные лекарства для лечения редких заболеваний и даже для лечения отдельных пациентов. Уже в этом году искусственный интеллект начнет трансформировать фармацевтическую индустрию», - говорит один из авторов исследования Александр Жаворонков, глава Insilico Medicine и международный адъюнкт-профессор МФТИ.

USD	09.05.2024	91.8239	+0.7008
USD ММВБ	19:15	91.9746
EUR	09.05.2024	98.9461	+0.6399
EUR ММВБ	19:15	98.9994
Нефть($)	..20		+
Нефть(p)	..20	0.00	+0.00

В Петербурге перед началом майских праздников растет спрос на официантов и мангальщиков	Петербургские ученые создали "умную" одежду, вырабатывающую энергию	Петербуржцы с трудом находят поликлиники, где можно привиться от коронавируса	Пистолет, из которого школьник отрыл стрельбу на Науки, оказался пластмассовым
Фонтан "Луч" в парке 300-летия обворовали прямо перед началом летнего сезона	"Премии, уважение, признание": петербуржцы рассказали, что их больше всего мотивирует работать	Петербуржцам рассказали, каким категориям граждан следует ограничить употребление бананов	В Петербурге в начале апреля наблюдается аномальное количество снега
На Невском проспекте за 14,7 млн рублей установят вазоны с декоративными яблонями	В Петербурге любитель гонок уходя от погони устроил ДТП и остановился только после предупредительного выстрела	Владимиром Путиным был подписан указ о проведении в Москве Международной выставки-форума "Россия"	В Комтрансе рассказали об изменениях в законодательстве, связанных с зонами платной парковки в Петербурге