=Paper= {{Paper |id=Vol-1482/581 |storemode=property |title=Метод предсказания констант связывания стероидов на основе искусственных нейронных сетей (Method of predicting the binding constants of steroids based on artificial neural networks) |pdfUrl=https://ceur-ws.org/Vol-1482/581.pdf |volume=Vol-1482 }} ==Метод предсказания констант связывания стероидов на основе искусственных нейронных сетей (Method of predicting the binding constants of steroids based on artificial neural networks)== https://ceur-ws.org/Vol-1482/581.pdf
      Суперкомпьютерные дни в России 2015 // Russian Supercomputing Days 2015 // RussianSCDays.org



       Метод предсказания констант связывания стероидов на
              основе искусственных нейронных сетей

            И.В. Федюшкина1, И.В. Ромеро Рейес1, В.С. Скворцов1, И.С. Левина2
  1
      ФГБНУ «Научно-исследовательский институт биомедицинской химии имени В.Н.
       Ореховича», 2ФГБУН Институт органической химии им. Н.Д. Зелинского РАН

    В настоящее время при создании новых лекарственных средств активно применяют
различные методы компьютерного поиска, моделирования структур и конструирования
фармакологически перспективных соединений de novo [1]. Их применение призвано
существенно снизить стоимость, ускорить процессы их разработки и внедрения. Одной из
важных задач является совмещение компьютерных оценок с традиционными величинами,
используемыми экспериментаторами. Такой величиной является, например, константа
связывания химических соединений с молекулой-мишенью, которая показывает эффективность
их взаимодействия [2].В задачи работы входило создание системы для предсказания величин
констант связывания стероидов на основе параметров, вычисленных из структур лигандов и
при молекулярном моделировании их комплексов с белком-мишенью. Для поиска корреляции
применялась оригинальная реализация искусственных нейронных сетей.
    Был осуществлен выбор нейронной сети и алгоритма её обучения. В работе применялась
однонаправленная нейронная сеть с сигмоидальной функцией активации в скрытом слое и
линейной функцией передачи в выходном слое, количество нейронов в скрытом слое было
установлено равным 8. Обучение ИНС осуществлялось методом обратного распространения
ошибки [3]. Минимизация ошибки между целевым и вычисленным значениями выполнялась
по методу Левенберга-Марквардта [4]. С целью снижения ошибки переобучения в каждом
случае начальная выборка была увеличена в 4 раза путем генерации новых точек в пределах
погрешности (статистический бутстрап). Входные параметры представляли собой набор
независимых дескрипторов лигандов (величин,          описывающих свойства химических
соединений) и энергетических параметров взаимодействия лигандов с белком (рассчитанных с
помощью методов молекулярной динамики) [5, 6].
    В качестве обучающей выборки в работе использовались данные о структуре 42 стероидов
- селективных модуляторов рецептора прогестерона, синтезированных в Институте
органической химии им. Н.Д. Зелинского РАН, для которых была экспериментально
определена величина константа связывания с рецептором прогестерона. Для более адекватной
оценки предсказательной способности полученной модели была использована независимая
тестовая выборка, состоящая из 8 соединений, для которых были выполнены предсказания по
созданной модели, а затем эти вещества были синтезированы и экспериментально определена
константа связывания.
    В результате работы была сконструирована нейросетевая модель для оценки констант
связывания стероидных модуляторов рецептора прогестерона с хорошей предсказательной
силой (коэффициент корреляции при скользящем контроле Q2 =0,91, среднеквадратичная
ошибка = 0,29, для тестовой выборки R2=0,77).
    Данная нейросетевая модель может быть использована для оценки константы связывания с
достаточно высокой точностью. На основе последовательного алгоритма была реализована
параллельная версия этой модели с использованием графических процессоров. В результате
скорость расчетов возросла в 70 раз (расчеты проводились на гибридной вычислительной
системе на базе серверной платформы HP Proliant G7 (AMD Opteron 6100) и вычислительной
системы Tesla S2050 с использованием технологии NVIDIA CUDA 5.0). Характеристики
отдельных функционалов модели представлены в таблице 1. Использование графических
процессоров в соответствующей программной реализации позволит существенно увеличить
размеры обрабатываемых данных при одновременном сокращении временных затрат.




                                                  581
    Суперкомпьютерные дни в России 2015 // Russian Supercomputing Days 2015 // RussianSCDays.org


      Таблица 1. Характеристики выполнения последовательных и параллельных расчетов отдельных
                                     функционалов модели.
                    Реализация                          MATLAB       C++CPU      C++CPU+CUDA
                                                                                     GPU
 Метод главных компонент PCA (сек.)                     0,030       0,014       0,002
 Неметрическое многомерное шкалирование
                                                        0,154       0,103       0,028
 MDS (сек.)
 Обучение ИНС при PCA (эпох/ед. врем.)                  54/1 сеть   78/1 сеть   5396/256 сетей
 Обучение ИНС при MDS (эпох/ед.врем.)                   61/1 сеть   82/1 сеть   5524/256 сетей

Литература:
1. Ivanov A.S., Veselovsky A.V., Dubanov A.V., Skvortsov V.S., Bioinformatics Platform
   Development: From Gene to Lead Compound, Methods Mol Biol. Vol.316, 2006, pp. 389-431.
2. Lawrenz M., Wereszczynski J., Ortiz-Sánchez J.-M., Nichols S.E., McCammon J.A.,
   Thermodynamic integration to predict host-guest binding affinities, Journal of Computer-Aided
   Molecular Design, Vol.26, No.5, 2012, pp. 569-576.
3. D.E. Rummelhart, G.E. Hinton, R.J. Williams Learning internal representations by error
   propagation // Vol. 1 of Computational models of cognition and perception, chap. 8. Cambridge,
   MA: MIT Press, 1986. Pp. 319–362
4. M. Hagan Training Feedforward Networks with the Marquardt Algorithm” / M. Hagan, M.
   Menhaj // IEEE Transactions on Neural Networks. – November 1994. –Vol. 5, No. 6. – Р. 989-993
5. I.D. Kuntz et al. // J. Mol. Biol. 1982, V.161, P. 269
6. Amber 9, http://www.ambermd.org




                                                  582
   Суперкомпьютерные дни в России 2015 // Russian Supercomputing Days 2015 // RussianSCDays.org



Method of predicting the binding constants of steroids based on
artificial neural networks
Irina Fedyushkina, Ilacai Romero Reyes, Vladlen Skvortsov and Inna Levina
Keywords: аrtificial neural networks, progesterone receptor, steroids, parallel computation,
GPU
The system for prediction the values of binding constants of steroids with progesterone
receptor on the basis of parameters, calculated from the ligand structures and from molecular
modeling of protein/ligand complexes was developed. The original implementation of the
artificial neural networks was used for correlated these values.