Сотрудники химического факультета МГУ имени М.В. Ломоносова разработали аналитическую схему, позволяющую по химическим «отпечаткам пальцев» делать заключения о протекающих в организме процессах. Схема пригодится и врачам, и фармакологам, и экологам, и даже пищевикам. Результаты исследования опубликованы в журнале Analytical Methods.

Совокупность низкомолекулярных соединений (углеводы, аминокислоты, органические кислоты, нуклеотиды и другие органические молекулы) в организме называют метаболомом. Определение состава метаболома важно для динамического анализа происходящих в организме процессов. При нормальных условиях содержание соединений варьируется в некоторых пределах. При развитии заболевания метаболом пораженной ткани может резко измениться, и экстремальные (низкие или высокие) концентрации веществ могут стать биомаркерами патологических процессов.

Десятки биомаркеров уже нашли широкое применение в клинической практике: определение уровня креатинина в крови и моче используют для оценки функции почек, анализ на содержание желчных кислот в крови — функции печени. Междисциплинарная научная область, возникшая на стыке молекулярной биологии, биохимии и медицины, – метаболомика изучает качественный и количественный состав метаболома клетки, ткани или организма и его изменения во времени. Помимо обнаружения заболеваний метаболомика помогает в поиске новых лекарственных средств, в микробиологии, пищевой химии и мониторинге состояния окружающей среды.

В метаболомике до сих пор нет единой процедуры анализа данных. Дело в том, что экспериментальные данные могут быть получены из десятков серий измерений биологических образцов в разных условиях. Для анализа таких данных используют различные статистические методы. В зависимости от принятых в конкретной лаборатории приемов и имеющегося опыта статистический анализ проводят самыми разнообразными способами, долго выбирая условия и методы. Сотрудники химического факультета МГУ предложили универсальную рабочую схему анализа метаболома, комбинировав существующие статистические методики. Ученые собрали несколько десятков наборов экспериментальных данных из открытых репозиториев. Экспериментальные данные (анализы 8 добровольцев, 20 пациентов с колоректальным раком до операции и 12 пациентов после операции), предоставленные НМИЦ колопроктологии имени А.Н. Рыжих, ученые использовали для первичной оптимизации схемы анализа данных.
«Нашу работу выгодно отличает от прочих беспрецедентный объем валидации – 36 наборов данных, тогда как обычно ограничиваются тремя-пятью», – прокомментировал один из авторов работы, младший научный сотрудник кафедры аналитической химии химического факультета МГУ Иван Плющенко.

Метаболом анализируют с помощью методов, позволяющих определять в образце тысячи соединений. В то же время из-за большого числа компонентов анализатор прибора загрязняется и итоговый сигнал прибора искажается. Поэтому необходимо проводить коррекцию сигнала, особенно в случае объемных исследований.
Ученые использовали методы машинного обучения, характерной чертой которых является не прямое решение задачи, а обучение моделей в процессе решения множества сходных задач. Для этого исходный набор данных многократно разбивают на две части: один набор используют для построения оптимальной модели, второй – для проверки характеристик модели. Методика включает в себя комбинацию методов машинного обучения, статистического анализа и коррекцию дрейфа сигнала приборов, что позволяет решать задачи классификации и выделять минимально необходимый для правильной классификации набор биомаркеров.

Разработанный сотрудниками МГУ подход призван стандартизировать процедуру анализа данных в метаболомике. Все вычисления выполнены в одной программе, на одном языке программирования и бесплатно распространяются. Процесс вычисления может быть ускорен за счет параллельных вычислений.

Изображение: схема разложения аналитического сигнала на компоненты.