Как Google использует искусственный интеллект для выявления генетических причин рака
Компания Google представила инструмент искусственного интеллекта под названием DeepSomatic, который способен более точно выявлять мутации, связанные с раком, в генетической последовательности опухолей.
Сложности идентификации соматических вариантов
Генетика рака сложна. В то время как секвенирование генома может выявить вариации, связанные с раком, отличить реальные варианты от ошибок секвенирования затруднительно. Соматические мутации возникают после рождения под воздействием факторов окружающей среды или случайных ошибок при репликации ДНК. Они могут изменять нормальное поведение клеток, вызывая неконтролируемое деление и развитие рака.
Выявление таких мутаций особенно сложно из-за их низкой частоты внутри раковых клеток, которая иногда ниже уровня ошибок секвенирования.
Принцип работы DeepSomatic
Инструмент анализирует различия между секвенированными образцами опухолевых и нормальных клеток пациента. Глубокая нейронная сеть преобразует сырые данные секвенирования в изображения, представляющие различные параметры данных, включая выравнивание вдоль хромосом. Затем модель идентифицирует соматические мутации, отличая их от унаследованных вариантов и ошибок секвенирования.
DeepSomatic также работает в режиме «только опухоль», что полезно при отсутствии образцов здоровых тканей, например, при исследовании лейкемии.
Обучение точного инструмента анализа рака
Для обучения модели была создана база данных CASTLE, включающая образцы четырех случаев рака груди и двух легких, проанализированные тремя ведущими платформами секвенирования. Комбинируя результаты и удаляя ошибки платформ, исследователи получили точную эталонную базу данных.
В тестах на различных платформах DeepSomatic показал высокую точность, достигнув 90%-ного F1-показателя при анализе инделов на платформе Illumina и значительно превосходя другие инструменты на данных Pacific Biosciences.
Применение технологии ко всем видам рака
DeepSomatic успешно применялся для анализа других видов рака, не использовавшихся при обучении модели. Например, он обнаружил известные драйверные мутации в глиобластоме и выявил новые мутации в восьми образцах детской лейкемии.
Цель проекта – помочь исследователям и врачам лучше понимать индивидуальные опухоли, улучшать выбор существующих методов лечения и способствовать разработке новых терапевтических подходов.