Старший научный сотрудник лаборатории больших данных и машинного обучения Южно-Уральского государственного университета, профессор Сэчин Кумар разработал модель нейросети для распознавания опухолей мозга по изображениям магнитно-резонансной томографии (МРТ).
«Обучение нейросети проходило на общедоступном наборе из 3064 изображений МРТ от 230 пациентов, – рассказывает Сэчин Кумар. – Распознавались три вида опухолей: глиомы, менингиомы и опухоли гипофиза. Наша модель сочетает в себе элементы свёрточной и конволюционной нейронных сетей (U-net и CNN) для сегментации и классификации опухолей, что увеличило ее эффективность до точности более чем 99 %».
На наборе данных пациентов с уже подтверждённым диагнозом в 99,39 % была диагностирована болезнь, и лишь 0,61 % системой был ошибочно поставлен диагноз «здоровы».
Для такого результата нейросеть прошла 150 циклов обучения. Алгоритмы были реализованы на языке программирования Python.
«При обучении нейросети каждое изображение изначально сегментировалось на 9 частей, – объясняет суть технологии профессор. – Выстраивалось дерево опорных точек (VPT), просчитывались показатели ближайших соседей-пикселей, создавались метки, которые потом использовались для вычисления вероятностей».
Затем использовалась «свёрточная» сеть. «Свёрточная нейронная сеть (U-net) – особая архитектура для задач семантической сегментации, таких, как например, сегментация опухолей мозга. Она состоит из двух главных частей – кодера и декодера. Кодер собирает и редуцирует пространственную информацию в изображении с помощью сверточных слоев и операций объединения, в то время как декодер преобразует её для создания карты сегментации.
«Конволюционные нейронные сети (CNN), рекуррентные нейронные сети (RNN), свёрточные нейронные сети (U-Net), сети с долговременной и кратковременной памятью (LSTM) – это всё технологии глубокого обучения, – поясняет Сэчин Кумар. – В сущности, глубокое обучение полезно тогда, когда объем данных достаточно большой, и простые алгоритмы машинного обучения не справляются с ним за приемлемое время. Глубокое обучение обеспечивает высокую точность при работе именно с большими данными».
Профессор Кумар уверен в эффективности своей модели, однако предостерегает от поспешного её внедрения. И дело прежде всего …в географии.
«Общедоступные наборы данных собраны в конкретном регионе планеты, – поясняет Сэчин Кумар. – Но образ жизни и уровень жизни населения, экология, питание, качество воды и воздуха и другие экологические и медицинские параметры в каждой стране разные».
Поэтому нейросеть перед внедрением в больничную практику предстоит дополнительно обучить на данных МРТ конкретной страны или региона. Но это лишь пока.
«Целью проекта была разработка более точной модели – по сравнению с уже существующими. И нам это удалось, – говорит научный сотрудник. – Следующий шаг – сбор, объединение данных из других стран и, наконец, разработка некой универсальной модели, которую одобрят и внедрят для использования в больницах по всему миру».
Сэчин Кумар – один из семи сотрудников Южно-Уральского государственного университета, получивший премию «Признание ЮУрГУ – 2022», победитель в номинации «Наука». Его работа поддержана грантом Российского научного фонда. Со своим открытием он также принимал участие в проекте FENU-2020-0022 «Математические основы, модели и алгоритмы цифровой индустрии» под руководством профессора Леонида Соколинского, поддержанном Министерством образования РФ.