Top.Mail.Ru

Искусственный интеллект в диагностике хронического гнойного среднего отита: автоматический анализ отоэндоскопических изображений и перспективы клинического внедрения

Раздел только для специалистов в сфере медицины, фармации и здравоохранения!

Искусственный интеллект в диагностике хронического гнойного среднего отита: автоматический анализ отоэндоскопических изображений и перспективы клинического внедрения
Shutterstock AI/FOTODOM/Shutterstoсk
Оториноларингология Практика Оригинальная статья
Искусственный интеллект постепенно перестает быть футуристической концепцией и превращается в практический медицинский инструмент. Одно из направлений, где это особенно заметно, — автоматический анализ медицинских изображений. Причем речь идет уже не только о КТ, МРТ или рентгене, но и о более «кабинетных» исследованиях вроде отоэндоскопии.
О чём статья

Авторы этой обзорной статьи показывают, как современные нейросетевые модели учатся распознавать хронический гнойный средний отит и другие заболевания уха по обычным эндоскопическим снимкам. В ряде исследований точность алгоритмов уже приблизилась к уровню опытных ЛОР-врачей, а иногда даже превысила показатели неспециалистов. Особенно важным это может оказаться для удаленных регионов, где доступ к оториноларингологам ограничен.

Из статьи вы узнаете:
  • как дефицит врачей подталкивает медицину к автоматизированным диагностическим системам;
  • чем машинное обучение отличается от классического программирования;
  • как нейросети «учатся» распознавать болезни по изображениям;
  • что такое сверточные нейронные сети (CNN) и почему именно они стали основой медицинского компьютерного зрения;
  • как ИИ уже используется в диагностике диабетической ретинопатии, опухолей молочной железы и рака легкого;
  • какие типы заболеваний уха современные алгоритмы умеют различать по изображениям барабанной перепонки;
  • почему некоторые нейросети анализируют не только общую картину, но и отдельные «подозрительные» участки изображения;
  • в каких исследованиях ИИ показал результаты на уровне опытных оториноларингологов;
  • почему для медицинского ИИ критически важны большие аннотированные базы данных;
  • смогут ли нейросети заменить врача.
Журнал: «Медицинский совет» №6/2026
Авторы
В.С. Исаченко1,2, Ш.И. Алиева1, Ш.Х. Туйчиев2,
С.С. Высоцкая1, В.А. Коротаева3, Л.Л. Гилязова3
1 Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи; 190013, Россия, Санкт-Петербург, ул. Бронницкая, д. 9
2 Санкт-Петербургский государственный университет; 199034, Россия, Санкт-Петербург, Университетская наб., д. 7/9
3 ООО «Клиника ухо, горло, нос»; 614010, Россия, Пермь, ул. Клары Цеткин, д. 9

Резюме

Хронический гнойный средний отит – распространенная патология ЛОР-органов, приводящая к стойкой тугоухости и вторичным внутричерепным осложнениям. Учитывая нехватку квалифицированных медицинских кадров, особенно на периферии, представляется крайне важным внедрение автоматизированных систем для диагностики данного состояния. Настоящее исследование посвящено рассмотрению актуальных методик использования искусственного интеллекта (ИИ) в процессе изучения отоэндоскопических снимков, полученных при диагностике хронического гнойного среднего отита. Рассмотрены ключевые исследования, демонстрирующие эффективность машинного обучения, включая архитектуры cверточных нейронных сетей и ансамблевые модели, достигающие точности до 95–97% в дифференциации патологий среднего уха. Особое внимание уделено сравнению результатов искусственного интеллекта с диагностикой врачей: алгоритмы превосходят неспециалистов и сопоставимы с опытными оториноларингологами. Уделено внимание обсуждениям проблем неоднородности данных, ограниченности выборок редких форм хронического гнойного среднего отита и зависимости результата от качества изображений. Оценен потенциал мобильных приложений на базе искусственного интеллекта для телемедицины, а также освещена необходимость создания масштабных аннотированных баз данных для обучения моделей. Интеграция искусственного интеллекта в медицинскую сферу обещает значительное повышение качества и доступности медицинской помощи. Применение ИИ-решений в клинической области может привести к существенному усовершенствованию процедур раннего выявления заболевания, что, в свою очередь, позволит своевременно принимать необходимые меры. Одновременно с этим внедрение данных систем способно ощутимо снизить уровень рабочей нагрузки, испытываемой медицинским персоналом, освобождая их для выполнения более сложных и ответственных задач. Кроме того, использование передовых алгоритмов ИИ может минимизировать вероятность возникновения нежелательных осложнений, что особенно важно для удаленных территорий и регионов, где доступ к узкоспециализированной медицинской помощи зачастую ограничен.


Ключевые слова: cверточные нейронные сети, обработка биомедицинских изображений, компьютерная томография, ансамблевые модели, точность диагностики, машинное обучение, эндоскопические изображения, доступность медицинской помощи


Для цитирования: Исаченко ВС, Алиева ШИ, Туйчиев ШХ, Высоцкая СС, Коротаева ВА, Гилязова ЛЛ. Искусственный интеллект в диагностике хронического гнойного среднего отита: автоматический анализ отоэндоскопических изображений и перспективы клинического внедрения. Медицинский совет. 2026;20(6):152–160. https://doi.org/10.21518/ms2026-113.


Конфликт интересов: авторы заявляют об отсутствии конфликта интересов.


English version / Abstract & Authors

Artificial intelligence in the diagnosis of chronic purulent otitis media: Automatic analysis of otoendoscopic images and prospects for clinical implementation

Vadim S. Isachenko1,2, Shuanet I. Alieva1, Shokhrukh Kh. Tuychiev2,
Svetlana S. Vysockaya1, Vladlena A. Korotaeva3, Larisa L. Gilyazova3

1 Saint Petersburg Research Institute of Ear, Throat, Nose and Speech; 9, Bronnitskaya St., St Petersburg, 190013, Russia
2 Saint Petersburg State University; 7–9, Universitetskaya Emb., St Petersburg, 199034, Russia
3 LLC "Clinic Ear, Throat, Nose"; 9, Klara Zetkin St., Perm, 614010, Russia

Abstract

Chronic suppurative otitis media is a common ENT disorder leading to persistent hearing loss and secondary intracranial complications. Given the shortage of qualified medical personnel, especially in the periphery, the implementation of automated systems for diagnosing this condition is crucial. This study examines current methods for using artificial intelligence in the analysis of otoendoscopic images obtained during the diagnosis of chronic suppurative otitis media. Key studies demonstrating the effectiveness of machine learning are considered, including architectures of convolutional neural networks and ensemble models that achieve accuracy of up to 95–97% in differentiating middle ear pathologies. Special attention is paid to comparing the results of artificial intelligence with the diagnostics of doctors: the algorithms are superior to non-specialists and comparable to experienced otorhinolaryngologists. Attention is paid to discussing the problems of heterogeneity of data, limited samples of rare forms of chronic purulent otitis media and the dependence of the result on image quality. The potential of mobile applications based on artificial intelligence for telemedicine is assessed, and the need to create large-scale annotated databases for model training is highlighted. The integration of artificial intelligence into medicine promises to significantly improve the quality and accessibility of medical care. The use of AI solutions in clinical settings can significantly improve early disease detection procedures, which, in turn, will enable timely intervention. At the same time, the implementation of these systems can significantly reduce the workload of medical personnel, freeing them up to perform more complex and demanding tasks. Furthermore, the use of advanced AI algorithms can minimize the likelihood of unwanted complications, which is especially important for remote areas and regions where access to highly specialized medical care is often limited.

Keywords: convolutional neural networks, biomedical image processing, computed tomography, ensemble models, diagnostic accuracy, machine learning, endoscopic images, access to health care

For citation: Isachenko VS, Alieva ShI, Tuychiev ShKh, Vysockaya SS, Korotaeva VA, Gilyazova LL. Artificial intelligence in the diagnosis of chronic purulent otitis media: Automatic analysis of otoendoscopic images and prospects for clinical implementation. Meditsinskiy Sovet. 2026;20(6):152–160. (In Russ.) https://doi.org/10.21518/ms2026-113

Conflict of interest: the authors declare no conflict of interest.


Введение

Хронический гнойный средний отит (ХГСО) – одна из наиболее часто встречаемых патологий ЛОР-органов. Распространенность ХГСО в нашей стране составляет от 8,4 до 39,2 случая на 1000 населения и не имеет заметной тенденции к снижению, поэтому ранняя и правильная диагностика является не только медицинской, но и социальной проблемой. Это сопряженно в первую очередь с тем, что ХГСО является одной из основных причин тугоухости и тяжелых внутричерепных осложнений, которые могут серьезно повлиять на прогноз и качество жизни пациентов. Рассматриваемое состояние представляет собой затяжной воспалительный процесс в среднем ухе, который определяется стойким дефектом барабанной перепонки. Отличительными признаками являются непрекращающееся или эпизодически возобновляющееся выделение гноя из слухового прохода, а также неуклонное ухудшение слуховой функции, длящееся свыше трех месяцев.

Согласно Международной классификации болезней (МКБ-10), по клиническому течению и тяжести заболевания принято различать две формы ХГСО:

  • мезотимпанит (туботимпанальный гнойный средний отит);

  • эпитимпанит (хронический эпитимпано-антральный гнойный средний отит).

Основное отличие заключается в характере вовлечения структур среднего уха. При мезотимпаните преобладает поражение слизистой оболочки, локализующееся преимущественно в мезо- и гипотимпанальных отделах барабанной полости. В отличие от этого эпитимпанит характеризуется распространением патологического процесса из эпитимпанального пространства в воздухоносные ячейки сосцевидного отростка. Этот процесс зачастую сопровождается деструктивными изменениями костных структур среднего уха [1].

Освещение проблематики диагностики хронического гнойного среднего отита

В отоларингологии вопрос ранней диагностики и надлежащей терапии больных с поражением структур среднего уха сохраняет свою значимость, что стимулирует исследователей к разработке усовершенствованных средств диагностики [2, 3].

Ключевые элементы диагностики ХГСО включают следующее: сбор жалоб и анамнеза, осмотр ЛОР-органов вместе с отомикроскопией (отоэндоскопией), проведение компьютерной томографии височных костей. Тем не менее среди всех существующих диагностических методик отоэндоскопия выделяется своей исключительной информативностью и отсутствием инвазивности [4–7]. ХГСО имеет характерную отоскопическую картину, по которой можно оценить: количество и характер отделяемого в слуховом проходе и барабанной полости, наличие дефекта барабанной перепонки и/или ее ретракцию, изменение слизистой оболочки медиальной стенки (от гиперплазии до полипа), состояние окон лабиринта, кариозную деформацию латеральной стенки аттика, рукоятки молоточка и наковальни, выявить грануляции и холестеатому [8]. Диагностика ХГСО и его форм возможна уже на амбулаторном этапе благодаря отоэндоскопии. Тем не менее главной проблемой для своевременного выявления заболевания в Российской Федерации является существенный недостаток квалифицированных медицинских специалистов. Нехватка кадров особенно остро ощущается в удаленных регионах страны. Большая часть опытных специалистов сконцентрирована в больничных учреждениях в крупных мегаполисах, а первичное звено здравоохранения в сельской местности страдает от дефицита медицинского персонала [9–11], что спровоцировано высоким уровнем нагрузки, низкой оплатой труда, отсутствием необходимого оборудования, а также, что немаловажно, комфортных условий для жизни специалистов.

Это создает необходимость в поиске новых подходов к диагностике, включая использование машинного обучения, которое может помочь в автоматизации анализа отоэндоскопических изображений и повысить точность диагностики даже в условиях ограниченного ресурса специалистов.

Описание технологии машинного обучения

В традиционном программировании процесс выглядит следующим образом: на вход подаются определенные правила и информация, а на выходе мы получаем результаты. Правила формулируются на языке программирования, а входные данные могут поступать из разнообразных источников, начиная от локальных переменных и заканчивая базами данных. Однако такой подход, основанный на явном выражении правил, не всегда пригоден для решения сложных задач. Например, в области компьютерного зрения реализация программ на основе правил становится чрезвычайно трудоемкой.

Альтернативным решением является предоставление компьютеру большого объема данных, которые были предварительно описаны или размечены для распознавания. Учитывая способность компьютеров эффективно обрабатывать информацию и выявлять закономерности, становится возможным «обучить» систему решать поставленную задачу.

Машинное обучение меняет эту парадигму: на вход подаются данные и ожидаемые результаты, а на выходе система генерирует правила. Иными словами, компьютер получает примеры того, что ему нужно распознавать, и на основе этих данных самостоятельно формирует правила. Этот метод особенно ценен для задач, где разработка правил человеком затруднительна или невозможна. Новая парадигма предполагает сначала подготовку массива примеров, который затем соответствующим образом размечается, чтобы установить соответствие между объектом на изображении и его классом. Эти данные служат входом и выходом для правил, выводимых машиной. Алгоритм машинного обучения ищет специфические закономерности в каждом наборе данных, определяющие отличия между ними. Применяя эти выявленные закономерности к новым, неразмеченным данным, машина способна идентифицировать содержимое изображения. В этом и заключается суть данного подхода к программированию. Это выходит за рамки простого усовершенствования известных методик, открывая ранее недоступные возможности. В настоящее время нейронные сети доминируют в области машинного обучения, хотя существует и множество других алгоритмов. Сверточные нейронные сети (CNN) представляют собой пример инновационного подхода, использующего математические методы для распознавания объектов на изображениях на основе значений пикселей.

CNN представляют собой специфический тип нейронных сетей, оптимизированный для глубокого анализа данных, преимущественно двухмерных и трехмерных, таких как RGB-изображения. Основное их назначение заключается в решении задач, например, связанных с идентификацией объектов на визуальном материале. Концепция архитектуры подобных сетей была впервые представлена французским исследователем в области искусственного интеллекта и машинного обучения Яном Лекуном в конце 1980-х гг. XX в. [12–15].

Нейронные сети в медицине. Анализ исследований

В условиях возрастающей потребности в квалифицированной медицинской помощи возникает острая необходимость в разработке и внедрении новаторских методов диагностики. Применение технологий машинного обучения становится перспективным направлением для решения этой задачи, в частности, благодаря его потенциалу в автоматизации процесса анализа полученных отоэндоскопических изображений. Интеграция таких систем способна не только существенно ускорить диагностический процесс, но и повысить его объективность и точность. Это особенно актуально в регионах с дефицитом высококвалифицированных медицинских специалистов, где автоматизированные системы могут служить ценным инструментом поддержки принятия врачебных решений и компенсации недостатка ресурсов.

В настоящее время под искусственным интеллектом (ИИ) принято понимать одно из направлений информационных технологий, которое связано с изучением и разработкой систем, моделирующих возможности человеческого интеллекта, таких как способность к обучению, логическому рассуждению, выводу и принятию решений [16, 17].

В последние годы глубокое обучение стало многообещающим методом для распознавания и классификации изображений и является основой автоматического восприятия, обработки и принятия решений в области компьютерного зрения. Глубокое обучение уже нашло применение в нескольких областях медицинской визуализации, например, в разработке алгоритма глубокого обучения для детекции диабетической ретинопатии на фотографиях сетчатки или для компьютерной помощи в обнаружении заболеваний молочной железы, рака легкого [18–25].

Кроме того, глубокое обучение активно используется в классификации заболеваний наружного, среднего и внутреннего уха. В этих применениях глубокие CNN играют важную роль в распознавании и классификации изображений. Для обучения моделей глубоких CNN требуется очень мало предварительных профессиональных знаний. Некоторые предварительно обученные глубокие CNN могут конкурировать или даже превосходить результаты, полученные с использованием традиционных ручных характеристик. По сравнению с обычными спектральными классификаторами глубокие CNN достигают более высокой точности в задачах распознавания изображений благодаря миллионам параметров на множестве слоев, хотя обучение таких моделей требует больших вычислительных ресурсов [26].

В регионах с ограниченным доступом к специалистам-отоларингологам системы ИИ для диагностики заболеваний уха могут стать ценным инструментом для медицинского персонала. Помимо этого, интеграция таких технологий способна перераспределить нагрузку на врачей, позволяя медицинским сестрам проводить первичный осмотр пациентов с ушными патологиями, используя автоматизированные диагностические модели. В области отологии уже разработаны модели машинного и глубокого обучения, способные автоматически ставить диагнозы на основе анализа отоскопических изображений.

Примером применения алгоритмов машинного обучения является исследование Майбурга и его коллег, где была разработана автоматизированная система для выявления пяти форм среднего отита. Система была протестирована на базе данных из 389 изображений уха, полученных с помощью видеоэндоскопа. Результаты показали, что точность диагностики при использовании дерева решений составила 81–58%, а при использовании нейронной сети – 86–84% [27, 28].

Специалисты из Аргентины и Чили в рамках научного исследования выполнили анализ воздействия цветовых излучений разной длины волны на исследуемую модель предназначенную для категоризации четырех состояний среднего и наружного уха. Выделены следующие состояния: нормальное, средний отит с выпотом, экссудативный средний отит и наличие серной пробки. Созданная модель базируется на системе автоматизированной диагностики, реализованной с применением архитектуры CNN. Данная модель CNN была специально разработана и обучена с целью корректной классификации упомянутых четырех патологических и физиологических состояний уха. Для анализа использовались изображения в RGB-формате, а также отдельные каналы (красный, зеленый и синий). Архитектура CNN была основана на VGG-16. Наиболее высокие показатели эффективности продемонстрировала модель, обученная на данных зеленого цветового канала, достигнув следующих показателей: точность – 92%, чувствительность – 85%, специфичность – 95% и F1-оценка – 85%. Следует отметить, что модели, работающие с красным и синим каналами, показали значимые результаты в диагностике отдельных состояний: красный канал превосходил в выявлении ЭСО, а синий – в обнаружении серных пробок. По данным исследования можно заключить, что применение мультиспектрального анализа изображений предоставляет значительное преимущество по сравнению со стандартной отоскопией, в частности, за счет улучшенной визуализации структур среднего уха и повышения контрастности. Несмотря на отсутствие на текущий момент коммерчески доступных мультиспектральных отоскопов, полученные результаты свидетельствуют о высоком потенциале описанной методики в отоларингологии [29, 30].

Например, в работе D. Cha [31] проанализировано 10 544 отоэндоскопических изображения, охватывающих основные патологии барабанной перепонки (БП) и наружного слухового прохода (НСП). Изображения разделены на шесть категорий: нормальные состояния (нормальная БП, зажившая перфорация, тимпаносклероз) и аномальные (опухоли, средний отит с выпотом, эрозии БП, перфорация БП, ретракция аттика/ателектаз). Для балансировки данных некоторые подклассы были объединены в более крупные категории.

Использовались дополнительные клинические данные, включая результаты аудиометрии, импедансометрии и визуализации (КТ, МРТ). Для обучения применялись модели глубокого обучения, предварительно обученные на ImageNet. Лучшие результаты показали Inception-V3 и ResNet101, на основе которых создан ансамблевый классификатор с точностью 93,73%. Отсюда следует, что трансферное обучение позволяет эффективно анализировать медицинские изображения даже на небольших наборах данных.

Группа ученых из Нью-Йоркского технологического института, Университета Чжуншань и Бристольского университета объединили результаты двух CNN для классификации изображений БП на три категории: нормальная БП, экссудативный средний отит (ЭСО) и ХГСО в стадии воспаления и ремиссии [24]. На первом этапе сеть анализировала все изображения, а на втором – фокусировалась на дискриминационном сегменте БП, определяемом автоматически с помощью метода Class Activation Maps (CAM). Этот подход имитирует систему зрительного внимания человека, когда отоларинголог сначала оценивает общий вид, а затем концентрируется на ключевых участках. Для сбора данных использовался 4-миллиметровый эндоскоп STORZ. Изображения ХГСО маркировались на основе хирургических находок или послеоперационных отчетов. Для оценки точности модели привлекли пять врачей с разным опытом, которые классифицировали 1 080 изображений (по 270 на каждый тип). Точность составила: ведущие специалисты – 91,02 и 87,50%, лечащие врачи – 86,57 и 79,44%. Эффективность модели оценивалась с помощью ROC-кривых на основе ResNet50. При классификации нормальной БП и ЭСО результаты неопытного врача значительно уступали опытным коллегам. В более сложной задаче – различении ХГСО в стадии воспаления и ремиссии – только один лечащий врач превзошел предложенный метод. Используя 6 066 изображений, система с главным и фокальным классификаторами, а также CAM достигла точности 93,37%. Однако авторы отмечают ограничения: отсутствие данных о медицинской истории и слухе, а также использование изображений только после очистки слухового канала, что может снизить точность в реальных условиях [32].

Для обучения девяти CNN группа международных авторов использовала 20,542 эндоскопических изображения, классифицированных на восемь типов заболеваний ушей [26]:

  • физиологическая отоскопическая картина;

  • холестеатома среднего уха/хронический гнойный средний отит;

  • кровотечение из НСП;

  • закупорка НСП ушной серой;

  • отомикоз;

  • секреторный средний отит;

  • кальциноз барабанной перепонки.

Изображения, полученные с помощью эндоскопов и цифровых камер, имели разрешение 586 × 583 пикселя, но были обрезаны и масштабированы до 448 × 448 пикселей для унификации. Данные разделили на обучающую (80%) и валидационную (20%) выборки без пересечений. Для классификации использовали архитектуры ResNet, DenseNet и Inception с методами регуляризации, аугментации данных и глобальным усреднением для предотвращения переобучения. Оценка проводилась по кривым чувствительности, специфичности, матрицам путаницы и общей точности. Лучшие результаты показали DenseNet-BC1615 (точность 95,099%) и DenseNet-BC169 (94,541%). Их объединили в ансамблевый классификатор, достигший точности 95,59%. Ансамблевый подход улучшил диагностику, т. к. одна модель компенсировала ошибки другой. Это подтверждает потенциал глубокого обучения в клинической практике, особенно для неотложной помощи, где точность критически важна. Основной акцент сделан на классификации изображений барабанных перепонок и наружных слуховых проходов на основе цветовых и структурных особенностей, описанных в цветном атласе эндоотоскопии.

В ряде систематических обзоров проведено сравнение способности ИИ в классификации заболеваний среднего уха с возможностями врача общей практики, врача-стажера по профилю «педиатрия и неотложная помощь». Так, например, D. Livingstone et al. [33] для анализа тестовой выборки, состоящей из 89 изображений (по 14 диагностическим категориям), привлекли десять врачей: специалисты общей практики, клинические ординаторы, педиатры, врачи скорой медицинской помощи, а также специалистыоториноларингологи. Результаты оценок, данных всеми привлеченными специалистами, были агрегированы без разделения по медицинским профилям. По совокупности результатов алгоритм продемонстрировал более высокую точность, чем каждый из экспертов, в 12 из 14 классов (точность алгоритма 88,7% против средней точности экспертов 58,9%).

В схожем исследовании [34] рассматривается инновационное применение современных архитектур сверточных нейронных сетей, в частности DenseNet, для задачи автоматической диагностики инфекционных поражений барабанной перепонки и полости среднего уха. Для проведения экспериментов была сформирована база из 2 484 отоэндоскопических изображений, распределенных по трем диагностическим категориям: нормальное состояние, хронический средний отит, сопровождающийся перфорацией барабанной перепонки, и экссудативный средний отит. Полученные авторами данные свидетельствуют о высоком потенциале методов глубокого обучения на основе сверточных сетей для автоматического распознавания патологий наружного и среднего уха. Предложенная модель продемонстрировала конкурентоспособную точность на уровне 95% при дифференциации наружного отита и наличия выпота в среднем ухе от иных инфекций наружного уха. Кроме показателя точности, метод обеспечил исключительно высокое значение средней площади под ROC-кривой (AUROC), приближающееся к 0,99. Эти количественные результаты указывают на высокую эффективность системы в идентификации указанных патологических состояний. Для интерпретации решений модели использовалась визуализация методом картирования активации классов (Class Activation Mapping, CAM). Данный анализ подтвердил, что прогнозы модели формируются на основе релевантных областей на отоэндоскопических изображениях, фокусируясь на морфологических признаках, значимых для клинической диагностики. Совокупность полученных результатов – высокая метрическая эффективность и корректная фокусировка внимания модели – подтверждает надежность и обоснованность разработанного подхода.

В работе, проведенной исследователями из Южной Кореи [35], было установлено, что алгоритм, предназначенный для классификации изображений по четырем категориям, использующий архитектуру ResNet-18 в сочетании с моделью «перетасованного внимания», продемонстрировал превосходство над результатами, полученными десятью врачами-ординаторами первого и второго года обучения. Экспериментальная группа, в которую входили указанные ординаторы, достигла точности классификации в 82,9%, в то время как разработанный алгоритм показал результат в 97,1% при определении нормальных состояний, ЭСО, ХГСО или холестеатомы.

В систематическом обзоре, выполненном А. Habib, М. Kajbafzadeh, Z. Hasan [36], проанализировано 39 работ, посвященных оценке эффективности 9 бинарных и 17 многоклассовых алгоритмов. Алгоритмы искусственного интеллекта в области компьютерного зрения продемонстрировали впечатляющие результаты: точность 90,7% (основываясь на 14 исследованиях) при различении нормальных и патологических отоскопических изображений, а также 97,6% (по данным 3 исследований) при классификации нормальных изображений, острых средних отитов и ЭСО. В трех сравнительных исследованиях алгоритмы ИИ показали превосходство над специалистами-людьми в классификации отоскопических изображений, достигнув точности 93,4% по сравнению с 73,2% при ручной оценке. Фокусировка на БП и локализации анатомических или патологических характеристик с использованием моделей сегментации позволила значительно повысить точность при рассмотрении различных заболеваний среднего уха. Алгоритмы компьютерного зрения на основе ИИ зависят от высококачественных обучающих данных с точными и надежными метками. Идеально, если метки «истинных» данных определяются консенсусом нескольких независимых экспертов и/или дополнительными доказательствами (например, клинической историей, гистопатологией или результатами независимых исследований). Для отоскопии «истинные» данные могут основываться на экспертной оценке изображений вместе с клинической историей, тимпанометрией, аудиометрией или результатами миринготомии. В большинстве исследований, включенных в обзор, использовались отоскопические изображения, классифицированные одним оториноларингологом во время амбулаторных осмотров.

В исследовании, ретроспективно выполненном специалистами Тайбэйской больницы [37], были собраны и анонимизированы отоэндоскопические снимки в период с 1 января 2011 г. по 31 декабря 2019 г. После этапов предварительной обработки и разделения на выборки изображения послужили входными данными для обучения архитектур сверточных нейронных сетей. С целью автоматизированной дифференциальной диагностики патологий среднего уха было разработано и обучено девять отдельных CNN-моделей для распознавания соответствующих патологий. Наиболее производительные из этих моделей были интегрированы в компактную CNN-сеть, оптимизированную для развертывания на мобильных платформах. Данную предобученную модель конвертировали в мобильное приложение. Клиническую ценность оценили по способности детектировать и категоризировать десять различных заболеваний среднего уха на основе отоэндоскопических изображений. Для визуализации и интерпретации ключевых диагностических признаков, на которые ориентируется CNN-сеть при классификации, использовали метод построения карт активации классов CAM. Рабочие характеристики каждого классификатора количественно оценивали по метрикам: точность, полнота, чувствительность и F-меры. Для обучения алгоритмов было использовано в общей сложности 2 820 клинических изображений барабанных перепонок. Финальное приложение продемонстрировало высокую точность в решении двух задач: бинарной классификации исходов («норма/требуется консультация специалиста») и мультиклассовой классификации по десяти категориям заболеваний. После процедуры оптимизации гиперпараметров точность модели достигла 98,0%. Кроме того, разработанное приложение характеризуется быстрым процессом анализа, интуитивно понятным интерфейсом и высокой стабильностью работы, сохраняя точность на уровне 97,6% в реальных условиях. Для объективной оценки была разработана специализированная анкета, содержащая 50 вопросов по патологиям среднего уха, которую предложили врачам с различным уровнем клинического опыта. Точность диагностики, обеспечиваемая мобильным алгоритмом на основе искусственного интеллекта, в целом превзошла показатели врачей общей практики, клинических ординаторов и сертифицированных оториноларингологов (36,0, 80,0 и 90,0% соответственно). Полученные данные свидетельствуют о том, что предложенная автоматизированная система способна формировать лечебно-диагностические рекомендации, сопоставимые по качеству с заключениями врачей-экспертов.

В исследовании, проведенном китайскими учеными [38], ставилась задача создания и последующей проверки эффективности глубокой нейронной сети для автоматического выявления ретракционных карманов аттика и признаков ателектаза у пациентов с ЭСО, используя для этого отоскопические снимки из нескольких медицинских центров. Для обучения и оценки модели был применен набор из 6 393 отоскопических изображений. Распределение данных было следующим: ретракционные карманы аттика присутствовали на 3 564 снимках (55,74%), а ателектаз был обнаружен на 2 460 изображениях (38,48%). В результате валидации модель продемонстрировала среднюю точность на уровне 89% при детекции ретракционного кармана аттика и 79% – для ателектаза. Применение карт активации классов подтвердило, что алгоритм фокусируется на релевантных патологических областях, визуализируя их красным цветом на тепловых картах. Тем не менее авторы отмечают, что ограниченное количество снимков с выраженными стадиями как ателектаза, так и ретракционных карманов аттика не позволило реализовать более детальную классификацию по степени тяжести. Кроме того, на итоговую точность модели могли повлиять ретроспективный дизайн исследования и существенная неоднородность исходного материала по качеству изображений.

В рамках совместной работы исследователей колледжа компьютерной инженерии (Саудовская Аравия) и факультета программной инженерии (Самсунский университет, Турция) была представлена новая система, предназначенная для автоматизированной поддержки принятия решений. Система основана на использовании СНС. Для повышения обобщающей способности в архитектуру сети были включены механизм внимания (CBAM), остаточные блоки и метод гиперстолбцов. Эксперименты проводились с применением общедоступного набора данных, который состоял из 956 отоскопических изображений барабанных перепонок, распределенных по пяти различным категориям. Разработанная модель продемонстрировала высокие результаты в задачах классификации. Общая точность достигла 98,26%, чувствительность составила 97,68%, а специфичность – 99,30%. Проведенный сравнительный анализ выявил, что эффективность предложенной модели превосходит показатели ранее обученных СНС, включая AlexNet, VGG-Net, GoogLeNet и ResNet. Полученные результаты подтверждают, что СНС, усовершенствованные современными методами обработки изображений, могут служить эффективным инструментом для диагностики вариаций среднего отита. Представленная авторами модель способна оказывать содействие медицинским специалистам в достижении точных результатов, снижении вероятности диагностических ошибок и обоснованной поддержке клинических решений [39].

Обсуждение

Несмотря на растущие актуальность и успех в области машинного обучения в диагностике заболеваний уха, до сих пор отсутствуют крупномасштабные исследования, которые бы охватывали обширную базу отоскопических изображений при ХГСО. Большинство существующих работ ограничены небольшими наборами данных, что не позволяет в полной мере оценить потенциал ИИ для диагностики этого заболевания. Учитывая высокую распространенность ХГСО среди патологий ЛОР-органов, сохраняется острая необходимость в создании масштабных и репрезентативных баз данных отоскопических изображений, которые могли бы стать основой для разработки более точных и надежных алгоритмов машинного обучения.

Для прогресса в данной сфере требуется устранение существующих проблем, таких как неоднородность качества данных и недостаток изображений редких и тяжелых форм ХГСО. Создание крупных, аннотированных баз данных отоскопических изображений, включающих разнообразные случаи ХГСО, станет ключевым шагом для разработки более совершенных моделей машинного обучения.

Заключение

Внедрение ИИ в клиническую практику может значительно улучшить раннюю диагностику ХГСО, снизить риск осложнений и улучшить качество жизни пациентов. Это особенно важно в условиях растущей нагрузки на систему здравоохранения и дефицита специалистов. Таким образом, развитие и внедрение автоматизированных систем диагностики на основе ИИ является не только перспективным направлением в медицине, но и важным шагом к решению социально значимых проблем, связанных с заболеваниями уха.


Список литературы / References
  1. Гаров ЕВ, Диаб ХМ, Карнеева ОВ, Юнусов АС, Аникин ИА, Завалий МА и др. Хронический средний отит: клинические рекомендации. 2024. Режим доступа: https://cr.minzdrav.gov.ru/.
  2. Хатамов ЖА, Амонов ШЭ, Насретдинова МТ, Хайитов АА. Основные направления в диагностике и лечении осложненных форм хронического гнойного среднего отита. Оториноларингология. Восточная Европа. 2024;(3):358–367. doi: 10.34883/PI.2024.14.3.018. / Khatamov JA, Amonov Sh, Nasretdinova MT, Khaitov AA. Main Directions in Diagnostics and Treatment of Complicated Forms of Chronic Purulent Otitis Medium. Otolaryngology. Eastern Europe. 2024;(3):358–367. (In Russ.) doi: 10.34883/PI.2024.14.3.018.
  3. Гаров ЕВ, Гарова ЕЕ. Cовременные принципы диагностики и лечения пациентов с хроническим гнойным средним отитом. РМЖ. 2012;(27):1355–1359. Режим доступа: https://www.rmj.ru/. / Garov EV, Garova EE. Modern principles of diagnosis and treatment of patients with chronic suppurative otitis media. RMJ. 2012;(27):1355–1359. (In Russ.) Available at: https://www.rmj.ru/.
  4. Дементьева Н, Шиленков А. Сравнительная оценка диагностических возможностей отоскопии, отомикроскопии, отоэндоскопии у пациентов с хроническими заболеваниями среднего уха. Кремлевская медицина. Клинический вестник. 2014;(1):18–22. Режим доступа: https://kremlin-medicine.ru/. / Dementieva N, Shilenkov A. Comparative assessment of the diagnostic capabilities of otoscopy, otomicroscopy, otoendoscopy in patients with chronic middle ear diseases. Kremlin Medicine. Clinical Bulletin. 2014;(1):18–22. (In Russ.) Available at: https://kremlin-medicine.ru/.
  5. Дементьева НФ, Шиленков АА, Козлов BC. Отоэндоскопия в диагностике хронических заболеваний среднего уха. Вестник оториноларингологии. 2010;(1):71–75. Режим доступа: https://www.mediasphera.ru/. / Dement’eva NF, Shilenkov AA, Kozlov VS. Otoendoscopy for the diagnosis of chronic middle ear diseases. Vestnik Otorinolaringologii. 2010;(1):71–75. (In Russ.) Available at: https://www.mediasphera.ru/.
  6. Новожилов АА, Шилягин ПА, Шахов АВ, Геликонов ВМ. Обзор современных методов диагностики экссудативного среднего отита. Вестник оториноларингологии. 2020;85(3):68–74. doi: 10.17116/otorino20208503168. / Novozhilov AA, Shilyagin PA, Shakhov AV, Gelikonov VM. Overview of modern methods for the diagnosis of exudative otitis media. Vestnik Otorinolaringologii. 2020;85(3):68–74. (In Russ.) doi: 10.17116/otorino20208503168.
  7. Агеенко ИВ. Трансмеатальная аэродинамическая отоэндоскопия при среднем отите. Вестник оториноларингологии. 2012;77(5):31–33. Режим доступа: https://www.mediasphera.ru/. / Ageenko IV. Transmeatal aerodynamical otoendoscopy for otitis media. Vestnik Otorinolaringologii. 2012;77(5):31–33. (In Russ.) Available at: https://www.mediasphera.ru/.
  8. Гаров ЕВ. Хронический гнойный средний отит: терминология, диагностика и лечебная тактика. РМЖ. 2011; 6):390–393. Режим доступа: https://www.rmj.ru/. / Garov EV. Chronic suppurative otitis media: terminology, diagnostics and treatment tactics. RMJ. 2011;(6):390–393. (In Russ.) Available at: https://www.rmj.ru/.
  9. Поздеева ТВ, Кочкурова ЕА, Дощанникова ОА, Носкова ВА, Кочкуров АС. Комплексный подход к проблеме кадрового обеспечения медицинских организаций сельской местности в Нижегородской области. Профилактическая медицина. 2020;23(5):25–32. doi: 10.17116/profmed20202305125. / Pozdeeva TV, Kochkurova EA, Doschannikova OA, Noskova VA, Kochkurov AS. An integrated approach to the problem of staffing medical organizations in rural area in the region of Nizhny Novgorod. Profilakticheskaya Meditsina. 2020;23(5):25–32. (In Russ.) doi: 10.17116/profmed20202305125.
  10. Калининская АА, Сон ИМ, Шляфер СИ. Проблемы и перспективы развития сельского здравоохранения. Проблемы социальной гигиены, здравоохранения и история медицины. 2019;(2):152–157. Режим доступа: https://journal-nriph.ru/. / Kalininskaya AA, Son IM, Shlyafer SI. The problems and perspectives of development of rural health care. Problems of Social Hygiene, Public Health and History of Medicine. 2019;(2):152–157. (In Russ.) Available at: https://journal-nriph.ru/.
  11. Королева ГП, Лукьянова ВВ. Проблема кадрового обеспечения средним медицинским персоналом в бюджетных организациях здравоохранения (на примере Самарской области). Эксперт: теория и практика. 2020;6(9):76–79. doi: 10.24411/2686-7818-2020-10058. / Koroleva GP, Lukyanova VV. The problem of middle-grade medical staffing in budgetary health organizations (The case of Samara region). Expert: Theory and Practice. 2020;6(9):76–79. (In Russ.) doi: 10.24411/2686-7818-2020-10058.
  12. LeCun Y, Boser B, Denker JS, Henderson D, Howard RE, Hubbard W. Backpropagation Applied to Handwritten Zip Code Recognition. Neural Computation. 1989;1(4):541–551. doi: 10.1162/neco.1989.1.4.541.
  13. Бредихин АИ. Алгоритмы обучения сверточных нейронных сетей. Вестник Югорского государственного университета. 2019;(1):41–54. doi: 10.17816/byusu20190141-54. / Bredikhin AI. Training algorithms for convolutional neural networks. Yugra State University Bulletin. 2019;(1):41–54. (In Russ.) doi: 10.17816/byusu20190141-54.
  14. Скрипачев ВО, Гуйда МВ, Гуйда НВ, Жуков АО. Исследование сверточных нейронных сетей для обнаружения объектов на аэрокосмических снимках. International Journal of Open Information Technologies. 2022;10(7):54–64. Режим доступа: https://www.injoit.org/. / Skripachev VO, Guida MV, Guida NV, Zhukov AO. Investigation of convolutional neural networks for object detection in aerospace images. International Journal of Open Information Technologies. 2022;10(7):54–64. (In Russ.) Available at: https://www.injoit.org/.
  15. Скрипачев ВО, Гуйда МВ, Гуйда НВ, Жуков АО. Особенности работы сверточных нейронных сетей. International Journal of Open Information Technologies. 2022;10(12):53–61. Режим доступа: https://www.injoit.org/. / Skripachev VO, Guida MV, Guida NV, Zhukov AO. Features of convolutional neural networks. International Journal of Open Information Technologies. 2022;10(12):53–61. (In Russ.) Available at: https://www.injoit.org/.
  16. Мамедова ЛЭ, Иванова ЛН, Алтаев ЕС. Основные аспекты технологии искусственного интеллекта. Известия высших учебных заведений. Серия: Экономика, финансы и управление производством. 2023;(3):78–88. Режим доступа: https://ecofin-isuct.ru/. / Mamedova LE, Ivanova LN, Altaev ES. Key aspects of artificial intelligence technology. News of Higher Education Institutions. Series: Economics, Finance, and Production Management. 2023;(3):78–88. (In Russ.) Available at: https://ecofin-isuct.ru/.
  17. Утегенов НБ. Искусственный интеллект на сегодняшний день. Universum: технические науки: электронный научный журнал. 2022;(7-1):27–30. Режим доступа: https://7universum.com/. / Utegenov NB. Artificial intelligence today. Universum: Technical Sciences: Electronic Scientific Journal. 2022;(7-1):27–30. (In Russ.) Available at: https://7universum.com/.
  18. Gulshan V, Peng L, Coram M, Stumpe MC, Wu D, Narayanaswamy A. Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs. JAMA. 2016;316(22):2402–2410. doi: 10.1001/jama.2016.17216.
  19. Добров ЭР. Применение нейросетей в диагностике диабетической ретинопатии. Модели, системы, сети в экономике, технике, природе и обществ. 2022;(2):90–105. Режим доступа: https://mss.pnzgu.ru/. / Dobrov ER. The use of neural networks in the diagnosis of diabetic retinopathy. Models, Systems, and Networks in economics, Engineering, Nature, and Society. 2022;(2):90–105. (In Russ.) Available at: https://mss.pnzgu.ru/.
  20. Wong TY, Bressler NM. Artificial Intelligence with Deep Learning Technology Looks Into Diabetic Retinopathy Screening. JAMA. 2016;316(22):2366–2367. doi: 10.1001/jama.2016.17563.
  21. Мамедов ТХ, Дзюба ДВ, Наркевич АН. Применение сверточных нейронных сетей для распознавания диабетической ретинопатии на цифровых изображениях. Сибирское медицинское обозрение. 2022;(1):83–87. doi: 10.20333/25000136-2022-1-83-87. / Mamedov TH, Dzjuba DV, Narkevich AN. Application of convolutional neural networks for recognition of diabetic retinopathy in digital images. Siberian Medical Review. 2022;(1):83–87. (In Russ.) doi: 10.20333/25000136-2022-1-83-87.
  22. Abdelhafiz D, Yang C, Ammar R, Nabavi S. Deep convolutional neural networks for mammography: advances, challenges and applications. BMC Bioinformatics. 2019;20(Suppl. 11):281. doi: 10.1186/s12859-019-2823-4.
  23. Qu J, Zhao X, Chen P, Wang Z, Liu Z, Yang B, Liet H. Deep learning on digital mammography for expert-level diagnosis accuracy in breast cancer detection. Multimedia Systems. 2022;28:1263–1274. doi: 10.1007/s00530-021-00823-4.
  24. Yu H, Li J, Zhang L, Cao Y, Yu X, Sun J. Design of lung nodules segmentation and recognition algorithm based on deep learning. BMC Bioinformatics. 2021;22(Suppl. 5):314. doi: 10.1186/s12859-021-04234-0.
  25. Мелдо AA, Уткин ЛВ, Моисеенко ВМ. Алгоритмы диагностики XXI века. искусственный интеллект в распознавании рака легкого. Практическая онкология. 2018;(3):292–298. doi: 10.31917/1903292. / Mehldo AA, Utkin LV, Moiseenko VM. XXI Century diagnostic algorithms. Artifitial intelligance in lung cancer detection. Practical Oncology. 2018;(3):292–298. (In Russ.) doi: 10.31917/1903292.
  26. Zeng X, Jiang Z, Luo W, Li H, Li H, Li G. Efficient and accurate identification of ear diseases using an ensemble deep learning model. Sci Rep. 2021;11(1):10839. doi: 10.1038/s41598-021-90345-w.
  27. Myburgh H, Jose S, Swanepoel DW, Laurent C. Towards low cost automated smartphone- and cloud-based otitis media diagnosis. Biomedical Signal Processing and Control. 2018;39:34–52. doi: 10.1016/j.bspc.2017.07.015.
  28. Sandström J, Myburgh H, Laurent C, Swanepoel DW, Lundberg T. A Machine Learning Approach to Screen for Otitis Media Using Digital Otoscope Images Labelled by an Expert Panel. Diagnostics. 2022;12(6):1318. doi: 10.3390/diagnostics12061318.
  29. Viscaino M, Talamilla M, Maass JC, Henríquez P, Délano PH, Auat Cheein C. Color Dependence Analysis in a CNN-Based Computer-Aided Diagnosis System for Middle and External Ear Diseases. Diagnostics. 2022;12(4):917. doi: 10.3390/diagnostics12040917.
  30. Viscaino M, Maass JC, Delano PH, Torrente M, Stott C, Auat Cheein F. Computer-aided diagnosis of external and middle ear conditions: A machine learning approach. PLoS ONE. 2020;15(3):e0229226. doi: 10.1371/journal.pone.0229226.
  31. Cha D, Pae C, Seong SB, Choi JY, Park HJ. Automated diagnosis of ear disease using ensemble deep learning with a big otoendoscopy image database. EBioMedicine. 2019;45:606–614. doi: 10.1016/j.ebiom.2019.06.050.
  32. Cai Y, Yu JG, Chen Y, Liu C, Xiao L, Grais EM et al. Investigating the use of a two-stage attention-aware convolutional neural network for the automated diagnosis of otitis media from tympanic membrane images: a prediction model development and validation study. BMJ Open. 2021;11(1):e041139. doi: 10.1136/bmjopen-2020-041139.
  33. Livingstone D, Chau J. Otoscopic diagnosis using computer vision: An automated machine learning approach. Laryngoscope. 2020;130(6):1408–1413. doi: 10.1002/lary.28292.
  34. Khan MA, Kwon S, Choo J, Hong SM, Kang SH, Park IH et al. Automatic detection of tympanic membrane and middle ear infection from oto-endoscopic images via convolutional neural networks. Neural Netw. 2020;126:384–394. doi: 10.1016/j.neunet.2020.03.02328.
  35. Byun H, Yu S, Oh J, Bae J, Yoon MS, Lee SH et al. An Assistive Role of a Machine Learning Network in Diagnosis of Middle Ear Diseases. J Clin Med. 2021;10(15):3198. doi: 10.3390/jcm10153198.
  36. Habib AR, Kajbafzadeh M, Hasan Z, Wong E, Gunasekera H, Perry C et al. Artificial intelligence to classify ear disease from otoscopy: A systematic review and meta-analysis. Clin Otolaryngol. 2022;47(3):401–413. doi: 10.1111/coa.13925.
  37. Chen YC, Chu YC, Huang CY, Lee YT, Lee WY, Hsu CY. Smartphone-based artificial intelligence using a transfer learning algorithm for the detection and diagnosis of middle ear diseases: A retrospective deep learning study. EClinicalMedicine. 2022;51:101543. doi: 10.1016/j.eclinm.2022.101543.
  38. Zeng J, Deng W, Yu J, Xiao L, Chen S, Zhang X. A deep learning approach to the diagnosis of atelectasis and attic retraction pocket in otitis media with effusion using otoscopic images. Eur Arch Otorhinolaryngol. 2023;280(4):1621–1627. doi: 10.1007/s00405-022-07632-z.
  39. Alhudhaif A, Cömert Z, Polat K. Otitis media detection using tympanic membrane images with a novel multi-class machine learning algorithm. PeerJ Comput Sci. 2021;7:e405. doi: 10.7717/peerj-cs.405.




Последние статьи