Разработана инновационная платформа для оценки объективности, точности и надежности коммерческих алгоритмов искусственного интеллекта (ИИ), применяемых в скрининге диабетической ретинопатии. Платформа представляет собой первый независимый сравнительный анализ такого рода, направленный на устранение предвзятости поставщиков и обеспечение равных диагностических результатов среди различных этнических групп населения.
Несмотря на то, что Национальная служба здравоохранения Великобритании (NHS) уже выбирает алгоритмы ИИ на основе показателей стоимости и сопоставимости с человеческим уровнем диагностики, остаются нерешенными проблемы, такие как необходимость инфраструктуры высокого уровня и масштабной проверки объективности работы алгоритмов. В частности, многие медицинские устройства на основе ИИ до сих пор не были протестированы на предмет равноправия алгоритмов разных этнических групп, что может привести к возникновению различий в результатах диагностики и лечению.
Исследование, опубликованное в журнале The Lancet Digital Health, возглавили профессор Аликжа Рудник (Alicja Rudnicka) из Университета города Св. Георгия, Лондон, и Аднан Тафиль (Adnan Tufail) из Мoорфилдской больницы NHS Foundation Trust. К исследованию также присоединились специалисты Кингстонского университета и Хомертонского госпиталя NHS Trust.
Ключевые особенности исследования включают использование базы данных из 1,2 миллиона изображений сетчатки глаза, полученных во время 202,886 скрининговых визитов в рамках программы скрининга диабетической ретинопатии в Северной Англии, одной из наиболее разнородных популяций пациентов.
В исследовании приняли участие восемь сертифицированных устройств медицинского назначения (CE-маркированных) из общего числа компаний, приглашенных принять участие — всего 25. Алгоритмы проходили тестирование в безопасной среде исследовательского центра без доступа к результатам экспертной оценки.
Результаты показали, что общая точность выявления заболеваний глаз, требующих клинической коррекции, составила от 83,7% до 98,7%. В случае умеренно-серьезных случаев эта цифра колебалась между 96,7% и 99,8%, а при тяжелых формах заболевания (пролиферативная ретинопатия) варьировалась от 95,8% до 99,5%. Важно отметить, что показатели были стабильны вне зависимости от этнического происхождения пациентов, включая группы, состоящие преимущественно из белого населения (32%), чернокожего населения (17%) и представителей Южной Азии (39%). Это впервые подтверждает возможность обеспечения одинаковой эффективности работы алгоритмов ИИ среди всех упомянутых групп населения.
Авторы подчеркнули важность дальнейшего развития платформы в качестве национальной инфраструктуры ИИ для скрининга заболеваний глаз, обеспечивающей централизованный доступ к алгоритмам, одобренным NHS, и предоставление пользователям возможности безопасного обмена изображениями сетчатки и получения автоматизированных заключений прямо в электронные медицинские карты пациентов. Такая система поможет снизить дублирование дорогостоящей инфраструктуры и обеспечит согласованность медицинской помощи на национальном уровне.