Большие данные в российском здравоохранении. Время пришло!

Большие данные в российском здравоохранении. Время пришло!

 4564

Большие данные в российском здравоохранении. Время пришло!

Н.И. СУВОРОВ, А.В. БЕДЕНКОВ, ООО «АстраЗенека Фармасьютикалз», Москва


Значительное увеличение объема генерируемых данных делает необходимым более широкое практическое использование технологий Big Data, в том числе в области медицины и здравоохранения. Для этого необходимо вовлечение фармацевтических компаний и научно-медицинского сообщества в разработку новых методов и алгоритмов анализа больших и сверхбольших массивов данных.
 
В современных условиях функционирования системы здравоохранения на фоне сохраняющегося дефицита финансовых и материальных средств одним из путей решения множества вопросов могут стать технологии анализа больших массивов данных. Благодаря достижениям в области анализа данных почти все, что определяет наше здоровье, -- от нашего индивидуального генетического кода до конкретных привычек -- может быть использовано для определения признаков болезни, паттернов ее протекания и терапии, оценки эффективности лечения и выявления связей между причинами заболевания и его симптомами [1]. Исходя из понимания необходимости качественных изменений в подходах к хранению, и, главное, к использованию и обработке растущих объемов информации, в последние годы стала широко обсуждаться концепция Big Data (Большие Данные), в том числе применительно к медицине и системе здравоохранения.

Термин Big Data подразумевает получение, обработку и анализ быстро накапливающихся сложных данных в беспрецедентно огромных количествах. Считается, что этот термин ввел в обращение Клиффорд Линч, редактор журнала Nature, выпустивший 3 сентября 2008 г. специальный номер журнала, который был посвящен феномену огромного роста объема и разнообразия обрабатываемых данных. Эта концепция привлекла внимание к росту объемов и многообразия данных, в том числе неструктурированных, и к огромным возможностям их использования в различных областях знаний. Особенность технологий Big Data заключается в том, что они позволяют обрабатывать данные из большого числа самых разнообразных источников, сопоставляя ранее несопоставимые наблюдения, и извлекать из них новые знания и закономерности. [2]

Несмотря на то что российский рынок Big Data только начинает формироваться, отдельные проекты в этой области уже реализуются достаточно успешно, в частности в сфере банковского бизнеса, финансовой аналитики, ритейла и пр. Область здравоохранения, достаточно консервативная в плане адаптации новых информационных технологий, в настоящий момент остается практически неохваченной.

В настоящее время системы здравоохранения во всем мире активно переходят в информатизированный формат, развивая сервисы интегрированных электронных медицинских карт и M2M-устройств, в которых концентрируется основная информация о пациенте, поступающая из различных модулей: системы лабораторной диагностики, архива медицинских изображений и прочих специализированных медицинских сервисов. Заполнение таких систем и использование различных электронных приборов повышают скорость получения информации, способствуют стандартизации работы врачей, автоматизации контроля соблюдения медицинских стандартов и т. д. Однако пока вне зоны внимания остается ряд важных вопросов, в том числе один из самых главных, -- каким образом анализировать весь объем собранной информации для последующего практического применения выявленных закономерностей.

Несмотря на значительное увеличение объема генерируемых данных в области медицины и здравоохранения, практическое применение Больших Данных в этой сфере -- явление довольно редкое. Сейчас предпринимаются попытки анализа данных в отдельных наукоемких областях, таких как протеомика, геномика и других «омик»-технологиях. Однако основной массив информации по-прежнему представляет собой неструктурированный набор файлов, таблиц, рисунков, графиков, их описания, и зачастую содержит противоречивые выводы. Одновременно с этим при поиске релевантной информации в открытых базах данных, публикациях в рецензируемых журналах и пр. возникает ряд существенных проблем, типичных для Big Data в целом:

•    полнота данных -- вопрос включения в результаты поиска всей доступной информации,
•    постоянное обновление/поступление новых данных и особенно включение их в анализ,
•    структурирование данных -- тексты, таблицы, графики, данные измерительных приборов и пр.,
•    отсутствие автоматической обработки данных,
•    проблема автоматического анализа информации [3].

При этом одним из краеугольных камней концепции алгоритма обработки Больших Данных должны быть минимизация времени выдачи информации по запросу и способность сверхоперативно реагировать на задачи и проблемы. Очевидно, что в концепции Big Data заложен большой потенциал, которым, однако, еще надо уметь грамотно пользоваться, и одной из главных задач при работе с большими массивами становится осознание скрытых возможностей новых технологий, а также привлечение инвестиций в эту область.

Пример компании Google и проекта Flu Trends, которому в 2012--2013 гг. не удалось осуществить правильный прогноз эпидемии гриппа, в очередной раз говорит нам о том, что все предсказания и прогнозы -- всего лишь вероятности, которые не всегда соответствуют реальности. Особенно когда основанием для прогноза служат постоянно меняющиеся поисковые запросы в Интернете, подверженные внешнему влиянию, такому как сообщения в СМИ. Тем не менее именно анализ в формате «N = всё» может предсказывать общее направление развития ситуации; полученные корреляции не смогут сказать нам точно, почему происходит то или иное событие, зато предупреждают о том, какого оно рода. И в большинстве случаев этого вполне достаточно. [4]

Открывающийся таким образом новый взгляд на, казалось бы, привычные вещи, может дать фармацевтической индустрии всю полноту средств и методов доказательной медицины с учетом как можно более полной информации, собранной из множества независимых источников. В целом при анализе подхода к использованию технологий Big Data в медицине и биологии очевидно, что увеличение информации само по себе не может привести к построению современной системы здравоохранения, использующей в полной мере возможности больших массивов данных. Разработка вычислительных систем и алгоритмов поиска корреляций должна оказаться той выигрышной стратегией, которая в конечном итоге преобразует огромные неструктурированные массивы информации в источник гипотез и моделей, пригодных для облегчения поиска тенденций, содержащихся внутри этих массивов.

Для этого необходимы постоянная оценка и анализ научно-медицинских данных со стороны экспертного сообщества, в которое должны быть включены представители IT-индустрии, научно-медицинского сообщества, ВУЗов и крупных фармацевтических компаний. Только в комбинации такой оценки с непрерывным совершенствованием алгоритмов анализа постоянный рост больших данных может способствовать ускорению процесса трансляции результатов медико-биологических исследований для удовлетворения потребностей общества и принести огромную пользу для человечества, как бы громко и амбициозно не звучало это на сегодняшний день.

Литература

1.    http://iotconf.ru/ru/news/vozmognosti-ispolzovaniya-bolshih-dannih-v-meditsine-i-zdravoohranenii#sth....
2.    Большие Данные и общество. Тезисы докладов конференции «Большие Данные в национальной экономике» (Москва, 22 октября 2013 г.). Под ред. Дубовой Н.А. М.: «Открытые системы», 2013: 53.
3.    Открытые связанные данные в здравоохранении. Российский офис Консорциума W3C при поддержке Центра семантических технологий НИУ «ВШЭ» и РНИМУ имени Н. И. Пирогова, 2013.
4.    Майер-Шенбергер В., Кукьер К. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим.  М.: Манн, Иванов и Фербер, 2014: 221.



Фармацептический рынок