Большие данные - один из самых мощных инструментов в борьбе с болезнями. Чем больше данных у нас есть, тем более информированными мы можем быть в выборе медицинских услуг, которые мы делаем. Данные могут предоставить картину состояния здоровья конкретного сообщества и рассказать нам об общих чертах пациентов, чтобы мы могли оценить факторы риска. Это может помочь нам узнать больше о болезнях и, следовательно, найти лекарство или увидеть, как вспышки перемещаются, чтобы эффективно их сдерживать.
Наука о данных - одна из самых междисциплинарных областей. Ученые, врачи, математики, программисты и эпидемиологи - это лишь некоторые из профессий, связанных с наукой о данных. Все люди играют определенную роль либо в сборе данных, либо в их анализе, либо в выяснении того, как их использовать, либо в действиях на их основе.
Вот 10 способов использования науки о данных при различных заболеваниях и эпидемиях.
10: Профилактика рака
Не все виды рака можно предотвратить, но разве вы не хотели бы остановить те, которые можно предотвратить? Скрининг на предрасположенность и ранний рост существует для рака шейки матки, молочной железы, легких, предстательной железы и толстой кишки. Но как врачи определяют рекомендации о том, кто должен проходить скрининг, как часто и когда? Ответ кроется в больших данных.
Целевая группа профилактической службы США использует высококачественные большие данные из крупных эпидемиологических исследований для определения рекомендаций по скринингу. Например, изучив количество ложноположительных диагнозов рака у женщин в возрасте 40 лет, целевая группа определила, что делать маммографию до 50 лет не нужно (если только в семье не было рака молочной железы в анамнезе).
Извлечение как можно большего количества данных от больных раком также позволяет врачам понять, как развивается рак. Орегонский университет здоровья и науки проводит испытания по секвенированию генов тысяч больных раком, чтобы узнать больше о том, как происходит образование рака у разных людей, чтобы они могли быстрее диагностировать. Университет даже предполагает, что к 2020 году сможет диагностировать рак в течение 24 часов, благодаря тому, что они узнают.
9: Прогнозирование вспышек заболеваний, переносимых комарами
Комары уже давно являются переносчиками таких заболеваний, как малярия и лихорадка денге, поэтому сбор информации о типах комаров, переносящих эти заболевания, и о том, где они живут, может помочь нам в борьбе с этими заболеваниями. Недавняя вспышка переносимого комарами вируса Зика показала нам, насколько страшным может быть отсутствие данных о том, как болезнь распространяется и что она может сделать с людьми.
Чтобы помочь в борьбе с этими переносимыми комарами болезнями, ученые из IBM, Университета Джона Хопкинса и Калифорнийского университета в Сан-Франциско совместно создали программное обеспечение с открытым исходным кодом, которое позволяет эпидемиологам создавать прогнозирующие модели заболеваний. Программное обеспечение разработано таким образом, чтобы эпидемиологи с минимальными знаниями в области кодирования могли использовать его для анализа данных, прогнозирования траектории вспышек и планирования стратегий по сдерживанию распространения болезни.
В программе используются данные Всемирной организации здравоохранения, которые показывают общую чувствительность региона к вспышкам, модели популяций людей и комаров, а также климатические данные, которые точно определяют места потенциальных вспышек. В совокупности эти данные могут замедлить распространение переносимых комарами вирусов.
8: Обнаружение симптомов болезни Паркинсона
Болезнь Паркинсона, неврологическое заболевание, от которого страдают более 10 миллионов человек во всем мире, представляет собой прекрасный пример того, как сбор данных в сочетании с технологиями может изменить ситуацию к лучшему в здравоохранении.
У человека с болезнью Паркинсона часто наблюдается очень сильный тремор тела. Это вызвано тем, что его или ее мозг постепенно перестает вырабатывать нейротрансмиттер, называемый дофамином. Чем меньше у человека дофамина, тем меньше он способен контролировать свои движения и эмоции.
Однако к тому времени, когда у него появляются видимые симптомы (такие как дрожь) и диагностируется болезнь Паркинсона, целых 80 процентов нейронов в его мозгу, связанных с дофамином, уже разрушены. Хотя в настоящее время нет лекарства от болезни Паркинсона, существуют методы лечения, позволяющие держать симптомы под контролем. Таким образом, если врачи смогут обнаружить симптомы раньше, то лечение может начаться раньше.
С этой целью несколько компаний исследовали носимые технологии для сбора данных о едва заметном треморе, походке при ходьбе и качестве сна. По мере того, как данные объединяются, они могут предоставить владельцам технологий информацию о том, есть ли у них предрасположенность к болезни Паркинсона, и помочь им получить лечение на ранней стадии. Сбор такого огромного количества данных в центральном узле также дает врачам и ученым возможность искать общие черты у пациентов с болезнью Паркинсона, что, возможно, однажды приведет к излечению.
7: Картирование вспышек лихорадки Эбола
В 2014-2015 годах произошла массовая вспышка лихорадки Эбола, в основном в Западной Африке. Только в этом регионе от этого заболевания умерло более 11 000 человек. Когда вспышка вируса произошла в некоторых из беднейших стран мира, было трудно донести медицинскую информацию до граждан, а инфраструктуры для борьбы с болезнью было мало. Главной задачей в глобальной борьбе с лихорадкой Эбола было понимание того, где распространяется вирус, чтобы определить районы, наиболее остро нуждающиеся в помощи. И здесь на помощь приходит наука о данных.
Используя картографическое программное обеспечение в режиме реального времени, ученые и работники общественного здравоохранения могут отслеживать болезнь в Африке и прогнозировать наиболее уязвимые районы, которые могут стать жертвами вспышки в будущем. Собрав воедино данные о местонахождении видов летучих мышей (вероятных переносчиков вируса Эбола), плотности популяции, времени в пути от ближайшего крупного поселения и нескольких других факторах, ученые могут опережать болезнь.
Инструмент картографирования был развернут на семинаре в феврале 2016 года. «Я могу легко просмотреть карты и увидеть, в частности, районы Ганы, где находится ниша вируса Эбола, где, вероятно, будет вспышка, а затем оттуда мы можем вести наблюдение за животными», - сказал присутствующий доктор Ричард Суу-Айр, глава ветеринарного отдела дикой природы в Гане, который отвечает за сбор образцов летучих мышей для эпиднадзора за Эболой в своей стране.
6: Расчет риска сердечных заболеваний
Одним из самых действенных способов использования данных в медицине является расчет риска. Когда собрано и проанализировано достаточное количество данных, врачи и работники общественного здравоохранения могут определить не только факторы, которые могут играть роль в заболевании, но и триггерную точку, при которой человек может подвергнуться высокому риску заражения.
Болезни сердца - отличный тому пример. Это причина смерти № 1 в США, на которую приходится каждая четвертая смерть. Раньше врачи использовали для расчета риска сердечных заболеваний в первую очередь значения холестерина. Если уровень холестерина был высоким, пациентам прописывали лекарства; если низкий, они считались не подверженными риску.
Однако, используя набор данных, собранных из нескольких источников, Американский колледж кардиологов и Американская кардиологическая ассоциация обнаружили общие черты у пациентов с сердечными заболеваниями, которые выходят далеко за рамки простого высокого уровня холестерина. Имея массивные наборы данных о весе, расе, возрасте, анамнезе, холестерине и некоторых других факторах, группы разработали тест, который действует как гораздо более полный и персонализированный калькулятор риска, который называется Оценщиком риска ASCVD. В результате врачи изменили методы своей практики и расчета риска сердечно-сосудистых заболеваний.
5: Остановить наркоэпидемию
Употребление наркотиков может разрушать сообщества, как и многие болезни. Количество смертей от передозировки в Соединенных Штатах ошеломляет - более 47 000 только в 2014 году. Фактически, передозировка наркотиков является основной причиной смерти от несчастных случаев в Соединенных Штатах, а опиоидная зависимость является причиной большинства смертей.
Отслеживание данных о смертности в различных сообществах может дать поставщикам медицинских услуг, правительствам и общественным активистам четкое представление о том, как наркотики могут влиять на конкретный регион. Основываясь на этих данных, они могли бы знать, где особенно смертоносные штаммы наркотиков могут проникать в города, и использовать действия правительства, чтобы остановить распространение. Узнав больше о том, где люди умирают от передозировки, можно подсказать правительствам, какие сообщества нуждаются в вмешательстве, например, в реабилитационных службах или врачах, которые предлагают стратегии снижения вреда.
Такая стратегия помогла многим сельским общинам принять меры против опиоидной эпидемии, что привело к весьма положительным результатам. Несколько сельских районов в США следовали стратегиям реабилитации, изложенным полицейским управлением Глостера, штат Массачусетс, которые всего за один год привели к тому, что более 400 пациентов были направлены на лечение, а расходы на ночное заключение снизились на 75 процентов. Например, любой человек, страдающий зависимостью, может прийти в полицейский участок, и персонал под рукой поможет включить его в программу лечения.
Наконец, наличие данных о смертности, связанной с наркотиками, побудило Центры по контролю и профилактике заболеваний разработать рекомендации для врачей по практике назначения опиоидов. Данные не только помогают бороться с эпидемией, но и позволяют выявить корень проблемы и остановить злоупотребление психоактивными веществами до того, как оно распространится.
4: Причины, связанные с сообществом
Иногда данные не обязательно должны быть «большими», чтобы иметь серьезное влияние на борьбу с болезнями. Небольшой целенаправленный набор данных может пролить свет на здоровье сообщества. Прекрасным примером является кризис воды во Флинте, штат Мичиган.
Исследование, проведенное инженером-строителем, показало, что пробы воды из домов Флинтов содержали высокие уровни свинца; однако доказательств, которые он раскопал, было недостаточно, чтобы убедить руководителей правительства в том, что вода была загрязнена. Услышав об исследовании инженера, городской педиатр решила собрать свой собственный набор данных.
Доктор. Мона Ханна-Аттиша собрала информацию из больничных записей и обнаружила чрезвычайно высокий уровень свинца в крови пациентов-детей. Вместо того, чтобы ждать публикации своих выводов в медицинском журнале, она провела пресс-конференцию, и городские власти были вынуждены ее выслушать.
Отравление свинцом может иметь долгосрочные последствия для развития мозга и поведения ребенка, а во Флинте почти 27 000 детей подверглись воздействию свинца в городской воде. Без набора данных, доказывающих, что что-то не так, могли пострадать еще тысячи детей.
3: Долгосрочные когортные исследования
Пулы больших данных - отличное место для поиска закономерностей. Ученые и врачи иногда проводят долгосрочные исследования определенных групп людей, чтобы узнать, есть ли какие-либо общие черты в том, как улучшается их здоровье. Например, работники общественного здравоохранения в настоящее время занимаются изучением лиц, оказывающих первую помощь 11 сентября, чтобы изучить долгосрочные последствия их воздействия в Ground Zero. Возможность приписать редкие виды рака и респираторных заболеваний, которые они могут развить, благодаря этому воздействию, вооружает врачей и правительство дополнительной информацией о том, как создать системы ухода и поддержки.
Одним из наиболее эффективных когортных исследований является Инициатива женского здоровья (WHI). Это долгосрочное клиническое исследование, начатое в 1993 году, собрало данные о 161 000 женщин в постменопаузе, чтобы изучить стратегии профилактики сердечных заболеваний, рака молочной железы и толстой кишки, а также остеопоротических переломов.
Образцы, отмеченные учеными у этих женщин, изменили подход медицинских работников к профилактике и лечению этих заболеваний, что принесло огромную отдачу от инвестиций. Исследователи использовали имитирующую модель заболевания за девятилетний период (2003-2012 гг.), чтобы сравнить различия в состоянии здоровья женщин на основе результатов исследований WHI.
Модель показала, что, следуя рекомендациям WHI, число случаев сердечно-сосудистых заболеваний уменьшилось на 76 000, случаев рака молочной железы - на 126 000, а пользователей комбинированной гормональной терапии - на 4,3 миллиона человек. Кроме того, имитационная модель болезни показала, что, используя результаты исследования WHI за этот девятилетний период, американцы сэкономили примерно 35,2 миллиарда долларов на прямых расходах на здравоохранение.
2: Отслеживание распространения гриппа
Несмотря на ежегодные призывы к вакцинации против гриппа, это очень заразное респираторное заболевание по-прежнему ежегодно поражает миллионы людей в США и убивает тысячи тех, кто заболел.
Человек с гриппом может заразить других за день до появления симптомов и до семи дней после того, как он заболел, поэтому очень важно знать, где и когда грипп достигает своего пика в стране.
Веб-сайт FluNearYou.org позволяет американцам публиковать свои симптомы в еженедельных отчетах о состоянии здоровья. Тысячи людей отправляют свои отчеты на веб-сайт, а ученые сопоставляют собранные данные, чтобы определить, какие симптомы присутствуют и в каких местах по всей стране.
Наука о данных, однако, не всегда идеальна. Google углубился в мир прогнозов гриппа с помощью Google Flu Trends (GFT). Основываясь на поиске симптомов у людей, они заявили, что могут собрать достаточно данных, чтобы предоставить точные оценки распространенности гриппа на две недели раньше, чем CDC. К сожалению, GFT не удалось предсказать большой пик гриппа в 2013 году (его алгоритм включал слишком много сезонных поисковых запросов, не связанных с гриппом). Хотя GFT потерпел неудачу, концепция краудсорсинга данных для прогнозирования болезней часто работает довольно хорошо.
1: Краудсорсинг компьютеров
Сбор данных в центральном узле - не единственный способ использовать краудсорсинг для борьбы с болезнями. Краудсорсинг компьютеров для обработки информации не менее важен.
The World Community Grid - это проект, возглавляемый IBM, который просит людей пожертвовать свободные вычислительные мощности своих персональных устройств для борьбы с болезнями. Когда ваше устройство простаивает, оно может выполнять исследовательские расчеты для ученых, поэтому результаты, на которые ушли бы десятилетия, можно получить за месяцы. Краудсорсинговые компьютеры запускали симуляции клеточных функций, чтобы понять такие болезни, как туберкулез; проверили миллионы химических соединений на наличие белков-мишеней, которые Зика, вероятно, использует для своего развития в организме человека, и определили генетические маркеры, помогающие предсказывать рак.
Более 700 000 добровольцев уже подписались на помощь в этих различных проектах. При том количестве времени простоя, которое наши коллективные устройства могут предложить этим причинам, это один из способов, которым большие данные могут иметь большое значение.
Примечание автора: 10 способов использования данных для борьбы с болезнями
Чтение о способах краудсорсинга данных во благо действительно заставило меня принять участие в чем-то вроде FluNearYou. Было бы здорово стать одним из элементов данных, которые помогают формировать картину ландшафта здоровья, тем самым влияя на то, как врачи выбирают планы лечения. Каждый может сделать свою маленькую часть!