Сегодня на здоровье человека влияет множество факторов одновременно: загрязнённый воздух, некачественная питьевая вода, вредные производственные условия.
Для их оценки существуют различные рейтинги и шкалы опасности, например, качества городской среды. Чтобы создать такие инструменты, используется статистика и машинное обучение. Однако эти методы только выдают цифру — например, вероятность заболевания, — но не объясняют, с чем именно это связано. В результате специалисты не могут точно определить, на какой именно фактор воздействовать в первую очередь, чтобы устранить главный источник вреда. Учёные Пермского политехнического университета разработали уникальную математическую модель, которая позволяет оценивать совокупный риск от нескольких факторов и выявлять главный источник вреда для здоровья. Проверка показала, что точность прогнозов достигает 92–95 процентов. Модель утверждена Роспотребнадзором и может использоваться для планирования профилактических мероприятий — от очистки воды до модернизации условий труда.
На здоровье человека одновременно влияет множество факторов: качество воздуха, состав питьевой воды, санитарно–гигиенические условия в помещениях и на рабочем месте. По оценкам Всемирной организации здравоохранения, болезни, передаваемые через питьевую воду, ежегодно становятся причиной смерти около одного миллиона человек, а загрязнение воздуха приводит примерно к семи миллионам смертей. При этом в России более 4,8 миллиона человек (почти 35 процентов всех работников) трудятся во вредных или опасных для здоровья условиях, что также влияет на развитие профессиональных заболеваний (тугоухости, хронического бронхита и других).
Для оценки рисков сегодня существуют различные рейтинги, шкалы опасности и классификаторы — например, индекс качества воздуха или классы вредности труда. Чтобы создать такие инструменты, используется статистика и машинное обучение. Однако эти методы только выдают цифру — вероятность заболевания, — но не объясняют, связано ли это со стажем работы, уровнем шума или химическим загрязнением. В результате специалисты не могут точно определить, на что именно воздействовать в первую очередь, чтобы устранить главный источник вреда.
Кроме того, различные факторы окружающей среды действуют не по отдельности, а комплексно. Заводы выбрасывают в атмосферу химические вещества, которые постепенно накапливаются в почве и воде. Каждое из таких загрязнений наносит вред организму, но при совместном влиянии их действие усиливается. Или другой пример: человек дышит грязным городским воздухом (пылью и выхлопными газами) и одновременно работает в тяжёлых условиях, где на него постоянно действуют вибрация и шум. В итоге вероятность развития астмы, гипертонии и профессиональных заболеваний у него становится значительно выше. Именно поэтому оценивать каждый фактор по отдельности недостаточно — необходимо уметь рассчитывать их общий, совокупный эффект.
Все существующие инструменты оценки рисков призваны ответить на три ключевых вопроса: что именно влияет на здоровье, насколько сильно и что является источником опасности. Без таких оценок невозможно обоснованно проводить экологические и профилактические мероприятия: снижать выбросы предприятий, улучшать водоснабжение, уменьшать шум или модернизировать условия труда.
Однако у классических методов есть серьёзные ограничения. Статистика хорошо работает только с «идеальными данными» — полными, без пропусков, собранными по единым стандартам. В реальном здравоохранении и экологии — это редкость, информации часто не хватает. Машинное обучение и нейросети могут рассчитать вероятность конкретной болезни, но не объяснят, связана ли она со стажем работы, с уровнем вибрации или с шумом. А в охране здоровья нужна именно причина, чтобы понять, на что воздействовать.
Учёные Пермского политехнического университета разработали уникальную математическую модель, которая позволяет оценивать совокупный риск от нескольких факторов одновременно и определять главный источник опасности. Проверка на реальных данных показала, что точность прогнозов достигает 92–95 процентов. Модель официально утверждена Роспотребнадзором и рекомендована к практическому применению. Исследование проведено в рамках кандидатской диссертации.
В основе разработки лежит понятие «Нечёткая логика», которая, в отличие от обычных математических моделей, способна понимать не только цифры, но и расплывчатые, качественные оценки — например, «давление повышено» или «шум умеренный». Одно и то же числовое значение может быть вредным в одних условиях и допустимым в других. Поэтому исследователи создали модель, которая сама определяет, насколько то или иное значение соответствует категориям «низкий», «средний», «повышенный», «высокий» уровень опасности.
— Модель работает следующим образом. Сначала она оценивает все исходные данные: замеры загрязняющих веществ в воздухе (пыль, диоксид азота, формальдегид, бензол и другие), показатели качества питьевой воды (железо, хлориды, нитраты, бактерии), физические факторы (шум, вибрация), а также данные о стаже работы, возрасте, условиях труда и учёбы. Эти сведения берутся как из открытых источников, так и в ходе натурных наблюдений. После этого, учитывая совместное воздействие вредных условий, она выдаёт оценку — число, которое затем переводится в шкалу «низкий», «средний», «повышенный», «высокий» риск, — рассказала Анна Савочкина, заместитель декана по учебной работе факультета прикладной математики и механики, кандидат физико–математических наук, старший преподаватель кафедры «Высшая математика» Пермского национального исследовательского политехнического университета.
Для проверки модели учёные собрали реальные показатели качества питьевой воды одного из регионов России за несколько лет: запах, цвет, содержание алюминия, марганца, хлоридов. Модель на основе полученных сведений рассчитала совокупный риск: за три года он снизился с «повышенного» до «среднего» уровня.
— Это изменение совпало с экспертными оценками санитарных врачей, которые на основе тех же данных о качестве воды сделали аналогичный вывод. Средняя погрешность в результатах составила около 5–7 процентов. Таким образом, модель подтвердила свою способность правильно оценивать общий риск даже при большом количестве цифровых и качественных показателей. Существующие методы при этом позволяют оценить каждый показатель отдельно (например, превышение марганца или хлоридов), но не дают вывод по качеству воды в целом, — добавила Анна Савочкина.
Сама модель устроена так, что способна учитывать любые факторы из любых сред одновременно. Это значит, что её можно применить для комплексной оценки загрязнения воздуха, воды и вредных условий труда вместе — и получить совокупный риск для здоровья.
Классические статистические методы показывают точность на уровне 75–89 процентов. Машинное обучение способно достигать 85–96 процентов, но работает как «чёрный ящик» — выдаёт цифру риска, не объясняя его причин. Точность прогнозов новой модели составляет 92–95 процентов. Но главное преимущество в том, что она не просто выдаёт число, а показывает вклад каждого фактора.
На основе разработки учёные создали четыре программных комплекса: для оценки эффективности воздухоохранных мероприятий, для оценки мероприятий по повышению качества питьевой воды, для анализа влияния условий в образовательных учреждениях на здоровье школьников и для прогнозирования профессиональных рисков. Разработку официально утвердил Роспотребнадзор и рекомендовал к практическому применению надзорными органами.
Математическая модель является универсальной, и её можно применять для многих других задач, связанных с оценкой рисков в условиях неполных или неточных данных. Например, с её помощью можно оценивать риски от шума в жилых районах, анализировать качество продуктов питания, прогнозировать последствия химических аварий и на этой основе планировать профилактические мероприятия на конкретной территории,
сообщает «Naked–science»/
↓