Новый метод прогнозирования вероятности выживания и оценки неопределенности для пациентов с травмами
Для оценки тяжести травм и повреждений в настоящее время используется «золотой» стандарт Trauma and Injury Severity Score (TRISS), предназначенный для скрининга состояния пациента с целью предсказания вероятности выживания. Однако использование этого стандарта в течение более чем 40 лет выявило ряд проблем: первое - необъяснимую флуктуацию предсказанных значений, вызванную агрегированием скрининговых тестов, второе - недостаточную точность оценки интервалов неопределенности, в которых распределены предсказания.
Для оценки тяжести травм и повреждений в настоящее время используется «золотой» стандарт Trauma and Injury Severity Score (TRISS), предназначенный для скрининга состояния пациента с целью предсказания вероятности выживания. Однако использование этого стандарта в течение более чем 40 лет выявило ряд проблем: первое - необъяснимую флуктуацию предсказанных значений, вызванную агрегированием скрининговых тестов, второе - недостаточную точность оценки интервалов неопределенности, в которых распределены предсказания.
Для снижения негативного влияния этих факторов нами разработан новый метод и сделан доступным для практиков в виде web-калькулятора. Метод использует байесовскую методологию статистического вывода, которая теоретически позволяет достичь максимальной точности предсказаний, являясь, однако, вычислительно сложной в реализации. Метод был реализован и верифицирован нами на выборке данных, включающей 571 148 пациентов, зарегистрированных в US National Trauma Data Bank (NTDB), с числом травм от 1 до 20.
Распределение пациентов по группам по числу травм: 1-я группа - 174 647 пациентов имели 1 травму, 2-я группа - 381 137 - от 2 до 10 травм и 3-я группа 15 364 - от 11 до 20 травм.
Доли выживших в каждой категории были 0,977, 0,953 и 0,831 соответственно. Предложенный нами метод улучшил точность предсказаний на 0,04%, 0,36% и 3,64% (значимость p<0,05) для каждой указанной группы. Критерий Хосмер-Лемешоу показал значительное улучшение калибрации новой модели.
ВВЕДЕНИЕ
Вероятность выживания пациента, доставленного в стационар, оценивается по модели TRISS (Trauma and Injury Severity Score). Эта модель является моделью логистической регрессии, в которой используется до 3 наиболее тяжелых повреждений в 6 областях тела: голова, лицо, грудная клетка, брюшная полость, конечности и поверхность (кожа, подкожная клетчатка и ожоги). Модель включает как непрерывные, так и категорийные скрининговые тесты (или предикторы).
Непрерывные предикторы включают такие показатели, как возраст, систолическое артериальное давление, частота дыхания. Категорийные предикторы включают: оценку тяжести травмы, полученной пациентом,шкалу GCS (Glasgow Coma Scale, Шкала комы Глазго), а также тип повреждения (тупое или проникающее). Все эти параметры оцениваются обученным специалистом сразу по прибытии пациента. Вычисление вероятностей выполняется с помощью метода, реализованного в виде доступного онлайн TRISS Calculator.
Скрининговые тесты образуют два агрегированных предиктора: показатель тяжести травм (ISS, Injury Severity Score) и модифицированная шкала оценки травмы (RTS, Revised Trauma Score). Практики обнаружили, что при такой агрегации возникают необъяснимые флуктуации ISS в предсказываемых вероятностях выживания , что влияет на точность прогнозов.
Формально модель TRISS определяет вероятность выживания, Ps, используя следующую логистическую регрессию: Ps=1/(1+e-b), где b=b0+b1xRTS+b2xISS+b3xA.
Здесь b0, bj, b2, и b3 — параметры регрессии, а A=0, если возраст пациента менее 55 лет, и A=1 в противном случае. Параметры регрессии были определены для тупых и проникающих ранений.
Анализ статистики выживаемости и предсказанных вероятностей определяется как калибрация, а визуализация отношений между этими вероятностями является калибрационной кривой . С этой точки зрения калибрационная кривая для метода TRISS имеет значительное отклонение от фактических вероятностей выживания .
Точность предсказаний, базирующихся на вычислениях, полученных с помощью шкалы TRISS, признается удовлетворительной, когда типы и тяжесть травм типичны. Однако для пациентов с числом травм более трех, а также с некоторыми нетипичными комбинациями травм, точность недостаточна, и могла бы быть улучшена.
На практике крайне важно как можно более точно оценить неопределенность в прогнозах выживания.
Оценки неопределенности необходимы для того, чтобы минимизировать риски фатальных ошибок. В частности, неопределенность может быть представлена в виде доверительных интервалов, которые могут быть надежно оценены, когда известна прогнозируемая плотность вероятности, что достижимо в ограниченном числе тривиальных ситуаций. Оценки распределения в практических случаях невозможны в рамках методологии TRISS, так как эта методология основана на теоретическом предположении о распределении данных, требуемом для логистической регрессии.
Для уменьшения негативного влияния вышеуказанных проблем нами разработан новый метод прогнозирования выживаемости. Наш подход основан на байесовской методологии статистического вывода, который в теории обеспечивает наиболее точные прогнозы. До недавнего времени его использование в практике было ограничено ввиду вычислительной сложности. Байесовские методы обеспечивают практиков наиболее точными предсказаниями и оценками интервалов неопределенности, в пределах которых распределяются прогнозируемые значения.
Нами разработан удобный для применения в любых условиях web-калькулятор для прогнозирования выживаемости. Предложенный метод основан на Байесовском подходе к построению вероятностных зависимостей выживания пациентов от их физиологических состояний, представленных значениями предикторов (или независимых переменных). Искомая зависимость представляется в виде модели, включающей параметры, которые определяются на имеющейся выборке данных. Байесовский подход позволяет найти искомую модель путем усреднения некоторого множества моделей, которые могут быть созданы для объяснения заданных данных .
Модели оцениваются качеством предсказания на заданной выборке данных в процессе калибровки.
В медицинской практике качество моделей обычно оценивается критерием Хосмер-Лемешоу (HL) .
Чем меньше значение HL-критерия, тем лучше калибровка и, следовательно, будет выше точность прогноза.
Мы использовали HL-критерий для сравнения предлагаемого подхода и стандартного TRISS на выборке данных пациентов, зарегистрированных в США в Национальном банке данных о травме (NTDB), который является основным источником данных записей травмированных пациентов, поступивших в лечебные учреждения. Данные NTDB включают в себя инфор-мацию о пациенте, такую как возраст, пол, типы травмы, а также некоторые клинические данные о состоянии пациента. В NTDB также включена информация о прогнозе TRISS и результатах лечения (жив или умер) для каждого пациента.
Для тестирования нашего подхода мы использовали данные о 571 148 пациентах, зарегистрированных в NTDB с 1-20 травмами. Эти пациенты были распределены на 3 категории телесных повреждений следующим образом: 1-я группа — 174 647 пациентов с одной травмой, 2-я группа — 381 137 — с 2-10, 3-я группа — 15 364 с 11-20 травмами. Показатели выживаемости в каждой категории были 0,977; 0,953 и 0,831 соответственно.
Таблица
Скрининг-тесты (Screening tests) и диапазоны значений (Range)
Таблица показывает скрининг-тесты (или предикторы), которые используются в методе TRISS. Типы переменных — возраст (Age), артериальное давление (Blood pressure) и частота дыхания (Respiration rate) являются непрерывными, остальные предикторы являются категориальными. Предсказанный исход —это статус пациента 1 — жив (alive), или 0 — умер (dead).Таблица также показывает диапазоны значений каждого предиктора.
РЕЗУЛЬТАТЫ
Калибровочные кривые были рассчитаны для 10 интервалов, равномерно распределенных по вероятности выживания от 0,0 до 1,0. На рис. 1 калибровочные кривые представлены для стандартного и предложенного методов. Доверительные интервалы показаны черными линиями, а наблюдаемое (фактическое) выживание в каждом интервале вероятностей выживания обозначается красной звездочкой. Как видно, эти кривые существенно отличаются по точности оценки доверительных интервалов. Калибровочная кривая для TRISS показывает, что большинство наблюдаемых вероятностей выживания лежит вне доверительного интервала. Наоборот, на калибровочной кривой, представленной на правом графике рис. 1, все наблюдаемые вероятности выживания лежат в пределах доверительного интервала, предсказанного предложенным методом. Это свидетельствует о высокой точности оценки интервалов. Значения Ж-критерия значительно отличаются и равны 3893,4 и 557,1 для TRISS и нового метода соответственно.
Рис. 1. Калибровочные кривые и доверительные интервалы для TRISS (а) и предложенного метода (б)
Предложенный и стандартный (TRISS) методы были проанализированы с точки зрения точности классификации. Прогнозы с вероятностями выживания более 0,5 относились к классу «выживших», а результаты прогнозов с меньшими вероятностями относились к классу «умерших».
Предсказания, сделанные обоими методами для пациентов с числом повреждений от 1 до 20, представлены на рис 2. Можно видеть, что прогнозы по методу TRISS (синие звездочки) значительно хуже предсказаний, сделанных предложенным методом (красные треугольники). Различия между предсказаниями TRISS и фактическими вероятностями постепенно возрастают с ростом числа повреждений, в то время как различие между байесовским прогнозом и фактическими вероятностями остается небольшим.
Рис. 2. Сравнение прогнозов, сделанных методом TRISS и предложенным методом (Baysesian) с фактическими вероятностями при разном числе травм
В целом новый метод улучшает точность предсказания на 0,04%, 0,36% и 3,64% (p<0,05) для пациентов с 1, 2-10 и 11-20 повреждениями соответственно. Ж-критерий показал значительное улучшение согласия новой модели с реальными данными. В терминах неопределенности прогнозирования 2а интервалы были сокращены с 0,628 до 0,569 для пациентов с 2-10 травмами и с 1,227 до 0,930 для пациентов с 11- 20 повреждениями, причем оба результата оказались статистически значимыми (p<0,005).
ОБСУЖДЕНИЕ И ЗАКЛЮЧЕНИЕ
Таким образом, «золотой» стандарт TRISS, используемый для оценки тяжести травмы в течение более 40 лет, был улучшен нами с точки зрения точности прогноза выживаемости и оценки интервалов нео-ределенности. Методологически TRISS не способен дать оценки распределения вероятностей выживания,которые востребованы для определения доверитель-
ных интервалов индивидуально для каждого пациента. За время использования обнаружено, что агрегация скрининговых тестов, выполняемая по шкале TRISS, приводит к необъяснимым колебаниям и ошибочным решениям. Новый подход, разработанный для прогноза выживания, был верифицирован на данных о пациентах, зарегистрированных в NTDB, и показал статистически значимое улучшение точности прогнозирования и оценок интервалов неопределенности.
Наибольшее улучшение было достигнуто у больных с 11-20 травмами. Новый метод доступен для лечащих врачей в виде онлайн-калькулятора TraumaCalc.
Авторы благодарны Prof Lecky и Dr Bouamra из UK Trauma Audit and Research Network, University of Manchester, за вдохновляющие обсуждение
Теги: выживание, травма, скрининг, тяжесть травмы
234567 Начало активности (дата): 14.07.2017 12:06:00
234567 Кем создан (ID): 645
234567 Ключевые слова: выживание, травма, скрининг
12354567899