Ведущий эксперт в области методологии клинических исследований и эпидемиологии, доктор медицинских наук Стивен Эванс, объясняет ключевые статистические концепции для пациентов. Он разбирает, что такое исследование с недостаточной мощностью и почему оно не позволяет выявить реальные эффекты лечения. Доктор Эванс подробно описывает важность предварительно заданных первичных конечных точек для исключения систематических ошибок. Он также анализирует показатель «число нуждающихся в лечении» (ЧНЛ), подчеркивая его применение и ограничения. Эти концепции крайне важны для интерпретации медицинских новостей и понимания эффективности терапии.
Понимание клинических исследований: объяснение мощности, конечных точек и числа нуждающихся в лечении (ЧНЛ)
Перейти к разделу
- Недостаточно мощные клинические исследования
- Первичные и вторичные конечные точки
- Ошибка техасского стрелка
- Число нуждающихся в лечении (ЧНЛ)
- Интерпретация результатов исследований
- Полная расшифровка
Недостаточно мощные клинические исследования
Недостаточно мощное клиническое исследование — это такое, в котором число участников слишком мало для надёжного выявления реального эффекта лечения. Доктор Стивен Эванс поясняет, что мощность исследования — это его способность обнаружить истинное различие, если оно есть. В качестве примера он приводит исследования лечения COVID-19, отмечая, что для изучения смертности требуется большой размер выборки, поскольку уровень летальности может быть низким.
Например, для выявления снижения смертности с 10% до 7% необходимо большое число пациентов. Если исследование слишком мало, оно становится недостаточно мощным и может упустить клинически значимое преимущество. Ранние исследования COVID-19 часто были недостаточно мощными для оценки смертности. Доктор Стивен Эванс подчёркивает, что мощность напрямую зависит от конкретного изучаемого исхода.
Первичные и вторичные конечные точки
В клинических исследованиях определяют первичные и вторичные конечные точки для оценки успеха лечения. Первичная конечная точка — это основной исход, который исследование призвано оценивать. Доктор Стивен Эванс отмечает, что смертность — важная, но сложная первичная конечная точка, поскольку требует большого числа пациентов.
Исследователи часто выбирают более удобные для изучения первичные исходы, такие как время до выздоровления или вирусная нагрузка. Эти объективные показатели могут требовать меньше участников. Однако доктор Эванс предупреждает, что такие определения должны быть чёткими и установленными до начала исследования. Изменение конечных точек после ознакомления с результатами вносит значительную систематическую ошибку и делает выводы недействительными.
Ошибка техасского стрелка
Ошибка техасского стрелка — критически важное понятие для целостности клинических исследований. Доктор Стивен Эванс описывает её как рисование мишени вокруг пулевых отверстий после выстрела. В исследованиях это означает изменение первичного исхода после ознакомления с данными для получения желаемого результата.
Эта практика вносит серьёзную систематическую ошибку и подрывает достоверность исследования. Хотя законные причины для изменения конечных точек существуют, они должны быть внесены до вскрытия результатов. Доктор Эванс подчёркивает, что предварительное определение конечных точек необходимо для достоверного анализа. Это предотвращает манипулирование исходами для демонстрации ложноположительных результатов.
Число нуждающихся в лечении (ЧНЛ)
Число нуждающихся в лечении (ЧНЛ) — полезный показатель для понимания пациентами пользы лечения. Доктор Стивен Эванс определяет ЧНЛ как количество пациентов, которых нужно пролечить, чтобы предотвратить один неблагоприятный исход. Например, если препарат снижает смертность с 10% до 5%, ЧНЛ составляет 20.
Это означает, что для предотвращения одной смерти нужно пролечить 20 человек. Однако доктор Стивен Эванс отмечает важные ограничения. ЧНЛ не является абсолютным числом; оно зависит от длительности наблюдения и определения исхода. Сравнения между лечениями действительны только если ЧНЛ рассчитано одинаково. Несмотря на простоту, ЧНЛ требует осторожной интерпретации.
Интерпретация результатов исследований
Правильная интерпретация результатов клинических исследований требует понимания ключевых статистических концепций. Доктор Стивен Эванс рекомендует искать достаточно мощные исследования с предварительно определёнными конечными точками. Это гарантирует, что результаты надёжны и не обусловлены случайностью или систематической ошибкой.
Пациентам следует учитывать клиническую значимость исходов. Статистически значимый результат может не иметь практического значения, если ЧНЛ очень высоко. Доктор Антон Титов подчёркивает важность этих концепций для медицинской грамотности населения. Понимание мощности, конечных точек и ЧНЛ помогает всем критически оценивать медицинские новости и принимать обоснованные решения.
Полная расшифровка
Доктор Антон Титов: Профессор Эванс, существует несколько базовых концепций в клинических исследованиях. Что означает, например, что исследование недостаточно мощное? Терминология клинических исследований теперь на переднем крае; она появляется в газетах. Люди должны понимать эти основные концепции. Так что означает, если исследование недостаточно мощное? Что такое ЧНЛ, число нуждающихся в лечении? Есть плюсы и минусы и подобные базовые концепции. Что такое первичные и вторичные конечные точки клинических исследований? Очевидно, что несколько исследований перемещали границы, и это были распространённые данные в медицинском сообществе.
Доктор Стивен Эванс: Мы постараемся взять почти все наши примеры из текущей ситуации с COVID-19. Если мы собираемся изучать смертность, это потребует довольно большого числа людей. К счастью, не все умрут, даже в условиях стационара. Если у нас, скажем, 10% людей умирают, то чтобы найти разницу, которая, вероятно, будет достаточно важной — скажем, снижение этого 10% уровня смертности в течение 30 дней после начала лечения до 7% смертности — мы переходим с 10% до 7%. Нам потребуется большое число пациентов, чтобы выяснить, происходит ли такая разница на самом деле.
Мы проводим статистический анализ этого. Но если числа в исследовании слишком малы, то такое исследование мы называем недостаточно мощным. Мощность исследования для обнаружения реального различия, если оно существует, была слишком низкой. Это было верно для некоторых ранних исследований, проведённых по потенциальным методам лечения COVID-19.
В то время как если мы изучаем тысячи пациентов, то маловероятно, что исследование будет недостаточно мощным для смертности как исхода, при условии что мы имеем дело с разумными различиями. Если бы мы хотели обнаружить разницу между 10% уровнем смертности и 9,9% уровнем смертности, нам потребовались бы десятки тысяч пациентов. Это, конечно, не разница, которая была бы очень полезна отдельным пациентам.
Таким образом, недостаточно мощные исследования являются проблемой. Исследование недостаточно мощно в отношении изучаемого исхода. Если вы сделали смертность своим первичным исходом, вам потребуется много пациентов. Очень часто люди делают смертность вторичным исходом и делают своим первичным исходом что-то, что легче изучать и для чего нам нужно меньше пациентов.
В такой ситуации этим часто является время до выздоровления от заболевания. Проблема в том, что это может быть несколько субъективно. Вы можете определить достижение человеком уровня выздоровления на основе клинической оценки, но это может быть основано на вирусной нагрузке или чём-то подобном, что является объективной оценкой.
Таким образом, мы можем иметь объективную оценку для первичного исхода, которую легче изучать, чем смертность. Проблема в том, что когда мы смотрим на выздоровление, у нас есть определение для него. Но может быть, что люди не соответствуют этим определениям. В исследовании становится очевидным, что исход, который вы установили как первичный, не даст вам никаких полезных данных.
Могут быть законные причины для его изменения. Но сложность в том, что если люди знают, что показывают результаты, они могут изменить вопрос и таким образом получить желаемый ответ. В эпидемиологии это называется синдромом техасского стрелка, когда техасский стрелок стоит у стороны сарая и стреляет из ружья в сарай, а затем подходит и рисует мишень.
В исследовании вам нужно заранее определить мишень, затем провести исследование и посмотреть, каковы результаты, а не менять мишень во время проведения исследования. В целом, могут быть законные причины для изменения вашего исхода. Но вы должны быть очень осторожны и убедиться, что вы не делаете этого после того, как уже выстрелили и увидели, куда попали пули.
Вам нужно сделать это до того, как вы узнаете, куда падают пули.
Когда мы подходим к измерению исхода, одна из вещей, которые мы можем сделать, это сказать, каков уровень смертности? Допустим, у нас есть разница в лечении с 10% до 5%. Это означает, что на каждые сто человек будет пять человек, которые не умрут в результате лечения. На каждые 20 человек будет один человек, который не умрёт.
Когда мы переворачиваем это, мы говорим, что число нуждающихся в лечении для предотвращения одной смерти составит 20, при нашей разнице между 10% и 5%. Это также было бы верно, если бы была разница между 20% и 15% или между 50% и 45%. Это мера количества пациентов, которых нужно пролечить, чтобы предотвратить одну смерть.
Иногда вместо смерти мы рассматриваем конкретное событие, такое как инфаркт миокарда или инсульт. Проблема с этим числом в том, что оно не является чистым числом. Оно зависит от того, как долго вы наблюдали за пациентами. У него также есть некоторые другие статистические проблемы.
Поэтому это не тот показатель, который мне особенно нравится, хотя звучит довольно приятно сказать: «О, этому препарату нужно 20 пациентов для получения пользы, тогда как этому препарату нужно 50 пациентов для лечения». Если вы использовали одинаковые правила для обоих, то ЧНЛ может быть довольно полезным. Но вы должны быть осторожны, чтобы убедиться, что ваше определение ЧНЛ, которое не является чистым числом, используется точно так же при сравнении методов лечения.