Методы рандомизации. Что такое рандомизированные клинические испытания Плацебо рандомизация двойные слепые клинические испытания

Рандомизированные контролируемые клинические испытания (РКИ), проводятся в стационарах, реже в других ЛПУ с целью оценки потенциальной эффективности средств, способов и схем лечения, диагностики, болезней.

При оценке потенциальной эффективности препарата, предлагаемого для лечения какой либо болезни, популяцией являются больные с одинаковым клиническим течением этой болезни, сравнительно одинакового пола и возраста и другими признаками, которые могут влиять на исход болезни.

Выборка формируется с учетом определенных ограничений, при этом больные, представляющие популяцию, не попадают в выборку в основном по следующим причинам:

    не соответствие критериям отбора по факторам, которые могут повлиять на предполагаемый эффект экспериментального лечения;

    отказ участвовать в эксперименте;

    предполагаемая возможность несоблюдения отдельными лицами условий эксперимента (например, нерегулярный прием назначенного препарата, нарушение правил обращаемости и т.д.);

    противопоказания к экспериментальному лечению.

В результате такого отбора сформированная выборка может оказаться малочисленной, что скажется на результатах оценки достоверности различий частоты исходов в опытной и контрольной группе. Кроме того, сформированная выборка может быть резко смещена и даже достоверные данные будут иметь существенные ограничения при распространении результатов на всю популяцию больных.

Рандомизация в РКИ должна обеспечить сопоставимость групп по различным признакам и, главное, по признакам, влияющим на исход болезни . Однако этого можно достичь только при достаточно больших выборках, сформировать которые не всегда возможно. При малом числе больных, сопоставимость групп, как правило, нарушается в результате того, что часть лиц, по различным причинам, выбывает из эксперимента, что может препятствовать получению достоверных выводов.

Рис. 7. Рандомизированное контролируемое испытание для оценки результатов ранней выписки из больницы пациентов перенесших инфаркт миокарда.Источник. Основы эпидемиологии. Р Биглхол с соавт. ВОЗ, Женева, 1994.

Приведенные данные (рис. 7) показывают, как по разным причинам резко сократилось число пациентов участвующих в эксперименте. В итоге результаты статистической обработки оказались не достоверны, и по данным этого исследования только весьма ориентировочно можно полагать, что ранняя выписка (через 3 дня) безопасна для лиц перенесших инфаркт миокарда.

    По снижению надежности методы рандомизации, применяемые в РКИ, чаще всего распределяют в следующем порядке:

    централизованная рандомизация по телефону независимым специалистом статистиком, или представителем фармацевтической фирмы.

    метод закодированных (пронумерованных) одинаковых контейнеров, поставляемых фармацевтической фирмой, при этом код и содержание контейнеров неизвестны ни больным, ни врачам, участвующим в исследовании;

    централизованный компьютерный метод - компьютерная программа генерирует случайную последовательность распределения пациентов по группам, подобную последовательности в таблице случайных чисел, при этом разделение больных на группы сравнения проводится специалистом, участвующим только в процессе рандомизации.

    метод непрозрачных, запечатанных и пронумерованных конвертов. Указания о необходимом вмешательстве помещаются в конверты, последовательно пронумерованные согласно таблице случайных чисел. Крайне важно, чтобы конверты вскрывали только после того, как в приемном отделении исследователь запишет на них фамилию больного и другие необходимые данные;

Независимо от метода, рандомизация может быть простой и стратифицированной (существуют и другие, реже используемые виды рандомизации). В случае простой рандомизации дополнительные факторы не учитываются, а каждый пациент имеет шанс 50 на 50 попасть в ту или иную группу. Стратифицированная рандомизация (выделение подгрупп – страт), применяется в случаях, когда невозможно создать группы с одинаковым прогнозом исхода опыта у испытуемых лиц. Например, если на результат исследования может повлиять один из заданных параметров (возраст, уровень артериального давления, перенесенный инфаркт миокарда и др.) пациентов вначале делят на подгруппы. Далее в каждой подгруппе группе проводят рандомизацию. Некоторые специалисты считают стратифицированную рандомизацию недостаточно корректной.

Несмотря на исключительную важность информации о методе рандомизации для оценки читателем надежности результатов исследования, разные авторы приводят практически одинаковые оценки исследований по этому параметру. Установлено, что в 80 - 90-х годах только в 25 - 35% отчетов об РКИ, опубликованных в специализированных журналах, и в 40 - 50% отчетов, опубликованных в общемедицинских журналах, сообщалось о применении правильного метода генерации случайной последовательности включения участников в группы. Почти во всех этих случаях использовались либо компьютерный генератор, либо таблица случайных чисел. При анализе статей, опубликованных в одном из журналов по дерматологии за 22 года, было установлено, что о применении правильного метода генерации случайной последовательности сообщалось лишь в 1 из 68 отчетов об РКИ.

Важнейший элемент организации РКИ средств лечения - использование метода ослепления (маскирования). Как указывалось в предыдущем разделе, предпочтение отдается двойному и даже тройному слепому исследованию, поскольку больные или медицинский персонал, участвующий в испытании, невольно или преднамеренно, могут исказить данные и повлиять тем самым на результат исследования.

Маскирование вмешательств от больных важно, потому что исход применяемого воздействия в значительной степени зависит от психологического состояния пациента. При открытости информации больные опытной группы могут либо неоправданно надеяться на благоприятный исход лечения, либо наоборот переживать по поводу того, что согласились быть «подопытными кроликами». Больные контрольной группы также могут вести себя по-разному, например, чувствовать себя обделенными, особенно если они будут считать, что в опытной группе процесс лечения более успешен. Разное психологическое состояние больных может привести к целеноправленным поискам ими признаков улучшения или наоборот ухудшения состояния их здоровья, что неминуемо скажется на собственной оценке состояния, изменения которого нередко оказываются мнимыми. Маскирование от врача-исследователя необходимо, так как он может быть заведомо убежден в преимуществах испытуемого средства и субъективно трактовать изменения состояния здоровья испытуемых.

Необходимость двойного маскирования объективно подтверждает «эффект плацебо». Плацебо – лекарственная форма, неотличимая от исследуемого препарата по внешнему виду, цвету, вкусу и запаху, но не оказывающая специфического действия, или иное безразличное вмешательство, используемое в медицинских исследованиях для имитации лечения с целью устранения систематической ошибки, связанной с плацебо-эффектом. Плацебо-эффект – изменение состояния пациента (отмечаемое самим пациентом или лечащим врачом), связанное только с фактом лечения, а не с биологическим действием препарата.

Многочисленными исследованиями установлено, что некоторые больные (в зависимости от болезни до 1/3) принимая плацебо за лекарство, реагируют на него так же, или почти так же, как и больные опытной группы. Изучение эффекта плацебо позволяет выделить специфические составляющие нового лечения. Кроме того, если больные не знают, к какой группе они относятся, они более точно следуют правилам эксперимента.

Как упоминалась в предыдущем разделе, для повышения надежности выводов вводят третье ослепление на этапе статистической обработки данных, поручая эти действия независимым лицам.

«Слепые» клинические исследования не используются при оценке потенциальной эффективности хирургических вмешательств, методов физиотерапии, диет, многих диагностических процедур и т.д., т.е. в тех случаях, когда замаскировать воздействие невозможно, или нецелесообразно ни для больных, ни для врачей. В таких случаях рандомизированные исследования называют открытыми.

По истечении установленного времени наблюдения проводят статистическую обработку выявленных исходов (эффектов воздействия) болезни в опытной и контрольной группе. Для того чтобы избежать систематическую ошибку, критерии исхода болезни в опытной и контрольной группах больных должны быть специфичны и одинаковы. Для повышения надежности выводов исследование нередко проводят не одномоментно, а в течение некоторого периода, включая в него вновь поступающих больных.

Для статистической обработки полученных данных применяется все та же таблица «два на два».

Таблица 11. Макет таблицы «два на два» для оценки результатов экспериментальных исследований.

Большинство показателей, оценивающих эффективность экспериментального воздействия в клинических и полевых испытаниях, хотя и имеют другие названия (так исторически сложилось), соответствуют и по способу расчета и по смыслу величинам, рассчитываемым в когортных исследованиях.

Для количественного выражения эффективности используют различные статистические показатели, при этом отсутствует строгая унификация их названий.

1. Показатель относительной эффективности ( показатель эффективности ):

Эта величина соответствует относительному риску, вычисляемому в когортных исследованиях . Показатель эффективности определяет во сколько раз , частота позитивных исходов воздействия в опытной группе выше, чем их частота в контрольной группе, т.е. во сколько раз новый способ лечения, диагностики и др., лучше, чем обычно используемый.

Для интерпретации показателя эффективности используются оценочные критерии относительного риска (см. статистическую обработку данных когортного исследования). При этом, соответственно, изменяется смысл формулировок, так как оценивается не фактор риска болезни, а эффективность применяемого экспериментального воздействия.

2. Атрибутивный (добавочный) эффект , соответствует атрибутивному (добавочному) риску, определяемому в когортных исследованиях.

Величина атрибутивного эффекта показывает на сколько эффект от экспериментального воздействия больше, чем эффект от воздействия в контрольной группе;

3 . Доля эффекта воздействия (доля эффективности ) соответствует этиологической доле вычисляемой при анализе данных когортных исследований.

Эта величина показывает долю позитивных исходов, принадлежащую экспериментальному воздействию, в сумме позитивных эффектов в опытной группе.

4. дополнительная величина, которую назвали - число больных, которых необходимо лечить (ЧБНЛ) для предотвращения одного неблагоприятного исхода.

Чем больше этот показатель, тем меньше потенциальная эффективность изучаемого воздействия.

Так же, как и при обработке данных когортных исследований, достоверность полученных данных в экспериментах оценивается с помощью критерия «хи-квадрат» или другими методами.

В заключение отметим, что, несмотря на все достоинства, рандомизированные клинические испытания таят в себе возможность систематической ошибки, особенно ошибки связанной с формированием выборки. Следовательно, результаты одного исследования, даже безупречного по организации, не могут рассматриваться как безусловная рекомендация применения нового препарата в клинической практике. Именно поэтому в настоящее время надежными считаются только результаты многоцентровых исследованиий эффективности одного и того же вмешательства (лечения) несколькими клиниками, при этом желательно, чтобы исследования проводились в клиниках разных странах.

Рандомизация является ключевым понятием анализа медицинских данных.

Термин «рандомизация» относится не к выборке, а к способу ее генерирования.

Говоря, что группа данного размера является простой случайной выборкой из большей группы, мы подразумеваем, что все возможные выборки этого размера извлекаются с равными вероятностями.

Говоря, что обработка назначается объектам случайно, мы подразумеваем, что вероятность назначения каждого вида обработки одинакова для всех объектов.

На необходимость рандомизации впервые указал Р.Фишер .

Рандомизация преследует три цели:

    гарантирует, что наши предпочтения не повлияют на формирование групп с различными видами обработки

    предотвращает опасность, связанную с выбором на основе личных суждений

    наконец, при случайном (рандомизированном) распределении обработок самый строгий критик не сможет сказать, что группы пациентов рассматривались по-разному вследствие наших предпочтений

Рандомизация в клинических испытаниях

Предположим, необходимо провести клинические испытания лекарственного препарата, чтобы установить его эффективность.

Для этого, например, 50 больным назначают лекарство, а другим 50 больным назначают нейтральный препарат («пустышку»),

Предположим еще, что больные поступают на испытания сериями, в течение некоторого времени, а не одновременно.

Рассмотрим два метода рандомизации.

В первом методе требуется выбрать 50 различных чисел между 1 и 100, активное лекарство должно быть назначено тем из 100 больных, чьи номера попали в этот набор. Остальные 50 пациентов будут получать нейтральный препарат.

Этот метод имеет два недостатка. Во-первых, если придется преждевременно завершить исследование, то общее число пациентов, принимавших активный препарат, с большой вероятностью не будет равно числу пациентов, принимавших нейтральный препарат.

Между тем статистические методы сравнения теряют чувствительность, если размеры выборок различаются.

Во-вторых, если клиническое состояние пациентов, включающихся в испытание в один момент времени, отличается от состояния пациентов, включающихся в другой момент, или меняются правила приема препаратов, то, несмотря на рандомизацию, две группы, возможно, будут отличаться по типу пациентов или по правилам приема лекарств (см. ).

Второй возможный метод рандомизации лишен недостатков, присущих первому.

С помощью этого метода проводится независимая последовательная рандомизация пациентов, поступающих в течение коротких промежутков времени, по группам лечений.

Предположим, что ежемесячно в испытаниях начинают участвовать десять больных.

Разумно случайно назначать пяти пациентам лечение одного вида, а остальным пяти пациентам— другого, повторяя случайное назначение каждый месяц, по мере поступления новых партий больных.

Реализацию этой процедуры можно осуществить, например, с помощью таблицы случайных чисел, сгенерированной в STATISTICA .

Будем вести просмотр по десяти цифрам от 0 до 9, поскольку выбор ведется из 10 больных. Нулем обозначим десятого больного.

Если мы начнем с пятого столбца, то первыми пятью различными цифрами окажутся 2, 5, 4, 8, 6. Значит, из десяти больных второму, пятому, четвертому, восьмому и шестому будет назначен активный, а остальным — нейтральный препарат.

Продолжая просматривать таблицу, увидим, что из следующих десяти больных первый, третий, пятый, восьмой и десятый будут принимать активный, а остальные — нейтральный препарат. Использовав первые цифры в столбце, можно продолжать просмотр по вторым цифрам этого столбца.

Для каждой следующей группы больных следует получать новый набор случайных чисел, чтобы избежать смещений, которые могут появиться вследствие скрытой периодичности типа больных или ввиду того, что сотрудникам клиники вскоре будет ясен вид лекарства (он должен быть неизвестен сотрудникам, контактирующим с пациентами).

Частный случай этого метода — испытания на парах пациентов, когда один из двух пациентов получает активный, а другой - нейтральный препарат.

В этом случае рандомизацию проводить очень просто.

Сначала каким-либо образом, например, по алфавитному порядку фамилий, выделяют одного из двух больных как первого.

Этот выбор надо сделать до проведения рандомизации. Затем, начиная с любого удобного места, просматривают однозначные числа в таблице случайных чисел.

Если цифра нечетная — 1, 3, 5, 7 или 9, то первый больной принимает активный, а второй — нейтральный препарат. Если цифра четная — 0, 2, 4, б или 8, активное лекарство назначают второму больному.

КАКИЕ ВИДЫ РАНДОМИЗИРОВАННЫХ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ СУЩЕСТВУЮТ? ПРЕИМУЩЕСТВА И НЕДОСТАТКИ РАНДОМИЗИРОВАННЫХ КЛИНИЧЕСКИХ ИССЛДЕОВАНИЙ

Рандомизированные исследования могут быть открытыми и “слепыми” (маскированными). Открытым рандомизированное испытание считается в том случае, если и пациент, и врач сразу после проведения рандомизации узнают о том, какой вид лечения будет применен у данного больного. На практических занятиях студенты легко и быстро запоминают дизайн «слепого» исследования. При слепом исследовании больному не сообщается о виде применяемого лечения, и этот момент обговаривается с пациентом заранее при получении информированного согласия на исследование. Врач узнает, какой вариант лечения получит больной, после процедуры рандомизации. При выполнении двойного слепого исследования ни врач, ни пациент не знают, какое из вмешательств применяется у конкретного пациента. В тройном слепом исследовании о типе вмешательства не знают больной, врач и исследователь (статистик), обрабатывающий результаты исследования. В настоящее время в мировой практике “золотым стандартом” считаются рандомизированные контролируемые (проспективные) испытания с двойным или тройным “слепым” контролем.

Исследования могут быть одноцентровыми или многоцентровыми. При проведении многоцентровых РКИ в испытания участвует несколько учреждений, что обеспечивает формирование однородной по всем прогностическим признакам большой выборки за короткий срок.

Преимущества и недостатки рандомизированных контролируемых исследований

Преимущества:

  • · Результаты исследований не зависят от мнения исследователей, систематическая ошибка не оказывает большого влияния. обеспечивает отсутствие различий между группами.
  • · Наиболее убедительный способ проведения
  • · Контролируют известные и неизвестные искажающие факторы
  • · Возможность проведения в последующем мета-анализа

Недостатки:

  • · Высокая стоимость.
  • · Методика выполнения сложна, сложность отбора пациентов (обычно в исследования, какими бы крупными они не были, можно включить только 4-8% больных из всей популяции с данным заболеванием), что приводит к снижению обобщаемости результатов на популяцию, т.е. доказанные в исследовании результаты можно распространять только на больных, идентичных включенным в рандомизированные исследования.
  • · Этические проблемы.

Рандомизированные контролируемые клинические исследования (РКИ) проводятся с середины прошлого века. Их гуманистическая направленность стала ответом научного сообщества на проведение экспериментов на людях во время Второй мировой войны в фашистских концлагерях. РКИ являются фундаментом доказательной медицины, так как на их основе происходит принятие научно-обоснованных решений и проводится мета-анализ. Поэтому целесообразно более подробно остановиться на особенностях их планирования и проведения. РКИ предполагают использование тонких и чувствительных операционных и статистических методов во время проспективного исследования, в котором сопоставляемые группы получают различные виды анализируемых вмешательств, лица контрольной группы - стандартное по современным представлениям лечение.

Отличительной особенностью современных РКИ является неукоснительное следование этическим нормам. Перед началом любого РКИ его протокол должен быть одобрен национальным или региональным этическим комитетом (часто и тем, и другим). В дальнейшем этический комитет в обязательном порядке информируется о серьезных побочных эффектах, возникших в ходе РКИ и всех изменениях в протоколе. До включения в исследование его потенциальный участник должен на добровольной основе подписать информированное согласие, где в доступной форме должна быть изложена цель исследования, возможные осложнения или неудобства, преимущества, связанные с участием больного в исследовании, и альтернативные методы лечения. Пациент должен быть проинформирован о том, что решение о его участии или неучастии в данном клиническом исследовании на любом этапе выполнения никак не отразится на дальнейшей тактике его ведения, и он в любой момент может прекратить свое участие в РКИ. Только после получения информированного согласия пациент может принимать участие в исследовании. Если РКИ предполагает проведение суб-исследо-

ваний, требующих дополнительного обследования, то на них тоже необходимо получить информированное согласие пациента. В ряде случаев, например при проведении РКИ у детей, информированное согласие подписывают родители или опекуны.

ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ

Для оценки новых методов лечения и диагностики могут применяться два основных вида исследования - контролируемые и неконтролируемые. Неконтролируемое клиническое испытание (без сравнения с уже применяющимся способом терапии или плацебо) новых методов лечения допустимо только в исключительных случаях, когда новый метод позволяет спасти жизнь или радикально улучшить прогноз у пациентов, страдающих неизлечимым заболеванием (в настоящее время большинство таких исследований связано с ВИЧ-инфекцией). Необходимо подчеркнуть, что даже в этом случае предполагаемая польза нового метода должна быть убедительной и сопоставимой, например, с эффектом инсулина при сахарном диабете I типа.

Особняком стоят неконтролируемые клинические испытания при изучении новых лекарственных препаратов на этапе фазы I и II их клинического исследования, когда на здоровых добровольцах и ограниченном числе пациентов определяются фармакокинетические и фармакодинамические характеристики нового метода лечения.

Актуальность проведения контролируемых клинических исследований в настоящее время существенно возросла, так как они необходимы не только для доказательной медицины, но и при выполнении рутинной научной работы, в том числе и диссертационных исследований клинической направленности.

Планирование РКИ начинается с формулирования цели и задач исследования, которые отличаются новизной и практической значимостью. Цель исследования должна отличаться как научной новизной, так и практической значимостью. Например, именно таким исследованием было SYST-EUR, результаты которого в значительной степени реабилитировали антагонисты кальция в лечении артериальной гипертензии, когда на них обрушилась волна критики по результатам не совсем корректного мета-анализа.

Поэтому, как правило, крупные многоцентровые РКИ планируют известные в своей области специалисты. Каждое новое РКИ оригинально по дизайну и популяции пациентов, участвующих в нем (определяется критериями включения и исключения), поэтому уже существующие протоколы не могут быть полностью воспроизведены вновь, хотя и могут служить некой базой для адаптации. В качестве примера решения сходной задачи можно привести два сильно различающихся как по дизайну, так по итоговым результатам протокола исследований ALLHAT и ASCOT. Точная формулировка основной цели имеет решающее значение. Так, можно в качестве примера привести исследование ELITE I, в котором сравнивалась эффективность ингибитора АПФ каптоприла и антагониста рецепторов ангиотензина II лозартана у пациентов с хронической сердечной недостаточностью. Достоверных различий между этими двумя режимами терапии не выявлено, но цель исследования была «доказать преимущества лозартана», и она не была достигнута. Однако новый класс препаратов, оказавшийся не хуже эталонных ингибиторов АПФ, стал важным событием для кардиологов. Если бы целью исследования было доказательство равнозначной эффективности лозартана и каптоприла при хронической сердечной недостаточности, никакой последующей полемики попросту не возникло.

Задачи, решаемые в РКИ, не должны быть многочисленными, поскольку это может привести к ложноположительным результатам и затруднить интерпретацию полученных данных для практики.

КОНЕЧНЫЕ ТОЧКИ

Существуют «жесткие» и «мягкие» (суррогатные) конечные точки, оцениваемые в РКИ. К жестким конечным точкам относят, например, общую и сердечно-сосудистую смертность, инсульт, инфаркт миокарда. Примерами суррогатных конечных точек являются гипертрофия левого желудочка, фракция выброса, уровень липидов, глюкозы крови т.д. R.J. Temple определяет суррогатные конечные точки как «...косвенный критерий оценки в клиническом испытании - лабораторный показатель или симптом, который заменяет клинически значимый исход, прямо характеризующий самочувствие больного, его функциональное состояние и выживание. Изменения косвенного

критерия оценки, вызываемые лечением, должны отражать изменения клинически значимого критерия (исхода)». Необходимость использования суррогатных конечных точек обусловлена тем, что для получения статистически достоверного влияния вмешательства на жесткие точки необходимо обследовать большое число пациентов и наблюдать их на протяжении длительного времени. Суррогатные конечные точки (типичные для каждой нозологии) позволяют существенно уменьшить длительность исследования и количество больных, участвующих в нем. Однако обязательно нужно помнить: выбранные суррогатные точки должны иметь доказанное влияние на прогноз исследуемого заболевания. Безусловно, выбранным конечным точкам необходимо иметь не только научное, но и клиническое значение. Предпочтение отдается объективным (например, развитие инсульта, подтвержденное компьютерной томографией), стандартизованным критериям (индекс массы миокарда левого желудочка по данным эхокардиографии) и дискретным показателям эффективности (показатели типа да/нет, жив/умер, госпитализация/отсутствие госпитализации, улучшение/ухудшение), по которым рассчитывается абсолютный и относительный эффект вмешательства и их легко интерпретировать практическому врачу.

В многих РКИ выделяют основные конечные точки, по которым оценивается эффективность вмешательства, и второстепенные конечные точки, учитывающие другие аспекты этого вмешательства (например, побочные эффекты, качество жизни, когнитивные нарушения, лабораторные показатели и т.д.). Хотя в ряде случаев последние сами могут становиться основной конечной точкой (например, когнитивные изменения в исследовании SCOPE, холестерин - в исследованиях по атеросклерозу, уровень креатинина - в исследованиях по почечной недостаточности, артериальной гипертензии и сахарному диабету).

В последнее время в РКИ стали широко использоваться так называемые комбинированные конечные точки, объединяющие сразу несколько показателей. Например, в исследовании PREAMI конечной точкой являлся показатель смерть + госпитализация с сердечной недостаточностью + сердечное ремоделирование. Как видно, здесь использованы как жесткие, так и суррогатные конечные точки.

Существенно облегчить задачу по выбору оптимальных конечных точек при планировании исследований может использование существующих баз данных о клинических исходах (табл. 7.1).

Таблица 7.1. Источники информации рекомендуемых для оценки клинических показателях при проведении исследований

Еще одной особенностью современных РКИ является проведение суб-исследований (суб-протоколов) в рамках основного РКИ, которые используют дополнительные методы обследования и позволяют ответить на дополнительные вопросы, остававшиеся за рамками основного РКИ.

Длительность исследования (интервал времени от момента рандомизации больного и осуществления вмешательства до момента

оценки конечного исхода заболевания) определяется целью и задачами исследования, зависит от характера патологии, особенностей естественного течения заболевания, риска развития исследуемых осложнений и времени, необходимого вмешательству для оказания потенциального влияния на выбранные конечные точки.

ВЫБОР БОЛЬНЫХ

Вторым по значимости разделом РКИ (после формулирования цели и задач исследования) является определение критериев включения и исключения из исследования. Критерии включения предопределяются целью исследования, более широкие из них облегчают набор пациентов и позволяют экстраполировать полученные результаты на большую популяцию больных. Однако в этом случае существует опасность формирования разнородных исследуемых групп больных как по исходным клинико-демографическим показателям, так и по эффективности тестируемого вмешательства. Обычно в РКИ включают пациентов со средней тяжестью заболевания, хотя у пациентов с исходно более высоким риском осложнений можно в более короткие сроки оценить эффект вмешательства на жесткие конечные точки. Группа пациентов с низким риском и легким течением заболевания требует длительного наблюдения и потенциально опасна в получении статистически достоверного эффекта вмешательства, тогда как на самом деле оно может оказаться эффективным.

Критерии исключения должны минимизировать возможность ошибок при проведении исследования (например, исключение из исследования больных с терминальной стадией заболевания, сниженной функцией печени и почек). Если данный контингент пациентов не является предметом РКИ, в него обычно не включают несовершеннолетних, женщин в период беременности и лактации или не использующих контрацепцию, онкологических и психических больных. Важной задачей критериев исключения является обеспечение одинакового лечения и ведение пациентов в исследуемой и контрольной группах, а также исключение применения в них во время исследования препаратов, сходных с испытуемым.

В целом чем крупнее РКИ и чем быстрее его планируют закончить, шире должны быть критерии включения и тем меньше критериев исключения.

РАЗМЕР ИССЛЕДОВАНИЯ

Никаких нормативов, кроме получения необходимой статистической достоверности при определении числа пациентов, участвующих в исследовании, не существует. Небольшое количество пациентов не позволяет добиться однородности сравниваемых групп и статистически достоверного эффекта вмешательства. Размер РКИ зависит от ожидаемого клинически значимого эффекта вмешательства.

Типичным исходным показателем, необходимым для расчета размера РКИ, является ожидаемый исход заболевания при стандартном общепринятом лечении на момент планирования исследования. Кроме этого, весьма полезными оказываются данные закончившихся РКИ по аналогичной тематике.

Принято считать, что снижение относительного риска исхода заболевания на 20% является клинически значимым. При этом степень достоверности получения ложноположительного обычно устанавливается на уровне 0,05 («а» или «I тип ошибки»). В свою очередь степень достоверности ложноотрицательного результата обычно устанавливается на уровне 0,1 («b» или «II тип ошибки»).

Размер РКИ, в котором в качестве критериев эффективности вмешательства используются дискретные показатели исхода заболевания, всегда больше, чем размер такого же РКИ, но в котором критерием эффективности вмешательства являются продолженные показатели исхода заболевания (средние величины показателя или функционального исхода).

Достаточность групп наблюдения зависит от степени предполагаемых различий в эффекте вмешательства в опытной и контрольной группах, видом статистического показателя эффекта вмешательства (частоты, средние величины). Естественно, чем больше ожидаемое различие в эффекте между ними, тем меньше окажется необходимое число наблюдений.

При одинаковой степени точности необходимое число наблюдений будет значительно меньше, когда для оценки эффекта вмешательства используются средние величины, а не частотные показатели.

При проведении исследования очень важно получить достоверную информацию об эффективности вмешательства в возможно более сжатые сроки. Для этого используют многоцентровые РКИ. В них происходит кооперирование (часто международное) и стандартизация исследовательских центров по единой программе и методам наблюдения, что позволяет получить сопоставимые данные разных учреждений.

РАНДОМИЗАЦИЯ

Надежность данных РКИ прямо зависит от сопоставимости сравниваемых групп. Категорически нельзя сравнивать группы, в одну из которых были включены пациенты с анализируемым вмешательством, а в другую - отказавшиеся от участия в РКИ и получавшие «традиционную» терапию. Также нельзя сопоставлять результаты нового метода лечения в разных клиниках, если они не проводили его оценку по одному общему протоколу (различий в технической оснащенности, квалификации кадров и принятых стандартах лечения). Аналогичные недостатки имеет и метод «исторического контроля».

Одно из обязательных условий надежности исследования - сопоставимость сравниваемых групп. Очень часто в публикуемых исследованиях нарушается этот важнейший принцип. Например, группы несопоставимы, если в одну из них включаются больные, леченные новым методом, а в другую - отказавшиеся от него. Согласие больного подвергнуться лечению новым методом зависит от типа нервной деятельности, степени выраженности заболевания, общего состояния, возраста и прочих факторов, которые могут иметь прогностическое значение. Иногда сопоставляются результаты нового метода лечения, проводимого в одной клинике, с эффективностью стандартного способа лечения, используемого в других лечебных учреждениях. В этом случае неоднородность групп еще больше увеличивается за счет различий в технической оснащенности и квалификации кадров, использования разных вспомогательных лечебных методов и прочего. Примерно такими же недостатками характеризуется метод так называемого «исторического контроля», когда сопоставляются результаты лечения до внедрения нового метода с эффективностью современного лечения, т.е. сравнивают специально подобранную для применения нового метода лечения группу больных с неподобранной группой «прошлого». К рандомизации также не относятся методы, при которых больных распределяют в опытную и контрольную группы в порядке поступления, по начальным буквам имен и фамилий, по нечетным и четным дням включения в исследование, дате дня рождения. При таком отборе врач может предвзято включить пациента с хорошим, по его мнению, эффектом от вмешательства в «правильную» группу и наоборот.

Рандомизация является ключевым моментом при проведении РКИ. Она должна обеспечить случайное распределение больных,

не зависящее от желания врача или каких-либо других факторов, и сопоставимость сравниваемых групп по клинико-демографическим характеристикам пациентов, тяжести основного исследуемого заболевания, сопутствующей патологии и проводимой терапии.

При небольшом числе пациентов в группах даже правильно проведенная рандомизация не может обеспечить их однородность. В этом случае используется предварительная стратификация (stratum - слой, пласт), при которой распределение вариантов вмешательства происходит в более однородных группах больных, изначально сформированных по одному или нескольким важным признакам. Различия пациентов по этим ключевым признакам должны быть минимальными. Такой подход практически гарантирует получение надежных результатов и отсутствие систематической ошибки. Отсутствие систематической ошибки в РКИ называют обоснованностью (validity).

Наиболее частой причиной несопоставимости сравниваемых групп после рандомизации может быть включение в анализ не всех участвовавших в исследовании пациентов.

Существует большое количество методов рандомизации: метод непрозрачных запечатанных и последовательно пронумерованных конвертов, компьютерный метод (процедура рандомизации на основе метода генерации случайных чисел проводится специалистом, непосредственно не участвующим в лечении), метод пронумерованных идентичных контейнеров, подготовленных фармацевтической фирмой (код и истинное содержание контейнеров не известны ни пациентам, ни врачам, участвующим в исследовании), централизованная рандомизация по телефону (IVRS) специалистом фармацевтической фирмы. Наиболее объективным считается последний из них, а наименее объективным - метод конвертов.

При рандомизации необходимо соблюсти одно важное условие - непредсказуемый характер распределения больных на группы (нельзя предугадать, в группу вмешательства или контроля попадет пациент). Ни пациент, ни исследователь не должны знать, в какие группы попадают пациенты. Это достигается при использовании «слепого», «двойного слепого» и даже «тройного слепого» отбора. Если о назначаемом вмешательстве известно только врачу, такая организация РКИ называется «простым слепым испытанием» (single-blind trial). Если все лица исследовательского центра, общаю-

щиеся и работающие с пациентами, не знают, кто из них какое лечение получает, то это «двойное слепое испытание» (double-blind trial). Подобная организация РКИ абсолютно необходима в тех случаях, когда велика роль сопутствующего лечения, например при антибиотико- и химиотерапии.

Часто процесс «ослепления» достаточно сложен, например традиционная терапия предполагает применение таблетированных форм, а новое вмешательство использует инъекции. В этом случае в первой группе лечение придется дополнить введением физиологического раствора, а во втором - приемом плацебо per os. Нелишне отметить, что вид, органолептические свойства и кратность назначения сравниваемых препаратов должны быть одинаковыми.

В настоящее время существует несколько причин, по которым в научных исследованиях рандомизация не используется:

Незнание врачами-исследователями основ доказательной медицины;

Слепое следование традиционной практике и боязнь получить результаты, отличные от общепринятых и мнения авторитетов;

Боязнь применить у пациента менее эффективный метод вмешательства, но именно ради выявления его реальной эффективности проводится РКИ;

Существующее негативное общественное мнение, отождествляющее РКИ с испытаниями на людях.

В тоже время в последние годы термин «рандомизация» стал использоваться авторами публикаций как «магическое заклинание», гарантирующее авторам отсутствие критики и повышающее их научный рейтинг самооценки. Истинная рандомизация подменяется ее декларированием, проявляется несопоставимостью сравниваемых групп и «информационным шумом» от выводов по некачественно сделанным исследованиям. Так, K.F. Schultz et al. считают, что только 9-15% статей в медицинских журналах имели истинную рандомизацию.

ДИЗАЙН ИССЛЕДОВАНИЙ

Сегодня для решения конкретного клинического вопроса идентифицированы оптимальные типы (табл. 7.2) и дизайны (рис. 7.1) исследований. Каждый из видов исследований имеет свои достоинства и недостатки (табл. 7.4).

Таблица 7.2. Клинические вопросы и оптимальные типы исследований для их решения

Важно понять, что структура исследования, в существенной мере предопределяемая поставленным клиническим вопросом, прямо влияет на степень доказательности полученных данных (табл. 7.3).

Рис. 7.1. Наиболее часто используемые дизайны проведения клинических исследований

Таблица 7.3. Уровень доказательности исследований в зависимости от их структуры при оценке эффективности вмешательства

Таблица 7.4. Достоинства и недостатки исследований с различной структурой

АНАЛИЗ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ

Главной задачей статистического анализа РКИ является установление разницы и степени ее достоверности по исходам (конечным

точкам) между группой с анализируемым вмешательством и контрольной группой. В настоящее время существует много пакетов статических программ для анализа полученных результатов (BMDP, SOLO, Statistica и другие). Для получения объективной информации об эффективности вмешательства в анализ необходимо включать всех первоначально рандомизированных больных (intention-to-treat analysis), а не только тех, которым лечение проведено в строгом соответствии с протоколом исследования (on protocol analysis). Это один из основных способов минимизировать возможные ошибки, когда при intention-to-treat analysis исходят из допущения, что все пациенты получили лечение, предписанное при рандомизации.

Выбывание пациентов из исследования по разным причинам (отказ от дальнейшего участия, побочные эффекты и плохая переносимость лечения, нарушения протокола пациентами или исследователями) не должно превышать 15% от исходного числа рандомизированных больных. Если процент выше, результаты исследования некорректны. Такой подход существенно снижает вероятность получения ложноположительного результата, когда на самом деле он отсутствует. Считается: если более 80% из включенных больных наблюдались до конца исследования, его результаты могут быть достаточно надежными.

Для статистического анализа большого массива дискретных конечных точек вычисляют c-квадрат. При малой выборке (число пациентов менее 30 в каждой из групп вмешательства) используют методы непараметрической статистики (тесты Фишера или Йетса).

Результаты исследования представляются с использованием следующих показателей: число больных, которых необходимо пролечить для того, чтобы предотвратить один нежелательный исход заболевания, абсолютного/относительного риска нежелательного исхода и их снижения с указанием статистической достоверности.

ПУБЛИКАЦИЯ РЕЗУЛЬТАТОВ

Часто статью с итогами РКИ предваряет опубликование его наиболее значимых результатов и выводов в материалах крупных международных конференций и съездов. Структура статьи имеет обычный характер. Обязательным требованием является максимально широкое представление дизайна и статистических аспектов РКИ. Особый интерес может представлять обсуждение результатов, так как они

могут дать дополнительную информацию о спорных моментах при его проведении.

В настоящее время для проведения РКИ разработаны этические и методологические стандарты. Необходимо помнить о том, что плацебо-контролируемые исследования оправданы, когда не существует альтернативного способа лечения, эффективность которого не вызывает сомнений.

Сегодня врачам, исследователям и организаторам исследований необходимо непрерывно повышать не только профессионализм, но и уровень знаний в области доказательной медицины, правоведения и GCP. При этом само проведение РКИ - не только наука, но и особый (и достаточно прибыльный) медицинский бизнес, что предъявляет еще более высокие этические требования ко всем его участникам.

Литература

1. Pocock S.J. Clinical trials. A practical approach. - John Wiley & Sons

2. Guyatt G.H. et al. Users" guides to the medical literature. II. How to use an article about therapy or prevention. A. Are the results of the study valid // JAMA. - 1993. - Vol. 270. - Р. 2598-2601.

3. Guyatt G.H. et al. Users" guides to the medical literature. II. How to use an article about therapy or prevention. B. What were the results and will they help me in caring for my patients // JAMA. - 1994. - Vol. 271. - P. 59-63.

4. Begg C. et al. Improving the quality of reporting of randomized controlled trials. The CONSORT statement // JAMA. - 1996. - Vol. 276 -

5. Jadad A. Randomized Controlled Trials. A Users Guide BMJ Publishing Group. - London, 1998.

Рандомизированные клинические испытания (РКИ) остаются основным методом и «золотым стандартом» проверки безопасности и эффективности новых лекарственных и биологических препаратов, например, вакцин, хирургических и системных вмешательств. Рандомизированные клинические испытания (РКИ) имеют ряд характерных особенностей. Они являются контролируемыми, рандомизированными и обычно «ослепленными»; помимо этого, значимость результатов определяют с помощью статистических методов по заранее установленному алгоритму. В ходе рандомизированных испытаний обычно происходит сравнение двух и более методов лечения (например, препарата А с препаратом В) с целью выявления их сходных свойств или преимуществ одного над другим в лечении, диагностике или профилактике того или иного заболевания. Хотя лишь немногие из существующих кодексов исследовательской этики, рекомендаций или регуляторных документов содержат указания на специфические проблемы из области морали, возникающие при проведении рандомизированных клинических испытаний, организация таких испытаний создает целый спектр уникальных этических проблем.
«При работе над рандомизированными среднестатистический представитель этического комитета бывает сбит с толку их сложностью и множеством возникающих проблем».

Этическое обоснование для проведения рандомизированного испытания обычно описывают как «нулевую гипотезу», или равновесие, или клиническое равновесие. В рандомизированном клиническом испытании свойства вмешательств А и В считают клинически уравновешенными, если не существует убедительных доказательств о превосходстве одного из них (например, свидетельств о том, что препарат А более эффективен или менее токсичен, чем В). Задачей рандомизированных клинических испытаний является нарушение этого равновесия путем получения обоснованных доказательств относительной ценности каждого из этих методов.

В основе идеи о «равновесии » лежит представление о том, что даже в ходе клинического исследования пациентам должно быть назначено более эффективное лечение, а не то, которое признано менее эффективным, и пациентам нельзя отказывать в доступном более эффективном лечении. В рандомизированных клинических испытаниях назначение каждой группе пациентов разного вида терапии является приемлемым с точки зрения этики, поскольку пациенты не знают о том, какое из них более или менее эффективно; по этой же причине все участники исследования имеют равные шансы получить именно эффективный метод лечения. Говоря о «равновесии», необходимо упомянуть ряд спорных моментов.
Некоторые утверждают, что «равновесие » возникает вследствие недопустимого слияния исследовательской работы с лечением пациентов, а потому такой подход следует запретить.

В существуют и другие спорные моменты. Например, не существует общепринятого представления О том, что такое «убедительные доказательства». Общепринятое определение статистической значимости результата при значении р = 0,05, означающего, что различия между вмешательствами в рандомизированных клинических испытаниях случайны менее чем в 5% случаев, создает возможность для исключения клинически значимых, но статистически недостоверных методов. Существуют разногласия и о степени влияния предварительных результатов, данных предыдущих исследований, неконтролируемых и пилотных исследований, а также исторических данных на баланс доказательств. В некоторых случаях существование данных такого типа делает «равновесие» невозможным. Однако применение данных небольших неконтролируемых исследований может привести к возникновению ошибочного впечатления о безопасности и эффективности методов лечения, которые на самом деле могут оказаться вредными.

Недостаточное количество убедительных доказательств о преимуществах того или иного метода лечения в долговременной перспективе в определенной группе пациентов не обязательно помешает принять решение о том, что будет лучшим для конкретного пациента в данный момент времени. Уникальные симптомы, побочные эффекты, преимущества, предпочтения и другие факторы могут привести к тому, что один из методов лечения будет более предпочтителен для данного пациента, чем другие; в таком случае пациент вряд ли является подходящим кандидатом для участия в рандомизированных клинических испытаниях. Врачи, ответственные за лечение пациента, всегда должны принимать во внимание эти факторы. Если врач в то же время является и исследователем в испытаниях, в которых участвует его пациент, может возникнуть ролевой конфликт. В такой ситуации для соблюдения прав пациента может потребоваться помощь других участников исследовательской группы, информирование пациента или в некоторых случаях разделение обязанностей исследователя и врача.

Другим важным научным и этическим вопросом является выбор переменных, которые будут результатами исследования, и оценка преимуществ того или иного метода. Использование различных параметров для оценки эффективности лечения, например, выживаемости, уменьшения размеров опухоли, регресса клинических проявлений, искусственных конечных точек качества жизни, может привести к различным выводам. Выбор конечных точек никогда не является чисто научным вопросом.

В рандомизированных клинических испытаниях пациентам назначают лечение в результате рандомизации. Это означает, что каждому участнику рандомизированных клинических испытаний лечение назначают случайным образом с помощью компьютерных программ или с использованием таблиц случайных чисел, а не исходя из индивидуальных потребностей и особенностей. Целью рандомизации является контроль вмешивающихся факторов путем создания двух или более групп лечения, сходных по релевантности и другим параметрам, которые нельзя контролировать иначе. Помимо рандомизации в исследованиях нередко применяют одинарное (пациент не знает, какое ему назначено лечение) или двойное ослепление (ни пациент, ни исследователь не знают, какое лечение было назначено).

Рандомизацию и ослепление применяют для уменьшения ошибок и получения более достоверных результатов. Хотя рандомизация и ослепление способствуют достижению целей исследования, они не всегда действуют в интересах пациента. Было показано, что в некоторых слепых плацебо-контролируемых исследованиях как исследователь, так и испытуемый могут догадаться (чаще, чем этого можно ожидать при случайном распределении), получает пациент лекарственный препарат или плацебо.37 Таким образом, необходимость и эффективность ослепления и рандомизации следует оценить еще на стадии планирования исследования и изучения протокола. Если рандомизация и ослепление признаны полезными и подходящими для применения в исследовании, возникают два основных этических вопроса: (1) предпочтение того или иного метода лечения и информация о том, какое лечение будет назначено, могут быть важными для принятия самостоятельного решения; (2) информация о проводимом лечении может потребоваться при оказании медицинской помощи при побочных эффектах и в других экстренных ситуациях.

Что касается первого пункта , когда пациент дает согласие на участие в рандомизированном исследовании, ему сообщают о целях исследования и просят согласиться с назначением случайного лечения и с тем, что он временно не будет знать, какое именно лечение получает. Чтобы найти баланс между научной объективностью и уважением к потребности человека в информации, необходимой для принятия решения, исследователи должны предоставить участникам испытаний достаточный объем данных о целях и методах рандомизации и ослепления, а также оценить, насколько участники исследования понимают их суть. Участникам исследования предлагают согласиться, что они не будут получать информации о проводимом лечении до его завершения или другого заранее установленного момента, после которого их полностью информируют.

Информация о принимаемых пациентом препаратах может потребоваться при оказании помощи при побочных эффектах и других осложнениях, вызванных лекарственными средствами, что является проявлением заботы о безопасности и здоровье участников исследования. Чтобы сохранить равновесие между требованиями научной объективности и безопасностью пациентов, исследователи должны заранее предусмотреть условия, допускающие прекращение «ослепления» для лечения нежелательных эффектов. В частности, в протоколе должно быть указано местонахождение кодов, обстоятельства, допускающие их раскрытие (если такие предусмотрены), лицо, имеющее полномочия это сделать, способ передачи информации (т. е. будут ли поставлены в известность исследователь, пациент, этический комитет и лечащий врач) и то, как раскрытие данных повлияет на анализ результатов. Участники исследования должны знать, к кому обратиться в экстренной ситуации. Этический комитет должен убедиться, что разработанный план действий отвечает требованиям безопасности пациентов.

В настоящее время большое внимание стали уделять вопросу о доступности для участников исследования изучаемых эффективных методов лечения после завершения испытаний. Существует мнение о том, что добровольцы, участвовавшие в рандомизированных клинических испытаниях, заслуживают гарантированного доступа к лечению, эффективность которого была доказана в исследовании. Т. е. участники исследования, которые попали в группу лечения, оказавшегося более эффективным, продолжат его получать, а те, кто попал в группу, где было назначено менее эффективное лечение, получат доступ к тому, что было признано лучшим. Существует ряд возражений по поводу обязанностей исследователей и спонсоров по обеспечению такого доступа. Требуется решение вопроса о практической реализации такого доступа и необходимых для этого ресурсах.

Дать согласие на рандомизацию для пациента может быть сложнее, если в одной из групп будет применяться плацебо. Многие пациенты тяжело воспринимают возможность назначения плацебо, поскольку это может лишить их возможности получать необходимое лечение. С другой стороны, при «клинической равноценности» препаратов и отсутствии доказательств преимуществ экспериментального лечения пациенты, получающие плацебо, просто оказываются избавленными от токсического воздействия бесполезного препарата. С точки зрения науки, сравнение экспериментального препарата или метода лечения с плацебо является наиболее результативным и надежным методом оценки его эффективности.

В качестве альтернативы в рандомизированных исследованиях может производиться сравнение нового метода лечения с уже существующим, что позволяет исследователям выявить преимущество одного над другим или их равноценность (т. е. отсутствие различий между экспериментальным препаратом и стандартной терапией, применяемой в группе контроля). Проведение пла-цебо-контролируемых исследований обосновано в том случае, когда никакое другое лечение не разработано, когда новые данные позволяют усомниться в эффективности стандартного лечения или при исследовании на пациентах, невосприимчивых к стандартной терапии или отказавшихся от нее.40 В исследованиях, соответствующих этим критериям, применение плацебо не наносит вреда его участникам и не является нарушением их прав. Под вопросом остается правомерность применения плацебо при наличии доступных альтернативных методов лечения. Некоторые авторы считают применение плацебо в таких случаях недопустимым в силу самого факта и противоречащим принципам Хельсинкской декларации.