Задача тестовой фазы (фаза III) — обеспечить технику интервенции по возможности широкой эмпирической базой. Во-первых, желательны так называемые мультицентрические исследовательские работы, когда несколько учреждений составляют общий план эксперимента. Такой метод несет с собой определенные проблемы (например, координация, стандартизация), на которых здесь мы не будем останавливаться. Но не менее важна и репликация данных, проведенная путем независимых друг от друга исследований (перекрестная валидизация). Кроме того, при реализации разных исследований встает вопрос: как обобщить данные отдельных работ и какие рекомендации по лечению вытекают из литературы. Ниже предлагаются два подхода: метаанализ и каталоги критериев, рекомендации лечения. Оба подхода имеют значение также для интеграции данных фазы IV (практический контроль).
Метаанализ
Прежде в целях интеграции данных составлялись нарративные сборные рефераты, в которых более или менее полно (это зависело от скрупулезности составителя) была представлена соответствующая литература. Благодаря использованию банков данных степень этой произвольности снизилась и литературу можно обрабатывать систематически. Помимо систематического использования банков данных добавились статистические методы обработки результатов, благодаря чему в распоряжении появился новый метод обработки литературы, который называется метаанализ (англ. Meta-analysis)(понятие Glass: Lipsey & Wilson, 1993). В метаанализе вся имеющаяся литература систематически оценивается с помощью статистических методов. Метаанализ применяется не только в исследовании клинико-психологических интервенций, но и в других, самых разных областях науки. Если первичный (оригинальная оценка) и вторичный анализ (расширенная оценка данных первичного анализа) — предмет отдельных исследований, то в метаанализе интегрируются данные нескольких работ (Fricke & Treinies, 1985). Метаанализ может осуществляться по-разному и не является унифицированным методом (см. Lipsey & Wilson, 1993; Rosenthal, 1995). Тем не менее этот метод протекает по общей схеме, как можно видеть из табл. 20.5.
(2.2) Стратегия поиска (как правило, поиск литературы при помощи компьютера)
Пример. PsyINFO / PsycLIT, PSYNDEX, MEDLARS и т. д.
(2.3) В случае необходимости — отбор найденной литературы на основе других критериев
Пример. Число пациентов в лечебной группе должно быть больше, чем X
(3) Разработка системы описания (системы кодирования, системы рейтинга) отдельных работ
(3.1) Структура (содержание) работы (здесь: для психотерапевтических работ; см. также табл. 20.4)
Пример. Библиографические указания; планирование экспериментов (факторы, временнАя сетка и т. д.); сведения о психотерапевтах, пациентах, интервенциях; инструменты для измерения процесса и успеха; статистика и т. д.
(3.2) Квантификация результатов исследований
Пример. Классифицирование значимых результатов (изменение р<0,05: +; р>0,05: -); вероятности (In-Funkion);сила эффектов (d, r и т. д.) с доверительным интервалом и т. д.
(3.3) Оценка работы (главным образом — валидность по Куку и Кемпбеллу: внутренняя, внешняя, статистическая валидность, валидность конструкта)
Пример. Профиль качества (Grawe et al., 1994); клиническая релевантность, внутренняя валидность, качество информации, осторожность при интерпретации, содержательность измерения, качество и содержательность итоговой оценки, содержательность результатов, релевантность индикации
(4) Проверка единодушия в оценках относительно системы описания (в случае необходимости — ревизия)
(5) Оценка отдельных работ по системе описания
(6) Обработка данных
Пример. Суммирование значений вероятности (суммирование, In-функция и т. д.); средняя сила эффекта; связь данных структуры и данных оценки с силой эффекта (например, обладают ли исследования с более опытными психотерапевтами более высокой силой эффекта, чем исследования с неопытными психотерапевтами)
(7) Представление результатов и интерпретация
(8) Документация (особенно список использованных работ; при необходимости — обзорные таблицы по отдельным работам, включающие наиболее важные параметры)
Для каждого пункта предлагается часто несколько разных решений. Особое значение имеет квантификация результатов исследований с привлечением таких параметров, которые не зависят от масштаба отдельных признаков, благодаря чему можно сравнивать разные работы. Нередко в качестве такого параметра берется сила эффекта ES, базирующаяся на коэффициентах корреляции или d-коэффициенте; при этом различные подходы можно переводить один в другой (Fricke & Treinies, 1985):
Сила эффекта ES (effect size): d =(MT - MK) / SK,
где MT, MK — средние значения по окончании терапии в терапевтической группе (T) и контрольной группе (K);
SK — стандартное отклонение контрольной группы в конце терапии.
За масштаб сравнения берутся контрольные группы без лечения или получавшие незначительное лечение. Сила эффекта может быть малой (d = 0,20), средней (d = 0,50) и большой (d = 0,80). При нормальном распределении послетестовых значений сила эффекта в d = 0,85 (значение по Smith, Glass & Miller, 1980) означает, что некий средний индивид (процентный ранг PR = 50) в результате терапии достигает значения критерия PR = 80 (z = 0,85), что говорит об однозначном улучшении. В этой методике предлагаются разные способы вычисления и разные статистические проверочные тесты для силы эффекта (Lipsey & Wilson, 1993). Если контрольной группы нет, можно вычислять силу эффекта на лечебную группу и сопоставлять их: (Мпре - Мпост) / S. Мпре — среднее значение в начале терапии; Мпост — среднее значение в конце терапии; S — распределенное стандартное отклонение предтестовых значений всех лечебных групп (Grawe et al., 1994).
Метод метаанализа вызвал острые дискуссии между его сторонниками и критиками (о критике см. Lösel, 1987). Критикуют метаанализ, в частности, по следующим пунктам: нельзя обобщать исследовательские работы, качественно различающиеся с методической точки зрения; в рамках отдельного исследования данные зависят друг от друга, поэтому на работу можно вычислить только одну-единственную среднюю силу эффекта; терапевтические методы различаются по количеству и выбору способов исследования, что приводит к проблемам при сопоставлении; в метаанализе не учитываются данные процесса и работы по изучению отдельных случаев. Все эти аргументы против метаанализа, конечно, имеют вес, и все же они не являются принципиальными. Как видно из дискуссий по поводу результатов метаанализов (Grawe, Donati & Bernauer, 1994), метаанализ — как и любое эмпирическое исследование — можно подвергнуть критике в разных плоскостях. Но особенно обостряются эти дискуссии, когда речь заходит о мероприятиях политики в сфере здравоохранения, базирующихся на метаанализе.
Обобщая, можно сказать, что метаанализ играет важную роль и в оценке клинико-психологических интервенций. Прежде всего он предоставляет описания, но может и доказывать различия в эффективности разных форм терапии. Однако различия оцениваются — и это относится ко всем статистическим важным вопросам — в зависимости от конвенций (альфа-риск и т. д.), и наряду со статистической значимостью необходимо учитывать и клиническую значимость. Поэтому при оценке терапевтических методов нельзя ориентироваться исключительно на метаанализ; здесь нужны и другие подходы.