Многие важные социальные и политические события иногда повторяются, а не случаются лишь единожды, а социальные и политические процессы порой тянутся на протяжении нескольких лет. В результате исследователям часто приходится изучать взаимодействия объектов, разделенных во времени. Средством для этого является [c.459] анализ временных рядов. Он используется, когда нужно объяснить, что случилось в прошлом или прогнозировать события в будущем. Способы применения временных рядов сложны и требуют основательной подготовки. Они, однако, подходят для решения настолько большого круга исследовательских задач и так часто используются в разработках важных проблем, что даже начинающие должны иметь некоторое представление об их основных принципах.
Временные ряды – это просто комплекс наблюдений, в которых одна и та же переменная измеряется повторно через определенные интервалы. Государственное агентство занятости может обнародовать цифры по уровню безработицы каждый месяц, международная организация может публиковать ежегодные отчеты об общем объеме международной торговли, маклерская контора может фиксировать индекс Доу-Джонса каждый день. Такие данные можно анализировать методами, основанными на тех принципах регрессии, которые обсуждались ранее. Мы начнем с обсуждения общих подходов к временным рядам и затем рассмотрим два варианта.
Регрессия временных рядов. Исследователям часто бывает необходимо объяснить наблюдаемые тренды (их еще называют секулярными трендами).
Они хотят знать, почему нечто увеличивается или уменьшается, почему оно возрастаетили убывает постоянно или циклически и т.д. Например, нам нужно выяснить, насколько послевоенный (имеется в виду вторая мировая война) рост расходов на вооружения в Соединенных Штатах являлся следствием военных расходов в СССР; для этого мы строим простейшую регрессионную модель:
Y = a + bXt + et,
где Y представляет данные по военным расходам США в виде временных рядов; а – средний уровень расходов в Соединенных Штатах; b – влияние расходов в СССР на расходы в США; Xt – данные по военным расходам СССР в виде временных рядов; et – погрешность, отражающая случайные влияния на расходы в США.
Можно использовать обычную регрессию наименьших квадратов для подсчета коэффициентов в этой модели и [c.460]попытаться объявить или предположить расходы США следствием расходов СССР. Однако для того, чтобы в результате этих подсчетов получить неотклоненные или точные значения коэффициентов, погрешности, соответствующие различным временным точкам, не должны коррелировать, как уже упоминалось при перечислении условий, лежащих в основе регрессионного анализа. Фактически внешние факторы, влияющие на размер расходов США в одной временной точке, вероятно, будут влиять и в другой. Если, к примеру, перспективы заключения контракта заставили Пентагон вложить средства в дорогое оружие абсолютно помимо каких-либо действий с советской стороны, то такое воздействие скорее всего будет сохраняться из года в год; точно так же, если члены конгресса пытаются сохранить в своих военных округах военные контракты и оборудование, их влияние на уровень расходов будет постоянно проявляться. Эти влияния в модели отражены погрешностью. И в результате эти погрешности с течением времени сильно коррелируют.
Эта автокорреляция (ее еще называют серийной корреляцией) нарушает одно из условий регрессионного анализа и может привести к тому, что отклонения коэффициента а и 6 при компьютерной обработке могут быть значительно недооценены. В результате статистическая значимость этих коэффициентов будет сильно вздута, и это может привести нас к мысли, что существует взаимосвязь там, где ее на самом деле нет. По этой причине очень важно проводить тест на наличие автокорреляции и, если таковая присутствует, принять меры к устранению ее воздействия, прежде чем делать какие = либо выводы по моделям, содержащим временные ряды. Существует целый ряд статистических тестов на автокорреляцию и несколько способов ее корректировки10.
Построение временных лагов. Часто обнаруживается, что одно событие влияет на другое только по прошествии некоторого времени. В нашем примере, скажем, маловероятно, что советские военные расходы за один год повлияют на расходы США в тот же год, поскольку уровень расходов планируется заранее и уровень советских военных расходов может быть неизвестен в момент принятия решения о расходах США. Следовательно, иногда необходимо учесть в модели, изображающей влияние одной [c.461]переменной на другую, временной лаг. На простейшем уровне мы можем сделать это, сравнивая расходы США с расходами СССР за предыдущий год. Наша основная модель, таким образом, будет выглядеть вот так:
Yt = a + bXt–1 + et,
где t–1 означает запаздывание в один год.
Прерванные временные ряды. Часто исследователю бывает необходимо определить влияние единичного события на поведение переменной. Например, можно попытаться измерить влияние принятия закона о необходимости пристегивать автомобильные ремни на количество смертельных исходов в автокатастрофах в определенной стране. Для этого нужно собрать данные о количестве смертельных случаев, отмеченных за каждый месяц в течение нескольких лет до принятия закона и нескольких лет после (может быть, следует фиксировать количество смертей в процентах от общего количества людей, вовлеченных в автокатастрофы за месяц, с тем чтобы обеспечить реальную почву для сравнения периодов, в течение которых количество происшествий сильно менялось). Обнаружится, однако, что выяснить влияние закона простым сравнением количества смертей до закона и после его принятия довольно сложно, поскольку мы сравниваем не единичное измерение, а комплекс измерений. Значения могут существенно изменяться как до, так и после принятия закона, так что визуальное изучение данных не даст очевидного результата.
Значения переменных в любых временных рядах могут изменяться по трем основным причинам: (1) секулярные тренды (долговременные тенденции к увеличению или уменьшению); (2) циклические отклонения или сезонность (тенденции к регулярному росту или падению в течение длительного времени) и (3) случайные отклонения (изменения, являющиеся следствием единичных событий, как, например, неожиданная метель для нашего случая, или ошибок в измерении переменной, как, например, случайное отнесение телесных повреждений к числу смертных случаев). Прежде чем мы сможем определить влияние любого конкретного события на временной ряд, необходимо исключить изменения, являющиеся следствием [c.462]трендов, сезонных и случайных факторов. Кроме того, важно осознать, что в любом временном ряду такого типа, вероятно, возникнут серьезные проблемы, связанные с автокорреляцией, поскольку погрешности в разных наблюдениях обычно сильно коррелируют, делая невозможным точный подсчет коэффициентов.
К счастью, в статистике разработан способ, с помощью которого можно приспособить регрессионный анализ к такой ситуации. Этот способ называется авторегрессивные интегрированные движущиеся средние модели (АРИМА – аббревиатура английского названия), они приспособлены к факторным трендам, сезонности и случайным воздействиям извне временных рядов и одновременно к автокорреляции так, что истинное влияние помех ясно видно11. Хотя мы здесь не располагаем достаточным местом, чтобы объяснить, как работают эти методики, исследователям следует знать об их существовании, поскольку они делают возможным использование прерванных временных рядов как форму квазиэксперимента, где вызывающие помехи события (революция, стихийное бедствие, расследование коррупции в государственном учреждении, введение новой технологии и т. д.) рассматриваются как стимул или НП, а значения ЗП выполняют функции контрольной группы12. Такие исследования могут позволить нам сделать некоторые ценные выводы относительно тех причин важных событий, которые не были предусмотрены при постановке задач исследования, и, следовательно, открыть путь к решению целого ряда исследовательских задач, которые иначе могли бы остаться вне сферы нашего внимания. [c.463]
ЗАКЛЮЧЕНИЕ
Мы закончим эту главу двумя оговорками. Во-первых, необходимо понимать, что мы обсудили лишь некоторые из многочисленных многомерных статистик, позволяющих анализировать как интервальные, так и неинтервальные данные. Каждая из этих методик приложима к решению различных аналитических задач. Среди наиболее распространенных методик, которые мы не обсудили здесь, следует упомянуть такие, как: дискриминантный анализ, определяющий статистически значимые различия в дихотомических группах и, таким образом, наилучшим [c.463]образом подходящий для экспериментальных и квазиэкспериментальных работ; анализ вариаций, который используется для проверки гипотез об отличиях средних геометрических в различных группах и может оказаться особенно полезным в определении влияний некоторых “воздействий” или помех на то, как отдельные случаи укладываются в концепцию; факторный анализ, который используется для определения тех факторов, которые отражают наличие связей между кажущимися независимыми переменными. Объяснения того, когда и как можно использовать эти и другие методики, можно найти в списке дополнительной литературы в конце этой главы.
Второе, о чем хотелось бы сказать, – это то, что вышеизложенное на самом деле не подготовит вас к выполнению сложных видов статистического анализа. К счастью, не нужно быть статистиком, для того чтобы использовать наиболее важные методы, поскольку программы статистического анализа как для микро-, так и для персонального компьютера и ЭВМ выполнят для вас все подсчеты, если, конечно, вы знаете, как верно построить анализ. Большинство этих программ имеет хорошо скомпонованные инструктирующие учебники-самоучители, которые помогут разобраться в статистических процедурах и в необходимом программировании. Таким образом, нелюбовь к математике или статистике не должна стать непреодолимым препятствием для относительно сложных видов анализа данных и эмпирических исследований важных политических тем.[c.464]
Дополнительная литература
По статистике существует великое множество доступных книг. Войти в курс дела вам помогут кн.: Мооre D.S. Statistics, 3d ed. – N.Y.: Freeman, 1991. Соuсh J.V. Fundamentals of Statistics for the Behavioral Sciences. – N.Y.: St. Martin Press, 1982; Bohrnstedt G.W., Knoke D. Statistics for Social Data Analysis. – Itasca (Ill.): F.E. Peacock, 1982; Tabachnick B.G., Fidell L.S. Using Multivariate Statistics. – N.Y.: Harper and Row, 1983. Более углубленное изучение статистических приемов содержится в кн.: Касhigan S.K. Multivariate Statistical Analysis. N.Y.: Radius Press, 1982; Lindeman R., Merenda P.P., Gold R.Z. Introduction to Bivariate Multivariate Analysis. – Dallas: Scott Foresman, 1980.
Методы анализа неинтервальных данных детально рассмотрены в кн.: Gibbons J.D. Nonparamctric Statistical Inference. – N.Y.: McGraw-Hill; 1971; Heise D.R. Causal Analysis. – N.Y.: Wiley, 1975. Книга Гиббонса дает прекрасное представление о пат-анализе. О многих статистических методах дают представление книги серии: Quantitative Applications in the Social Science. В большинстве этих книг даны конкретные примеры применения методик, которые в них описаны. См. также о применении статистики: Hubert M., Blalock H.M„ Jr. ed. Causal Models in the Social Sciences. – N.Y.: Aldine, 1985, 2nd. ed. В книге основное внимание уделено пат-анализу; Rhodes T.L, Аrringtоn Th.S., Мundt R. Applied Political Inquiry. – N.Y.: University Press of America, 1982; McCleary R., Hay R.A. Applied Time-Series Analysis for the Social Sciences. – Beverly Hills, Calif.: Sage, 1980.[c.465]
ПРИМЕЧАНИЯ
1Для уяснения логики такого анализа см.: Bohrnstedt Y.W., Кnоke D. Statistics for Social Data Analysis. – Itaska (Ill.): F.F.Peacock, 1982, chap. 10. 2Для уяснения этих условий и более глубокого понимания множественной регрессии см.: Pedhazur E.J. Multiple Regression in Behavioral Research. – N.Y.: Holt, Rinehart and Winston, 1982, 2d ed. 3Исследования редко удовлетворяют этим условиям полностью, и часто до проведения анализа нельзя сказать, удовлетворяет ли им конкретных набор данных. Исходя из этого, “достаточно полно” значит, что действие любого отклонения от этих условий может быть скорректировано или по меньшей мере подсчитано. См.: Pedhazur, op. cit. 4 По поводу расчетов значимости в регрессивном анализе см.: Касhigan S.K. Multivariate Statistical Analysis. – N.Y.: Radius Press, 1982, pp. 178-179. 5Подробнее см.: Lewis–Beck M.S. Applied Regression. – Beverly Hills (Calif.): Sage, 1980, pp. 66-71. 6Некоторые предостережения насчет этого правила и предложения о том, как сравнивать влияния различных переменных между массивами содержатся в кн.: Hotchkiss L. A Technique for Comparing Path Models Between Subgroups Standardized Path Coefficients. – Regression Coefficients. // Sociological Methods and Research. – 1976 (August). – Vol. 5. – P. 53-76. * От англ. path – путь, траектория 7Другие требования к рекурсивным моделям обсуждаются в кн.: Dunсаn O.D. Introduction to Structural Equation Models. – N.Y.: Academic Press, 1975. 8 О методах анализа с обратной связью см.: Berry W.D. Nonrecursive Casual Models. – Beveriy Hills (Calif.): Sage, 1984. 9См.: Асhen Ch.H. Interpreting and Using Regression. – Beverly Hills (Calif.): Sage, 1992. 10Эта тема хорошо раскрыта в кн.: Оstгоm Сh. W. Time Series Analysis. Beverly Hills (Calif.): Sage, 1978. 11Добротное описание принципов и использования РИМА см. в кн.: Cook D.Th., Campbell D.T. Ouasiexperimentation. – Chicago: Rand McNally, 1979, chap. 6. 12См.: Cook, Campbell, chap. 5.