savin_e: (Default)
[personal profile] savin_e
Как известно при интерпретации корреляционных связей принимаются во внимание три основных характеристики: статистическая значимость, направленность (прямая, обратная, нелинейная связь) и сила связи. Особенно важны две последние характеристики поскольку именно они позволяют дать содержательную интерпретацию связи между переменными. Однако если направленность в общем случае может быть определена и наглядно представлена через особенность распределения данных на корреляционном поле (что, собственно, и делается во всех руководствах по статистике и в наглядных демонстрациях), то с силой связи дело обстоит сложнее.

Общепринятый способ выражения силы корреляционной связи — коэффициент детерминации, который представляет собой коэффициент корреляции возведенный в квадрат. Это степень изменчивости одной переменной корреляции, вызванная изменчиво­стью другой переменной. Например, если коэффициент корреляции между уровнем интеллекта и последующей успещностью обучения равен 0,30, то коэффициент детерминации — 0,09. Это означает, что 9% изменчивости в обучении связаны с изменчивостью уровня интеллекта, а остальные 91% связаны с изменчивостью других факторов. Именно этот показатель зачастую фигурирует в популярных изложениях корреляционных исследований, когда пишут, что некий X зависит от Y «на 25 процентов».

Основная сложность интерпретации коэффициента детерминации состоит в том, что в нем фигурирует интуитивно плохо уловимый термин «процент изменчивости (дисперсии)». Проценты обычно интуитивно соотносятся с некоторыми количествами единиц, которые можно посчитать. В случае корреляционного анализа - это процент испытуемых. Для понимания величины некоторого конкретного коэффициента корреляции лучше было бы иметь наглядное представление о том, сколько человек, имеющий высокий уровень признака X вместе с тем имеют и высокий уровень развития признака Y. Например, сколько процентов людей с высоким уровнем интеллекта имеют в последующем хорошую успеваемость, если коэффициент корреляции между этими величинами, например, 0,30. Эта идея хорошо монтируется с наглядным представлением о связи между величинами, которое опирается на корреляционное поле (диаграмму рассеяния).

На этих диаграммах (построенных при помощи упомянутой выше флеш-анимации) достаточно хорошо видно, что при отсутствии связи между величинами (r=0) все наблюдения (испытуемые) в равной пропорции распределены по четырем квадрантам (вертикальные и горизонтальные линии на диаграмме — это средние значения X и Y), при возрастании величины связи (если она линейна и положительна) происходит увеличение доли наблюдений в квадрантах I и III и уменьшение в квадрантах II и IV. При отрицательной линейной связи картина будет такова, что при увеличении величины связи будет увеличиваться количество наблюдений в квадрантах II и IV и уменьшение в квадрантах I и III. Таким образом, для интерпретации величины связи необходимо рассчитать на основе величины коэффициента корреляции число (процент) наблюдений в каждом из квадрантов.

Это можно сделать используя предложенный в 1982 году Р.Розенталем и Д.Рубиным биномиальный показатель величины эффекта (binomial effect size display). По их мнению он прост в расчетах, интуитивно понятен психологам, студентам и обычным людям, а также применим для достаточно широкого круга ситуаций. Логика его расчета достаточно проста. Нулевая взаимосвязь между, например, интеллектом и успешностью обучения означает то, что среди людей с высоким интеллектом 50% будут иметь высокую успеваемость, а 50% — низкую. Иными словами, вероятность того что человек с высоким интеллектом будет иметь высокую успеваемость не отличается от случайной (0,5). При увеличении коэффициента корреляции эта вероятность увеличивается на величину r/2. Это означает, что при величине корреляции 0,30 процент высокоуспевающих среди людей с высоким (выше среднего) интеллектом будет 65%, а низкоуспевающих соответственно 35%. Соответственно, среди людей с низким интеллектом успевающих будет 35%, а низкоуспевающих 65%. Увеличение коэффициента корреляции до 0,40 означает, что количество успевающих среди лиц с высоким интеллектом будет уже 70%, а неуспевающих с низким интеллектом 30% и т.д. В случае отрицательной корреляции пропорции будут изменяться в соответствии с направлением корреляции.

Ограничения данного способа интерепретации связаны с его конструкцией. Во-первых, он предполагает, что связь между показателями линейна. Например, увеличение интеллекта связано с увеличением успешности обучения, и вместе с тем, «уменьшение» интеллекта связано с уменьшением успешности. Однако очевидно, что даже в этом простом случае связь может быть несколько иной. Например, можно предположить, что низкий интеллект в любом случае приводит к неуспешности в обучении, тогда как высокий — не всегда к нему приводит. В этом случае на диаграмме рассеяния (где X — интеллект, а Y — успешность обучения) точки распределятся в квадрантах I, III и IV, но их практически не будет в квадранте II («низкий интеллект/высокая успешность»). Можно напротив, предположить, что высокий интеллект в любом случае приводит к высокой успешности, а низкий интеллект, напротив, может приводить как к низкой, так и высокой успешности. В этом случае практически не будет наблюдений в квадранте IV («высокий интеллект/низкая успешность»). Для данного примера не важно, какая из гипотез верна на самом деле — принципиально то, что корреляция в этих случаях будет нелинейна, что приведет к смещению соотношения числа наблюдений в квадрантах.
Во-вторых, распределение одной и другой переменных должно быть близким к нормальному.
Тем не менее несмотря на названные ограничения, данный показатель позволяет достаточно просто и наглядно связать величину корреляционной связи с количеством людей обладающих тем или иным сочетанием коррелируемых признаков, что способствует его лучшему пониманию и позволяет давать разъяснения для широкой аудитории.

1. Randolph J.J., Edmondson R.S. Using the binomial effect size display (BESD) to present the magnitude of effect sizes to the evaluation audience // Practical Assessment Research & Evaluation. 2005. V. 10. № 14. P. 1–7. pdf
2. Rosenthal R., Rubin D.B. A simple, general purpose display of magnitude of experimental effect. // Journal of educational psychology. 1982. V. 74. № 2. P. 166–169. pdf

April 2017

S M T W T F S
      1
2345678
91011 12131415
16171819202122
23242526272829
30      

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 25th, 2017 10:48 am
Powered by Dreamwidth Studios