savin_e: (Default)
[personal profile] savin_e
Как известно при интерпретации корреляционных связей принимаются во внимание три основных характеристики: статистическая значимость, направленность (прямая, обратная, нелинейная связь) и сила связи. Особенно важны две последние характеристики поскольку именно они позволяют дать содержательную интерпретацию связи между переменными. Однако если направленность в общем случае может быть определена и наглядно представлена через особенность распределения данных на корреляционном поле (что, собственно, и делается во всех руководствах по статистике и в наглядных демонстрациях), то с силой связи дело обстоит сложнее.

Общепринятый способ выражения силы корреляционной связи — коэффициент детерминации, который представляет собой коэффициент корреляции возведенный в квадрат. Это степень изменчивости одной переменной корреляции, вызванная изменчиво­стью другой переменной. Например, если коэффициент корреляции между уровнем интеллекта и последующей успещностью обучения равен 0,30, то коэффициент детерминации — 0,09. Это означает, что 9% изменчивости в обучении связаны с изменчивостью уровня интеллекта, а остальные 91% связаны с изменчивостью других факторов. Именно этот показатель зачастую фигурирует в популярных изложениях корреляционных исследований, когда пишут, что некий X зависит от Y «на 25 процентов».

Основная сложность интерпретации коэффициента детерминации состоит в том, что в нем фигурирует интуитивно плохо уловимый термин «процент изменчивости (дисперсии)». Проценты обычно интуитивно соотносятся с некоторыми количествами единиц, которые можно посчитать. В случае корреляционного анализа - это процент испытуемых. Для понимания величины некоторого конкретного коэффициента корреляции лучше было бы иметь наглядное представление о том, сколько человек, имеющий высокий уровень признака X вместе с тем имеют и высокий уровень развития признака Y. Например, сколько процентов людей с высоким уровнем интеллекта имеют в последующем хорошую успеваемость, если коэффициент корреляции между этими величинами, например, 0,30. Эта идея хорошо монтируется с наглядным представлением о связи между величинами, которое опирается на корреляционное поле (диаграмму рассеяния).

На этих диаграммах (построенных при помощи упомянутой выше флеш-анимации) достаточно хорошо видно, что при отсутствии связи между величинами (r=0) все наблюдения (испытуемые) в равной пропорции распределены по четырем квадрантам (вертикальные и горизонтальные линии на диаграмме — это средние значения X и Y), при возрастании величины связи (если она линейна и положительна) происходит увеличение доли наблюдений в квадрантах I и III и уменьшение в квадрантах II и IV. При отрицательной линейной связи картина будет такова, что при увеличении величины связи будет увеличиваться количество наблюдений в квадрантах II и IV и уменьшение в квадрантах I и III. Таким образом, для интерпретации величины связи необходимо рассчитать на основе величины коэффициента корреляции число (процент) наблюдений в каждом из квадрантов.

Это можно сделать используя предложенный в 1982 году Р.Розенталем и Д.Рубиным биномиальный показатель величины эффекта (binomial effect size display). По их мнению он прост в расчетах, интуитивно понятен психологам, студентам и обычным людям, а также применим для достаточно широкого круга ситуаций. Логика его расчета достаточно проста. Нулевая взаимосвязь между, например, интеллектом и успешностью обучения означает то, что среди людей с высоким интеллектом 50% будут иметь высокую успеваемость, а 50% — низкую. Иными словами, вероятность того что человек с высоким интеллектом будет иметь высокую успеваемость не отличается от случайной (0,5). При увеличении коэффициента корреляции эта вероятность увеличивается на величину r/2. Это означает, что при величине корреляции 0,30 процент высокоуспевающих среди людей с высоким (выше среднего) интеллектом будет 65%, а низкоуспевающих соответственно 35%. Соответственно, среди людей с низким интеллектом успевающих будет 35%, а низкоуспевающих 65%. Увеличение коэффициента корреляции до 0,40 означает, что количество успевающих среди лиц с высоким интеллектом будет уже 70%, а неуспевающих с низким интеллектом 30% и т.д. В случае отрицательной корреляции пропорции будут изменяться в соответствии с направлением корреляции.

Ограничения данного способа интерепретации связаны с его конструкцией. Во-первых, он предполагает, что связь между показателями линейна. Например, увеличение интеллекта связано с увеличением успешности обучения, и вместе с тем, «уменьшение» интеллекта связано с уменьшением успешности. Однако очевидно, что даже в этом простом случае связь может быть несколько иной. Например, можно предположить, что низкий интеллект в любом случае приводит к неуспешности в обучении, тогда как высокий — не всегда к нему приводит. В этом случае на диаграмме рассеяния (где X — интеллект, а Y — успешность обучения) точки распределятся в квадрантах I, III и IV, но их практически не будет в квадранте II («низкий интеллект/высокая успешность»). Можно напротив, предположить, что высокий интеллект в любом случае приводит к высокой успешности, а низкий интеллект, напротив, может приводить как к низкой, так и высокой успешности. В этом случае практически не будет наблюдений в квадранте IV («высокий интеллект/низкая успешность»). Для данного примера не важно, какая из гипотез верна на самом деле — принципиально то, что корреляция в этих случаях будет нелинейна, что приведет к смещению соотношения числа наблюдений в квадрантах.
Во-вторых, распределение одной и другой переменных должно быть близким к нормальному.
Тем не менее несмотря на названные ограничения, данный показатель позволяет достаточно просто и наглядно связать величину корреляционной связи с количеством людей обладающих тем или иным сочетанием коррелируемых признаков, что способствует его лучшему пониманию и позволяет давать разъяснения для широкой аудитории.

1. Randolph J.J., Edmondson R.S. Using the binomial effect size display (BESD) to present the magnitude of effect sizes to the evaluation audience // Practical Assessment Research & Evaluation. 2005. V. 10. № 14. P. 1–7. pdf
2. Rosenthal R., Rubin D.B. A simple, general purpose display of magnitude of experimental effect. // Journal of educational psychology. 1982. V. 74. № 2. P. 166–169. pdf
From:
Anonymous( )Anonymous This account has disabled anonymous posting.
OpenID( )OpenID You can comment on this post while signed in with an account from many other sites, once you have confirmed your email address. Sign in using OpenID.
User
Account name:
Password:
If you don't have an account you can create one now.
Subject:
HTML doesn't work in the subject.

Message:

 
Notice: This account is set to log the IP addresses of everyone who comments.
Links will be displayed as unclickable URLs to help prevent spam.

April 2017

S M T W T F S
      1
2345678
91011 12131415
16171819202122
23242526272829
30      

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 21st, 2017 01:57 pm
Powered by Dreamwidth Studios