数学
高校生
解決済み

数1のデータの分析で、相関係数の式が、あんなふうになる理由ってなんですか?証明か何かできるんですか?公式の意味を教えてください。

(xとyの共分散) *とyの相関係数 = ーーーーーーーーーーーーーー (xの標準偏差) x (yの標準偏差)

回答

✨ ベストアンサー ✨

相関係数にもれっきとした意味があり、それを考えることは非常に有益です。ちょっと難しい話になるかもしれませんが、定義は証明できないからと思考を放棄してしまうのはよくないと思います

そもそもの目的は、2つの変量x,yが与えられたときにそれらの相関を調べることです。"散布図"を描けば視覚的に捉えることもできますが、もっと誰にでも納得がいく統一的な指標がほしいですし、パソコンに計算させる場合は散布図だと画像判断に高度な技術を要しそうです。

そこで変量の相関を数値化する方法を考えます。その1つが"共分散"です。各項目ごとにx,yの偏差を掛け、足し合わせることで、x,y間の相関の指標になります。つまり、
・共分散の正負 ⇔ 相関の正負
・共分散が大きい ⇔ 相関が大きい
が言えます

しかしながら、共分散は変量の相関をはかる上で重大な欠陥があります。共分散はデータの散らばりや単位に影響を受けてしまうのです(画像参照)。そこで、データの散らばり具合や単位に影響されないように、共分散をxとyの標準偏差で割ったものを"相関係数"と名付けて相関の指標としたのです

なんこつ

え、とてつもなく納得できました。そういう経緯があってこの式になったんですね。教科書で調べてもネットで調べてもいまいちよく分からなかったけど、とてもスッキリしました。
定義であるから不変のものであることも理解できましたが、経緯まで知れたのでよかったです。丁寧にありがとうございました。

gößt

脚色は多少あると思いますが、お役に立てたなら良かったです

この回答にコメントする

回答

定理は、定義から示すことはできますが、定義は定められたものなので、覚えるんです。

なんこつ

定義はやはり不変のもので、覚えるものなんですね。理解出来ました。ありがとうございます。

この回答にコメントする

上の式こそが相関係数の定義ですよ。

なんこつ

定義だから覚えるしかないんですか?
なんで共分散を2つの標準偏差で割ると相関係数が出るんだろうと思ったんですが、そういうもんだと思った方がいいですか?

哲治

考え方が間違ってます。
共分散を二つの標準偏差で割るとなんで相関係数がでるの?
ではなくて、その値を相関係数と定義しているんです。
議論の出発点が違うんです。
定義がいつも議論の出発点になります。
だから定義になんでそうなるの?はないです。
なぜならそう決めたのは自分だからです。
数学の考え方として出発点を意識しないとループしています。

なんこつ

出発地点を定めてから考えなければならないっていうのは意識したことなかったです。定義を元にしなければならなかったんですね。ありがとうございます

この回答にコメントする
疑問は解決しましたか?