統計分析やポートフォリオで共分散が出てくる。
この共分散という値は分析で威力を発揮する。
特に、二つ以上の事柄の相関関係を数値としてはっきり示す。
以前、それをジオジェブラで書いたけど、見直してみるとさっぱりわからない。
そこで、もう一度構成してみることにした。
①まず、この点Aを、Aさんの(英語)と(数学)の点数として平面上に表す。
S:テストの点数なんだね。
S:身長と体重でもいいんでしょ。
S:気温とアイスクリームの販売数でもいい。
S:英語の点数が高い人は数学も高そう。
②ABCDEの分布がどのようになっているのか調べるには?
S:だいたい右肩上がりの傾向がある。
S:このグループの二つの性質には相関関係がある。
S:それを数値で表すにはどうしたら良いの?
③これらの点は自由に移動でき、シュミレーションができる。
S:数学はできるけど英語は苦手という人もいるから、
S:右下がりになることもあるよ。
S:団子みたいにかたまることもある。
④そういう性質の違いを何とか数値で表せないだろうか?
S:まず、英語なら英語の平均点aを求める。数学の平均点bも求める。
S:平均点が基準になるね。これで線を引くと4つに仕切れる。
S:この平均点との差が大事なんだ。差(偏差)を求めてみよう。
S:確か差は∓があるから二乗して足すと、散らばり具合がわかるって習ったよ。
S:差を二乗して足して平均を求めるんだ。(これが分散)
S:そうすると、英語の場合と数学の場合の散らばり具合の違いが分かる。
S:分散の平方根を取ると標準偏差だ。
S:確かにそれぞれの散らばり具合はわかるけど、
この全体の散らばり具合はどうやって求めればいいのだろうか?
⑤それぞれの分散は偏差を2乗したけど、
二つの偏差を掛け合わせるとどうなるのだろうか?
S:下のアプレットで確かめてみよう。
S:点Cを動かしてみると、プラスになる時と-になる時がある。
S:xもyも正の時と両方とも負の時はプラスで、どちらかが負の時はマイナス。
S:中心から離れると値が大きくなる。当たり前か。
S:だとすると、それぞれの点の平均を求めるとどうなるんだろうか?
⑥これを分散の時のように全部足して平均を出してみる。
S:表計算でやった方がわかり易いね。
S:まず、平均がプラスかマイナスかでどこに分散しているのかわかる。
S:二つの平均がそれぞれx軸とy軸のようなものだから、全体の傾向がわかる。
⑦これを両方の数値を含んでいるので共分散というんだ。
S:団子状にすると、値は0に近くなる。
S:直線状に持っていくと共分散は大きくなる。
S:この共分散の値がまちまちだから、何か基準が欲しいな。
⑧この共分散をさらに加工してわかり易くしたい。
S:共分散を何かで割って最大値を1にすればいい。
S:共分散を求めるのに2つの偏差をかけ合わせたから、
今度は2つのそれぞれの標準偏差をかけ合わせて割ったらどうかな。
⑨これが相関係数で、-1から+1までの値を取るのでわかり易くなる。
S:0.9はかなり直線に近いよ。つまり、相関が大きい。
S:0.5だと少し関係しているかという感じ。
S:この係数によって全体の傾向がどうなっているのかつかめるね。
S:マイナスの場合は相関が逆になっているんだ。
⑩相関係数は傾きも表しているから、
これらのデータに最も近い直線を表せないだろうか?
S:この直線は必ず平均の交点(中央)を通るはず。
S:だから後は傾きが分かれば引ける。
S:共分散÷xの分散で求まる。共分散というのは色々な意味を含んでいるんだな。
これを回帰直線という。
⑪三次元でこれを考えるとどうなるんだろうか?
S:発展とは拡張することだからね。
S:我々を常に拡張せよ!
どうですか?