2018年センター試験 数学I・A を解いてみたその6【第2問〔2〕(3)】

第2問(3)です。内容は興味深いのですが,時間と配点からいって,多くの受験生にとって「捨て問」になったのではないかと思います。前問の台形の問題もそうですが,センター試験には,よい題材が単なる難問として済まされてしまうきらいがあるように感じます。

 

x と w の2つ変量があって,平均値の式が定義通りに示されています。また,「 \left( x_{1}+x_{2}+ \cdots +x_{n}\right)\bar{w} = n\bar{x}\bar{w} に注意すると」とあるのは,平均値の式の言い換えです。 \left( x_{1}+x_{2}+ \cdots +x_{n}\right) は「変量 x の合計」を表しているので, n\bar{x} と等しいよね,ということを言っています。

これをふまえて「偏差の積の和」を計算してみよう,という問題です。

 \displaystyle \left( x_{1}- \bar{x} \right) \left( w_{1}- \bar{w} \right) + \left( x_{2}- \bar{x} \right) \left( w_{2}- \bar{w} \right) + \cdots + \left( x_{n}- \bar{x} \right) \left( w_{n}- \bar{w} \right)

を展開していきますが,各項のそれぞれの因数の先頭の項( x_{i} w_{i} )をかけ合わせたものが,すでに右辺で示されている  x_{1}w_{1}+ x_{2}w_{2}+ \cdots  +x_{n}w_{n} の部分です。残りの展開部分を見ていきたいと思いますが,毎度 1 から n まで書き並べると煩雑なので,第 k 項を展開してみましょう。

 \left( x_{k}-\bar{x}\right) \left( w_{k}-\bar{w}\right) = x_{k}w_{k}-x_{k}\bar{w}-\bar{x}w_{k}+\bar{x}\bar{w}

となります。右辺の第 1 項を 1 から n まで足したものが,  x_{1}w_{1}+ x_{2}w_{2}+ \cdots  +x_{n}w_{n} ですね。

先ほどの注意書きに従えば, x_{k} を 1 から n まで足すと  n\bar{x} となるので,残りの 3 項を 1 から n まで足すと(最後の項は単に n 倍)

 -n\bar{x}\bar{w}-n\bar{x}\bar{w}+n\bar{x}\bar{w}=n\bar{x}\bar{w}

となり,ソにマークするのは②となります。

 

問題は以上ですが,「偏差の積の和」を n で割ると「共分散」が求められます。導いた式を n で割ってみると

  \displaystyle \frac{1}{n} \left( x_{1}w_{1}+ x_{2}w_{2}+ \cdots  +x_{n}w_{n} -n\bar{x}\bar{w} \right) = \overline{xw}-\bar{x}\bar{w}

すなわち,(共分散)=(変量 x と w の積の平均)-( x の平均と w の平均の積)

となります。共分散のもう 1 つの求め方が導けました。

 

統計量を定義と別の方法で求める,というのは分散にもあります。分散を  s^{2}_{x} とすれば,

 \displaystyle s^{2}_{x}= \frac{1}{n} \left\{ \left( x_{1}- \bar{x} \right) ^{2} + \left( x_{2}-\bar{x}\right) ^{2} + \cdots + \left( x_{n}-\bar{x}\right) ^{2} \right\} \\ \displaystyle = \frac{1}{n} \left\{ \left( x_{1}^{2}+x_{2}^{2}+\cdots +x_{n}^{2}\right) -2n\bar{x}\left( x_{1}+x_{2}+\cdots x_{n}\right) +n\left( \bar{x}\right) ^2 \right\} \\ \displaystyle =\overline{x^2} -2\left( \bar{x}\right) ^2 +\left( \bar{x}\right) ^2  \\ = \displaystyle \overline{x^2} -\left( \bar{x}\right) ^2

すなわち,( x の分散)=( x の2乗の平均)-( x の平均の2乗) という求め方です。共分散とよく似ています。先に計算した変量の平均から,平均を計算したものを引いて求めるのですね。その「計算」が分散では2乗,共分散では乗法ということです。もっとも,共分散の変量 w を同一の x にしたものが分散なわけですが。 

なお,多くの高等学校教科書では,上の2乗平均の式は扱っているものの,共分散の別解式はほとんど見られません。どちらも計算の手間が省けるという点では,利点があると思うのですが。分散は比較的扱う頻度も多いし,2つのデータを統合して分散を改めて算出する際には,もとの定義の式では困難なこともあって,2乗平均の式も重宝されているようです。共分散までも発展させると負担が大きいと判断されたのでしょうか。

 

ところで,高校数学をひと通り身に付けている方で,式を見て「内積っぽいなぁ」と感じた人はいるでしょうか。2 つの因数の同じ位置の項どうしをかけた和,というのは内積の成分計算そっくりですね。

ここで, \displaystyle \left( x_{1}- \bar{x}, \; x_{2}- \bar{x}, \; \cdots ,\;  x_{n}- \bar{x}\right) を「x の偏差ベクトル \overrightarrow{x} 」と呼ぶことにします(w も同様)。

すると,先ほどの「偏差の積の和」というのは,「x と w の偏差ベクトルの内積」ということになります。

さらに,偏差の 2 乗の和の,正の平方根  \displaystyle \sqrt{ \left( x_{1}- \bar{x}\right) ^2 +\left( x_{2}- \bar{x}\right) ^2 +\cdots + \left( x_{n}- \bar{x}\right) ^2}

は,偏差ベクトルの「大きさ」にほかなりません。これを  \sqrt{n} で割ったのが標準偏差です。

それでは,数学Iデータの分析のラスボス「相関係数」の正体を暴いてみましょう。もともとの定義は,x と w の共分散を \displaystyle s_{xw}標準偏差をそれぞれ  \displaystyle s_{x}, s_{w} と表すと

 \displaystyle \frac{s_{xw}}{s_{x} s_{w}}

です。分子の共分散は「偏差の積」を n で割ったもので,分母はそれぞれ  \sqrt{n} で割っているので,n は相殺されます。よって相関係数は次のようにも表せます。

 \displaystyle \frac{\overrightarrow{x}\cdot \overrightarrow{w}}{\left| \overrightarrow{x}\right| \left| \overrightarrow{w}\right| }

これ,2 つのベクトルのなす角の cos を求める式そのままですね。つまり,相関係数というのは,偏差ベクトルのなす角の cos の値なのです。値が -1~1 を間をとるのもこれで説明できます。

あまり厳密には考えていないのですが,2 つの偏差ベクトルが平行に近いほど相関係数の絶対値は 1 に近づくので,方向が同じ⇔相関が強いということなのだと思います。

 

今回の問いも,数学的にはなかなか探究的な内容だったと思います。この事実を知識として身に付けているかどうかというよりは,日ごろの探究的な数学的活動の経験が差に出たのではないかと思います。