高等学校数学B/確率分布と統計的な推測

2026年5月24日

本項は高等学校数学Bの「確率分布と統計的な推測」の解説です。

この分野は数学Iのデータの分析、数学Aの確率と関連があります。

同じく数学Bの数列、数学Ⅱの微分・積分の考えを既習であるものとします。また、この分野を学習後に同じく数学Bの数学と社会生活で扱うデータ解析の内容も参照することを推奨します。

$k$ $k$ は自然数で $1 \leq k \leq n$ $1\leq k\leq n$ を満たすものとします。

確率分布

確率変数と確率分布

試行の結果によってどの値をとるか定まり、とり得る値の各々に対してその値をとる確率が定まるような変数を確率変数と呼ぶ。

確率変数 $X$ $X$ のとり得る値が $x_{1}, x_{2}, \dots, x_{n}$ $x_{1},x_{2},\cdots ,x_{n}$ であるとき、 $X$ $X$ が値 $x_{k}$ $x_{k}$ をとる確率を $P (X = x_{k})$ $P(X=x_{k})$ 、 $a \leq x_{k} \leq b$ $a\leq x_{k}\leq b$ である確率 $P (a \leq X \leq b)$ $P(a\leq X\leq b)$ のように表す。

$P (X = x_{k})$ $P(X=x_{k})$ を $p_{k}$ $p_{k}$ と表すこととすると、 $x_{k}$ $x_{k}$ と $p_{k}$ $p_{k}$ の対応関係は以下のようになる。

$X$ $X$	$x_{1}$ $x_{1}$	$x_{2}$ $x_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$x_{n}$ $x_{n}$	計
$P$ $P$	$p_{1}$ $p_{1}$	$p_{2}$ $p_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$p_{n}$ $p_{n}$	$1$ $1$

この対応関係を $X$ $X$ の確率分布あるいは単に分布と呼び、確率変数 $X$ $X$ はこの分布に従うという。

このとき、常に $p_{k} \geq 0$ $p_{k}\geq 0$ であり、 $\sum_{k = 1}^{n} p_{k} = 1$ $\sum _{k=1}^{n}p_{k}=1$ である。期待値と分散

$X$ $X$ の確率分布が以下の表であるとする。

$X$ $X$	$x_{1}$ $x_{1}$	$x_{2}$ $x_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$x_{n}$ $x_{n}$	計
$P$ $P$	$p_{1}$ $p_{1}$	$p_{2}$ $p_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$p_{n}$ $p_{n}$	$1$ $1$

このとき、 $\sum_{k = 1}^{n} x_{k} p_{k}$ $\sum _{k=1}^{n}x_{k}p_{k}$ を $X$ $X$ の期待値と呼び、 $E (X)$ $E(X)$ または $m$ $m$ または $μ$ $\mu$ で表す（ $μ$ $\mu$ はギリシャ文字で、アルファベットの $m$ $m$ に対応する文字である）。

次に、確率変数 $(X - m)^{2}$ $(X-m)^{2}$ を考える。この確率変数の期待値を $X$ $X$ の分散と呼び、 $V (X)$ $V(X)$ で表すこととする（Vは「分散」の英語「Variance」の略。 $V a r (X)$ $\mathrm {Var} (X)$ と書く場合もある）。

このとき、期待値の定義から $V (X) = E {(X - m)^{2}} = \sum_{k = 1}^{n} (x_{k} - m)^{2} p_{k}$ $V(X)=E\{(X-m)^{2}\}=\sum _{k=1}^{n}(x_{k}-m)^{2}p_{k}$ であり、 $V (X)$ $V(X)$ の単位は測定単位の二乗（例えば $X$ $X$ の単位が $c m$ $\mathrm {cm}$ なら $V (X)$ $V(X)$ の単位は ${c m}^{2}$ $\mathrm {cm} ^{2}$ ）である。そこで、 $\sqrt{V (X)}$ ${\sqrt {V(X)}}$ を $X$ $X$ の標準偏差と呼び、 $σ (X)$ $\sigma (X)$ で表すこととする（ $σ$ $\sigma$ は $Σ$ $\Sigma$ の小文字である）。

分散を表す式を変形すると、

$V (X) = \sum_{k = 1}^{n} (x_{k} - m)^{2} p_{k}$ $V(X)=\sum _{k=1}^{n}(x_{k}-m)^{2}p_{k}$

$= \sum_{k = 1}^{n} (x_{k}^{2} - 2 m x_{k} + m^{2}) p_{k}$ $=\sum _{k=1}^{n}(x_{k}^{2}-2mx_{k}+m^{2})p_{k}$

$= \sum_{k = 1}^{n} x_{k}^{2} p_{k} - 2 m \sum_{k = 1}^{n} x_{k} p_{k} + m^{2} \sum_{k = 1}^{n} p_{k}$ $=\sum _{k=1}^{n}x_{k}^{2}p_{k}-2m\sum _{k=1}^{n}x_{k}p_{k}+m^{2}\sum _{k=1}^{n}p_{k}$

$= \sum_{k = 1}^{n} x_{k}^{2} p_{k} - 2 m \cdot m + m^{2} \cdot 1$ $=\sum _{k=1}^{n}x_{k}^{2}p_{k}-2m\cdot m+m^{2}\cdot 1$

$= \sum_{k = 1}^{n} x_{k}^{2} p_{k} - m^{2}$ $=\sum _{k=1}^{n}x_{k}^{2}p_{k}-m^{2}$

となり、 $\sum_{k = 1}^{n} x_{k}^{2} p_{k}$ $\sum _{k=1}^{n}x_{k}^{2}p_{k}$ は確率変数 $X^{2}$ $X^{2}$ の期待値に等しいので $V (X) = E (X^{2}) - {E (X)}^{2}$ $V(X)=E(X^{2})-\{E(X)\}^{2}$ が成り立つ。

今までの事項を纏めると以下のようになる。

 $X$ の期待値： $E (X) = m = μ = \sum_{k = 1}^{n} x_{k} p_{k}$ 
 $X$ の分散： $V (X) = E {(X - m)^{2}} = E (X^{2}) - {E (X)}^{2}$ 
 $X$ の標準偏差： $σ (X) = \sqrt{V (X)}$

確率変数 $X$ $X$ の期待値・分散・標準偏差のことをそれぞれ $X$ $X$ の分布の平均・分散・標準偏差とも呼ぶ。標準偏差は分布の平均を中心として $x_{k}$ $x_{k}$ の散らばる傾向の程度を表しており、標準偏差の値が小さいほどxkは分布の平均の近傍に集中する。

なお、分散と標準偏差を纏めて散布度、代表値と合わせて分布の特性値と呼ぶ。

サンクトペテルブルクのパラドックス次のようなゲームを考える。「公正なコイン1枚を表が出るまで繰り返し投げ、表が出たら終了する。コインを投げた回数を $n$ $n$ とするとき、 $2^{n - 1}$ $2^{n-1}$ 円の賞金がもらえる。」 $n$ $n$ 回目に表が出る確率を $p_{n}$ $p_{n}$ 、賞金を $X_{n}$ $X_{n}$ とおくと、 $X_{n}$ $X_{n}$ は確率変数であり、 $p_{n} = (\frac{1}{2})^{n - 1} \cdot \frac{1}{2} = (\frac{1}{2})^{n}, X_{n} = 2^{n - 1}$ $p_{n}=({\frac {1}{2}})^{n-1}\cdot {\frac {1}{2}}=({\frac {1}{2}})^{n},X_{n}=2^{n-1}$ なので、裏が出続けたときのこのゲームの期待値は $\sum_{k = 1}^{\infty} p_{k} X_{k} = \sum_{k = 1}^{\infty} (\frac{1}{2})^{k} 2^{k - 1} = \sum_{k = 1}^{\infty} (\frac{1}{2})^{k - k + 1} = \sum_{k = 1}^{\infty} \frac{1}{2} = \infty$ $\sum _{k=1}^{\infty }p_{k}X_{k}=\sum _{k=1}^{\infty }({\frac {1}{2}})^{k}2^{k-1}=\sum _{k=1}^{\infty }({\frac {1}{2}})^{k-k+1}=\sum _{k=1}^{\infty }{\frac {1}{2}}=\infty$ （円）となり、参加費がいくらであってもこのゲームに参加した方が良いと考えられる。この結論は本当に正しいのだろうか？参加費を一万円と設定すると、参加費よりも大きい賞金が得られる確率は14回以上連続で裏が出る場合で、 $(\frac{1}{2})^{14} ≒ 0.006$ $({\frac {1}{2}})^{14}\fallingdotseq 0.006$ %以下と非常に小さい。主催者の立場になると、現実的に大きな金額を支払うことはできないので、賞金に上限を設定する必要がある。例えば、20回まで裏が出続けた場合はそこで打ち切りとし、 $2^{20} = 1048576$ $2^{20}=1048576$ すなわち約105万円を上限とする。このときの期待値は $\sum_{k = 1}^{20} p_{k} X_{k} + (\frac{1}{2})^{20} \cdot 2^{20} = \frac{20}{2} + 1 = 11$ $\sum _{k=1}^{20}p_{k}X_{k}+({\frac {1}{2}})^{20}\cdot 2^{20}={\frac {20}{2}}+1=11$ （円）となる。上限を設定した途端、期待値は $\infty$ $\infty$ から十数円程度に変わってしまった。現実的に考えると期待値は十数円程度に収まることがわかったが、「主催者が資金を無限に持っている」という前提で思考実験したときについては解決していない。この場合については、対数で定義される「効用」という概念を用いてこのパラドックスを回避する方法が見つかっている。この話題からは、「あらかじめゲームを何回繰り返すかを決めておけば、比較的公平な賭け金を設定できる」ということがわかる。逆に、「賭け金が公平かどうか確かめる」ことも同様にできる。確率変数の変換

$X$ $X$ の確率分布が以下の表であるとする。

$X$ $X$	$x_{1}$ $x_{1}$	$x_{2}$ $x_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$x_{n}$ $x_{n}$	計
$P$ $P$	$p_{1}$ $p_{1}$	$p_{2}$ $p_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$p_{n}$ $p_{n}$	$1$ $1$

$a, b$ $a,b$ を定数とすると、一次式 $Y = a X + b$ $Y=aX+b$ で定められる $Y$ $Y$ も確率変数となり、そのとる値は $y_{k} = a x_{k} + b$ $y_{k}=ax_{k}+b$ となる。よって $Y$ $Y$ の確率分布は以下の表のようになる。

$Y$ $Y$	$y_{1}$ $y_{1}$	$y_{2}$ $y_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$y_{n}$ $y_{n}$	計
$P$ $P$	$p_{1}$ $p_{1}$	$p_{2}$ $p_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$p_{n}$ $p_{n}$	$1$ $1$

確率変数 $X$ $X$ に対して上のような $Y$ $Y$ を考えることを確率変数の変換と呼ぶ。

$Y$ $Y$ の期待値・分散・標準偏差は以下のようになる。 $E (Y) = \sum_{k = 1}^{n} y_{k} p_{k} = \sum_{k = 1}^{n} (a x_{k} + b) p_{k} = a \sum_{k = 1}^{n} x_{k} p_{k} + b \sum_{k = 1}^{n} p_{k} = a E (X) + b$ $E(Y)=\sum _{k=1}^{n}y_{k}p_{k}=\sum _{k=1}^{n}(ax_{k}+b)p_{k}=a\sum _{k=1}^{n}x_{k}p_{k}+b\sum _{k=1}^{n}p_{k}=aE(X)+b$

$V (Y) = \sum_{k = 1}^{n} {y_{k} - E (Y)}^{2} p_{k} = a^{2} \sum_{k = 1}^{n} {x_{k} - E (X)}^{2} p_{k} = a^{2} V (X)$ $V(Y)=\sum _{k=1}^{n}\{y_{k}-E(Y)\}^{2}p_{k}=a^{2}\sum _{k=1}^{n}\{x_{k}-E(X)\}^{2}p_{k}=a^{2}V(X)$ $∵ y_{k} - E (Y) = a x_{k} + b - {a E (X) + b} = a {x_{k} - E (X)}$ $\because y_{k}-E(Y)=ax_{k}+b-\{aE(X)+b\}=a\{x_{k}-E(X)\}$

$σ (Y) = \sqrt{V (Y)} = | a | \sqrt{V (X)} = | a | σ (X)$ $\sigma (Y)={\sqrt {V(Y)}}=|a|{\sqrt {V(X)}}=|a|\sigma (X)$

同時分布

確率変数 $X, Y, Z, \dots$ $X,Y,Z,\cdots$ と実数 $a, b, c, \dots$ $a,b,c,\cdots$ に対し $X = a, Y = b, Z = c, \dots$ $X=a,Y=b,Z=c,\cdots$ が同時に成り立つ確率を $P (X = a, Y = b, Z = c, \dots)$ $P(X=a,Y=b,Z=c,\cdots )$ のように表すこととする。

2つの確率変数 $X, Y$ $X,Y$ についてとりうる値がそれぞれ $x_{1}, x_{2}, \dots, x_{n}$ $x_{1},x_{2},\cdots ,x_{n}$ 、 $y_{1}, y_{2}, \dots, y_{m}$ $y_{1},y_{2},\cdots ,y_{m}$ であるとする。 $P (X = x_{i}, Y = y_{j}) = r_{i j}$ $P(X=x_{i},Y=y_{j})=r_{ij}$ とおいたとき、以下の表のように全ての $i, j$ $i,j$ の組み合わせにおいて $(x_{i}, y_{j})$ $(x_{i},y_{j})$ と $p_{i j}$ $p_{ij}$ との対応が得られる。

$X$ $X$ \ $Y$ $Y$	$y_{1}$ $y_{1}$	$y_{2}$ $y_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$\dots$ $\cdots$	$y_{m}$ $y_{m}$	計
$x_{1}$ $x_{1}$	$r_{11}$ $r_{11}$	$r_{12}$ $r_{12}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$\dots$ $\cdots$	$r_{1 m}$ $r_{1m}$	$p_{1}$ $p_{1}$
$x_{2}$ $x_{2}$	$r_{21}$ $r_{21}$	$r_{22}$ $r_{22}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$\dots$ $\cdots$	$r_{2 m}$ $r_{2m}$	$p_{2}$ $p_{2}$
$⋮$ $\vdots$	$⋮$ $\vdots$	$⋮$ $\vdots$	$⋱$ $\ddots$	$⋱$ $\ddots$	$⋱$ $\ddots$	$⋮$ $\vdots$	$⋮$ $\vdots$
$⋮$ $\vdots$	$⋮$ $\vdots$	$⋮$ $\vdots$	$⋱$ $\ddots$	$⋱$ $\ddots$	$⋱$ $\ddots$	$⋮$ $\vdots$	$⋮$ $\vdots$
$⋮$ $\vdots$	$⋮$ $\vdots$	$⋮$ $\vdots$	$⋱$ $\ddots$	$⋱$ $\ddots$	$⋱$ $\ddots$	$⋮$ $\vdots$	$⋮$ $\vdots$
$x_{n}$ $x_{n}$	$r_{n 1}$ $r_{n1}$	$r_{n 2}$ $r_{n2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$\dots$ $\cdots$	$r_{n m}$ $r_{nm}$	$p_{n}$ $p_{n}$
計	$q_{1}$ $q_{1}$	$q_{2}$ $q_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$\dots$ $\cdots$	$q_{m}$ $q_{m}$	$1$ $1$

このような対応を $X$ $X$ と $Y$ $Y$ の同時分布という。

各 $i, j$ $i,j$ について、それぞれ $P (X = x_{i}) = \sum_{j = 1}^{m} r_{i j} = p_{i}, P (Y = y_{j}) = \sum_{i = 1}^{n} r_{i j} = q_{j}$ $P(X=x_{i})=\sum _{j=1}^{m}r_{ij}=p_{i},P(Y=y_{j})=\sum _{i=1}^{n}r_{ij}=q_{j}$ が成り立つので、 $X, Y$ $X,Y$ の確率分布はそれぞれ以下のようになる。

$X$ $X$	$x_{1}$ $x_{1}$	$x_{2}$ $x_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$x_{n}$ $x_{n}$	計
$P$ $P$	$p_{1}$ $p_{1}$	$p_{2}$ $p_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$p_{n}$ $p_{n}$	$1$ $1$

$Y$ $Y$	$y_{1}$ $y_{1}$	$y_{2}$ $y_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$y_{m}$ $y_{m}$	計
$P$ $P$	$q_{1}$ $q_{1}$	$q_{2}$ $q_{2}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$q_{m}$ $q_{m}$	$1$ $1$

確率変数の和の期待値

2つの確率変数 $X, Y$ $X,Y$ について、和 $X + Y$ $X+Y$ もまた確率変数であり、同時分布表と確率変数変換の等式から、確率変数の和の期待値について $E (X + Y) = E (X) + E (Y)$ $E(X+Y)=E(X)+E(Y)$ 、 $E (a X + b Y) = a E (X) + b E (Y)$ $E(aX+bY)=aE(X)+bE(Y)$ が成り立つことがわかる。これは確率変数が3つ以上であっても同様に成り立つ。事象の独立・従属

一般に2つの事象 $A, B$ $A,B$ において $P_{A} (B) = P (B)$ $P_{A}(B)=P(B)$ が成り立つとき、事象 $A$ $A$ が起こることは事象 $B$ $B$ の起こる確率に無関係である。これを事象 $A$ $A$ は事象 $B$ $B$ に独立であるという。このとき、確率の乗法定理により $P (A \cap B) = P (A) P (B)$ $P(A\cap B)=P(A)P(B)$ が成り立つ。この式は $P_{B} (A) = P (A)$ $P_{B}(A)=P(A)$ と同値であるため、事象 $B$ $B$ が起こることも事象Aの起こる確率に無関係、つまり事象 $B$ $B$ は事象 $A$ $A$ に独立であると言える。よって、 $P (A \cap B) = P (A) P (B)$ $P(A\cap B)=P(A)P(B)$ が成り立つとき、2つの事象 $A, B$ $A,B$ は互いに独立である。独立でない場合は2つの事象 $A, B$ $A,B$ は従属であるという。なお、事象 $A, B$ $A,B$ の独立・従属と対応する確率変数 $X, Y$ $X,Y$ の独立・従属は一致する。確率変数の積の期待値

2つの確率変数 $X, Y$ $X,Y$ について、積 $X Y$ $XY$ もまた確率変数である。 $X, Y$ $X,Y$ が互いに独立なとき、同時分布表より確率変数の積の期待値は以下のように計算される。

$E (X Y) = \sum_{i = 1}^{n} \sum_{j = 1}^{m} (x_{i} y_{j}) (p_{i} q_{j}) = \sum_{i = 1}^{n} x_{i} p_{i} \cdot \sum_{j = 1}^{m} y_{j} q_{j} = E (X) E (Y)$ $E(XY)=\sum _{i=1}^{n}\sum _{j=1}^{m}(x_{i}y_{j})(p_{i}q_{j})=\sum _{i=1}^{n}x_{i}p_{i}\cdot \sum _{j=1}^{m}y_{j}q_{j}=E(X)E(Y)$

これは3つ以上の確率変数においても互いに独立ならば成立する。確率変数の和の分散

確率変数 $X + Y$ $X+Y$ の分散について考える。

$V (X + Y) = E {(X + Y)^{2}} - {E (X + Y)}^{2}$ $V(X+Y)=E\{(X+Y)^{2}\}-\{E(X+Y)\}^{2}$

$= E (X^{2} + 2 X Y + Y^{2}) - {E (X) + E (Y)}^{2}$ $=E(X^{2}+2XY+Y^{2})-\{E(X)+E(Y)\}^{2}$

$= E (X^{2}) + 2 E (X Y) + E (Y^{2}) - {E (X)}^{2} - 2 E (X) E (Y) - {E (Y)}^{2}$ $=E(X^{2})+2E(XY)+E(Y^{2})-\{E(X)\}^{2}-2E(X)E(Y)-\{E(Y)\}^{2}$

このとき、確率変数 $X, Y$ $X,Y$ が互いに独立ならば $E (X Y) = E (X) E (Y)$ $E(XY)=E(X)E(Y)$ を用いることで、

上式 $= E (X^{2}) + E (Y^{2}) - {E (X)}^{2} - {E (Y)}^{2}$ $=E(X^{2})+E(Y^{2})-\{E(X)\}^{2}-\{E(Y)\}^{2}$

$= [E (X^{2}) - {E (X)}^{2}] + [E (Y^{2}) - {E (Y)}^{2}]$ $=[E(X^{2})-\{E(X)\}^{2}]+[E(Y^{2})-\{E(Y)\}^{2}]$

$= V (X) + V (Y)$ $=V(X)+V(Y)$ と変形できる。

同様に、確率変数変換の等式より確率変数 $X, Y$ $X,Y$ が互いに独立ならば $V (a X + b Y) = a^{2} V (X) + b^{2} V (Y)$ $V(aX+bY)=a^{2}V(X)+b^{2}V(Y)$ が成り立つ。

これらは3つ以上の確率変数においても互いに独立ならば成立する。確率変数の積の分散（発展）

確率変数 $X Y$ $XY$ の分散について考える。

分散の性質より $V (X Y) = E (X^{2} Y^{2}) - {E (X)}^{2} {E (Y)}^{2}$ $V(XY)=E(X^{2}Y^{2})-\{E(X)\}^{2}\{E(Y)\}^{2}$ と変形できる。

X,Yが互いに独立ならばX2,Y2も互いに独立であるので、 $E (X^{2} Y^{2}) = E (X^{2}) E (Y^{2})$ $E(X^{2}Y^{2})=E(X^{2})E(Y^{2})$ が成り立つ。

よって $V (X Y) = E (X^{2}) E (Y^{2}) - {E (X)}^{2} {E (Y)}^{2}$ $V(XY)=E(X^{2})E(Y^{2})-{E(X)}^{2}{E(Y)}^{2}$ となる。

ここで分散の性質より上式は $[V (X) + {E (X)}^{2}] [V (Y) + {E (Y)}^{2}] - {E (X)}^{2} {E (Y)}^{2}$ $[V(X)+\{E(X)\}^{2}][V(Y)+\{E(Y)\}^{2}]-\{E(X)\}^{2}\{E(Y)\}^{2}$ と変形できるので、

展開して $V (X Y) = V (X) V (Y) + {E (X)}^{2} V (Y) + {E (Y)}^{2} V (X)$ $V(XY)=V(X)V(Y)+\{E(X)\}^{2}V(Y)+\{E(Y)\}^{2}V(X)$ となる。

これは3つ以上の確率変数においても互いに独立ならば成立する。

なお、上記で紹介した確率変数の和の分散、確率変数の積の期待値・分散については、確率変数が従属である場合には確率変数のとる値を用いて直接計算する必要がある。

共分散と分散

数学Iで扱ったように、データ系列x, yについて、xの偏差とyの偏差の積の平均値を共分散と呼び、 $S_{x y}$ $S_{xy}$ で表した。

確率変数 $X, Y$ $X,Y$ に対して共分散は $C o v [X, Y]$ $\mathrm {Cov} [X,Y]$ と書かれる（「Cov」は「共分散」の英語「Covariance」の略）。

共分散の定義式を先述の期待値の性質を用いて変形する。 $C o v [X, Y] = E [{X - E (X)} {Y - E (Y)}]$ $\mathrm {Cov} [X,Y]=E[\{X-E(X)\}\{Y-E(Y)\}]$ $= E {X Y - Y E (X) - X E (Y) + E (X) E (Y)}$ $=E\{XY-YE(X)-XE(Y)+E(X)E(Y)\}$ $= E (X Y) - E {Y E (X)} - E {X E (Y)} + E {E (X) E (Y)}$ $=E(XY)-E\{YE(X)\}-E\{XE(Y)\}+E\{E(X)E(Y)\}$ （ $∵$ $\because$ 和の期待値は期待値の和） $= E (X Y) - E (X) E (Y) - E (Y) E (X) + E (X) E (Y)$ $=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)$ （ $∵$ $\because$ 定数倍は期待値の外に出せる・定数の期待値はその定数そのもの） $= E (X Y) - E (X) E (Y)$ $=E(XY)-E(X)E(Y)$

つまり、共分散は「（期待値の積）-（積の期待値）」で容易に求まる。

ここで $Y = X$ $Y=X$ を代入すると、共分散の定義式は $E [{X - E (X)}^{2}]$ $E[\{X-E(X)\}^{2}]$ 、上で求めた式は $E (X^{2}) - {E (X)}^{2}$ $E(X^{2})-\{E(X)\}^{2}$ と、いづれの場合も $X$ $X$ の分散 $V (X)$ $V(X)$ に一致する。

すなわち、共分散は分散を拡張した概念であるといえる。

共分散を用いると、独立でない場合の確率変数の積の期待値・和の分散を表すことができる。 $E (X Y) = E (X) E (Y) + C o v [X, Y]$ $E(XY)=E(X)E(Y)+\mathrm {Cov} [X,Y]$ （※上で求めた共分散と期待値の関係より） $V (X \pm Y) = V (X) \pm 2 C o v [X, Y] + V (Y)$ $V(X\pm Y)=V(X)\pm 2\mathrm {Cov} [X,Y]+V(Y)$ （※定義通り $E ([{X - E (X)} \pm {Y - E (Y)}]^{2})$ $E([\{X-E(X)\}\pm \{Y-E(Y)\}]^{2})$ を計算すれば求まる）

二項分布

確率 $p$ $p$ で $A$ $A$ か $B$ $B$ かの2通りの結果をとる試行（ベルヌーイ試行）を独立にn回繰り返したとき、 $A$ $A$ が起こる回数 $X$ $X$ の確率分布は反復試行の確率より以下のようになる。ただし、 $0 < p < 1, q = 1 - p$ $0<p<1,q=1-p$ である。

$X$ $X$	$0$ $0$	$1$ $1$	$\dots$ $\cdots$	$\dots$ $\cdots$	$r$ $r$	$\dots$ $\cdots$	$\dots$ $\cdots$	$n$ $n$	計
$P$ $P$	$_{n} C_{0} q^{n}$ ${}_{n}\mathrm {C} _{0}q^{n}$	$_{n} C_{1} p q^{n - 1}$ ${}_{n}\mathrm {C} _{1}pq^{n-1}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$_{n} C_{r} p^{r} q^{n - r}$ ${}_{n}\mathrm {C} _{r}p^{r}q^{n-r}$	$\dots$ $\cdots$	$\dots$ $\cdots$	$_{n} C_{n} p^{n}$ ${}_{n}\mathrm {C} _{n}p^{n}$	$1$ $1$

表の確率は二項定理の展開式の各項と一致している。このような分布のことを二項分布と呼び、 $B (n, p)$ $B(n,p)$ のように書く。確率変数 $X$ $X$ が二項分布 $B (n, p)$ $B(n,p)$ に従うことを $X \sim B (n, p)$ $X\sim B(n,p)$ と表す。

事象 $A$ $A$ の起こる確率が $p$ $p$ である試行を独立にn回行うとき、第 $k$ $k$ 回目の試行で事象 $A$ $A$ が起これば $1$ $1$ 、起こらなければ $0$ $0$ の値をとる確率変数を $X_{k}$ $X_{k}$ とおく。

このとき、 $X_{k}$ $X_{k}$ は以下のような確率分布に従う。

$X_{k}$ $X_{k}$	$1$ $1$	$0$ $0$	計
$P$ $P$	$p$ $p$	$q$ $q$	$1$ $1$

このような確率分布をベルヌーイ分布（0-1分布）という。

ベルヌーイ分布の期待値は定義より $E (X_{k}) = 1 \cdot p + 0 \cdot q = p$

{\displaystyle E(X_{k})=1\cdot p+0\cdot q=p}

である。分散は $E (X_{k}^{2}) = 1^{2} \cdot p + 0^{2} \cdot q = p$

{\displaystyle E(X_{k}^{2})=1^{2}\cdot p+0^{2}\cdot q=p}

より $V (X_{k}) = E (X_{k}^{2}) - {E (X)}^{2} = p - p^{2} = p (1 - p) = p q$

{\displaystyle V(X_{k})=E(X_{k}^{2})-\{E(X)\}^{2}=p-p^{2}=p(1-p)=pq}

である。

$X = \sum_{k = 1}^{n} X_{k}$ $X=\sum _{k=1}^{n}X_{k}$ とおくと、確率変数 $X$ $X$ は $n$ $n$ 回の反復試行において事象 $A$ $A$ が起こる回数であるから、 $X \sim B (n, p)$ $X\sim B(n,p)$ である。

よって、確率変数の和の期待値・分散を求める公式を用いて、

$E (X) = E (\sum_{k = 1}^{n} X_{k}) = \sum_{k = 1}^{n} E (X_{k}) = \sum_{k = 1}^{n} p = n p$ $E(X)=E(\sum _{k=1}^{n}X_{k})=\sum _{k=1}^{n}E(X_{k})=\sum _{k=1}^{n}p=np$

$V (X) = V (\sum_{k = 1}^{n} X_{k}) = \sum_{k = 1}^{n} V (X_{k}) = \sum_{k = 1}^{n} p q = n p q$ $V(X)=V(\sum _{k=1}^{n}X_{k})=\sum _{k=1}^{n}V(X_{k})=\sum _{k=1}^{n}pq=npq$

である。

纏めると、以下のようになる。

 $X \sim B (n, p)$ のとき、

 $E (X) = n p$ 、 $V (X) = n p q$ 、 $σ (X) = \sqrt{n p q}$ 

ただし、 $q = 1 - p$

負の二項分布成功確率が $p$ $p$ であるベルヌーイ試行を独立に繰り返すとき、 $k$ $k$ 回成功するまでの失敗回数Xが従う確率分布を負の二項分布と呼ぶ。 $n$ $n$ 回成功するまでの失敗回数を $r$ $r$ 、 $q = 1 - p$ $q=1-p$ とすると、重複組合せを用いて $P (X = r) =_{n} H_{r} p^{n} q^{r}$ $P(X=r)={}_{n}\mathrm {H} _{r}p^{n}q^{r}$ と計算できる。このとき、 $E (X) = \frac{n q}{p}, V (X) = \frac{n q}{p^{2}}$ $E(X)={\frac {nq}{p}},V(X)={\frac {nq}{p^{2}}}$ が成り立つ。負の二項分布を「 $a$ $a$ 回成功するまでの試行回数X」で定義することもある。この場合、 $a$ $a$ 回成功するまでに $b$ $b$ 回試行する確率は $P (X = a) =_{a - 1} C_{b - 1} p^{a} q^{a - b}$ $P(X=a)={}_{a-1}\mathrm {C} _{b-1}p^{a}q^{a-b}$ と計算でき、 $E (X) = \frac{a}{p}, V (X) = \frac{a q}{p}$ $E(X)={\frac {a}{p}},V(X)={\frac {aq}{p}}$ が成り立つ。

正規分布

連続型確率変数

度数分布表で表された、ある変量 $X$ $X$ についてのデータがある。このとき、Xが階級値をとる確率はその階級の相対度数であると考えて良い。つまり、 $X$ $X$ は階級値の値をとる確率変数であり、その分布は相対度数の分布と一致する。この確率分布を図示するには、各階級の上の長方形の面積がその階級の相対度数を表すようなヒストグラムを書けば良い。

データの大きさを増し、階級の幅も狭くしていくと、ヒストグラムの形は一つの曲線に近づいていく。そこで、連続的な値をとる確率変数 $X$ $X$ に対し、 $a \leq X \leq b$ $a\leq X\leq b$ となる確率が $y$ $y$ ー $x$ $x$ グラフ上の曲線 $y = f (x)$ $y=f(x)$ と直線 $x = a, x = b$ $x=a,x=b$ と $x$ $x$ 軸で囲まれた領域の面積で表されるように一つの曲線を対応させる。このような曲線を $X$ $X$ の分布曲線という。

連続的な値をとる確率変数を連続型確率変数といい、 $f (x)$ $f(x)$ を確率密度関数と呼ぶ。なお、 $f (x)$ $f(x)$ の定義域は実数全体のことも、その一部分のこともある。今まで扱ってきたような、飛び飛びの値をとる確率変数は離散型確率変数と呼ぶ。なお、離散型確率変数に対して $f (k) = P (X = k)$ $f(k)=P(X=k)$ を満たす関数 $f (k)$ $f(k)$ を確率質量関数という。

確率密度関数の性質

常に $f (x) \geq 0$ 
 $P (a \leq X \leq b) = \int_{a}^{b} f (x) d x$ ^※
 $X$ のとる値の範囲が $α \leq X \leq β$ のとき、 $\int_{α}^{β} f (x) d x = 1$

※ $b = a$ $b=a$ の場合は $P (X = a) = \int_{a}^{a} f (x) d x = 0$ $P(X=a)=\int _{a}^{a}f(x)dx=0$ である。これは、定性的には「とり得る値が無限個あるうちからある1つの定数に定まる確率は0」と説明される。

以下、特に断りがない場合、確率変数は連続型であるとする。

確率変数 $X$ $X$ のとる値の範囲が $α \leq X \leq β$ $\alpha \leq X\leq \beta$ でその確率密度関数が $f (x)$ $f(x)$ であるとき、期待値・分散・標準偏差は定積分を用いて以下のように定義される。

$E (X) = m = \int_{α}^{β} x f (x) d x$ $E(X)=m=\int _{\alpha }^{\beta }xf(x)\,dx$

$V (X) = \int_{α}^{β} (x - m)^{2} f (x) d x$ $V(X)=\int _{\alpha }^{\beta }(x-m)^{2}f(x)\,dx$

$σ (X) = \sqrt{V (X)}$ $\sigma (X)={\sqrt {V(X)}}$

これは $α = - \infty, β = \infty$ $\alpha =-\infty ,\beta =\infty$ の場合も含む。

離散型確率変数の期待値・分散の公式と比べると、 $\sum_{k = 1}^{n}$ $\sum _{k=1}^{n}$ を $\int_{α}^{β}$ $\int _{\alpha }^{\beta }$ に、 $x_{k}$ $x_{k}$ を $x$ $x$ に、 $p_{k}$ $p_{k}$ を $f (x)$ $f(x)$ に置き換えただけで同じ形をしていることがわかる。累積分布関数（発展）

確率密度関数のグラフを直線 $x = u$ $x=u$ で区切った左側の面積を $F (u)$ $F(u)$ と置くと、 $F (u)$ $F(u)$ は $x$ $x$ が $u$ $u$ 以下の値を取る確率（累積確率）に一致する。このとき、 $F (x)$ $F(x)$ を累積分布関数または確率分布関数と呼ぶ。その定義より、累積分布関数と確率密度関数の間には $F (x) = \int_{- \infty}^{x} f (t) d t ⟺ f (x) = F^{'} (x)$ $F(x)=\int _{-\infty }^{x}f(t)\,dt\iff f(x)=F'(x)$ という関係がある。つまり、確率密度関数の $x = u$ $x=u$ における値 $f (u)$ $f(u)$ は累積分布関数 $F (x)$ $F(x)$ の $x = u$ $x=u$ における微分係数である。実際には累積分布関数が微分不可能な場合があるため、累積分布関数を確率密度関数の原始関数として定義することが多い。正規分布

確率変数 $X$ $X$ が実数 $m$ $m$ と正の実数 $σ$ $\sigma$ を用いて表される関数 $f (x) = \frac{1}{\sqrt{2 π} σ} e^{- \frac{(x - m)^{2}}{2 σ^{2}}}$ $f(x)={\frac {1}{{\sqrt {2\pi }}\sigma }}e^{-{\frac {(x-m)^{2}}{2\sigma ^{2}}}}$ を確率密度関数に持つとき、この $X$ $X$ の分布を正規分布またはガウス分布と呼び、 $N (m, σ^{2})$ $N(m,\sigma ^{2})$ のように表す。また、曲線 $y = f (x)$ $y=f(x)$ を正規分布曲線と呼ぶ。ここでは、確率変数 $X$ $X$ が正規分布 $N (m, σ^{2})$ $N(m,\sigma ^{2})$ に従うことを $X \sim N (m, σ^{2})$ $X\sim N(m,\sigma ^{2})$ と表すこととする。

$X \sim N (m, σ^{2})$ $X\sim N(m,\sigma ^{2})$ のとき、 $m = E (X), σ = σ (X)$ $m=E(X),\sigma =\sigma (X)$ が成り立つ。証明は数Ⅲレベルの積分の知識が必要なため省略する。なお、 $e = 2.71828 \dots$ $e=2.71828\cdots$ は「ネイピア数」と呼ばれる無理数である。詳しくは数学Ⅲの微分で扱う。

また、以下のような性質がある。

正規分布の性質

平均値と最頻値と中央値が一致する

曲線は直線 $x = m$ に関して対称で、 $f (x)$ は $x = m$ で最大値をとる。

 $x$ 軸を漸近線とする

標準偏差の値の大小と曲線の山の高低が対応している。

正規分布は連続型確率変数の分布の代表例である。身の周りの現象の中には、観測される変量の分布が正規分布に近いものが多くあり、正規分布を有効に利用することができる。最も有名な例を出すと、偏差値の導出に利用されている。標準正規分布

正規分布のうち、特に $N (0, 1)$ $N(0,1)$ を標準正規分布と呼ぶ。

$X \sim N (m, σ^{2})$ $X\sim N(m,\sigma ^{2})$ のとき、 $Y = a X + b$ $Y=aX+b$ とすると $Y \sim N (a m + b, a^{2} σ^{2})$ $Y\sim N(am+b,a^{2}\sigma ^{2})$ であることが知られている。そこで $Z = \frac{X - m}{σ}$ $Z={\frac {X-m}{\sigma }}$ とすると $Z \sim N (0, 1)$ $Z\sim N(0,1)$ であり^※、 $f (z) = \frac{1}{\sqrt{2 π}} e^{- \frac{z^{2}}{n}}$ $f(z)={\frac {1}{\sqrt {2\pi }}}e^{-{\frac {z^{2}}{n}}}$ が成り立つ。

このように、正規分布に従うある確率変数を標準正規分布に従う確率変数に変換することを、標準化と呼ぶ。

※どのような確率分布であっても、 $Z = \frac{X - E (E)}{σ (X)}$ $Z={\frac {X-E(E)}{\sigma (X)}}$ とおけば $E (Z) = 0, V (Z) = 1$ $E(Z)=0,V(Z)=1$ が成り立つことが知られている。これを標準化公式という。正規分布の場合は $Y = a X + b$ $Y=aX+b$ というアフィン変換に対して分布の種類を変えないので「標準化後も正規分布」と言うことができる。

標準正規分布に従う確率変数 $Z$ $Z$ において $P (0 \leq Z \leq u) = p (u)$ $P(0\leq Z\leq u)=p(u)$ としたとき、 $p (u)$ $p(u)$ がとる値を纏めた表を（標準）正規分布表と呼ぶ。正規分布を利用する際には必須になる表であり、大学入試においても問題冊子の最後の方に載せられていることが多い。本書の最終項に載せているので、演習問題を解くときに利用すると良い。

一般の分布であっても、応用上は分布表の値を参照するかエクセル等に計算させる場合が殆どである。

標準正規分布における確率について、次の等式が成り立つ。 $P (- u \leq Z \leq 0) = P (0 \leq Z \leq u) = p (u)$

{\displaystyle P(-u\leq Z\leq 0)=P(0\leq Z\leq u)=p(u)}

$P (- u \leq Z \leq u) = 2 p (u)$

$P (Z \leq 0) = P (Z \geq 0) = 0.5$

なお、正規分布表の値は累積密度関数 $F (x) = \frac{1 + e r f (\frac{x - m}{\sqrt{2} σ})}{2}$ $F(x)={\frac {1+\mathrm {erf} ({\frac {x-m}{{\sqrt {2}}\sigma }})}{2}}$ の $x = u$ $x=u$ における微分係数である。ここで $e r f (x)$ $\mathrm {erf} (x)$ は誤差関数と呼ばれる特殊関数で、 $e r f (x) = \frac{2}{\sqrt{π}} \int_{0}^{x} e^{- t^{2}} d t$ $\mathrm {erf} (x)={\frac {2}{\sqrt {\pi }}}\int _{0}^{x}e^{-t^{2}}\,dt$ で定義される。

正規分布から構成される確率分布として $t$ $t$ 分布、 $χ^{2}$ $\chi ^{2}$ 分布、 $F$ $F$ 分布の3つが存在する。他によく用いられる分布として、一様分布とポアソン分布が存在する。ベルヌーイ分布は一様分布の特別な場合である。詳しくは理数数学で解説する。正規化

二項分布 $B (n, p)$ $B(n,p)$ に従う確率変数 $X$ $X$ について、 $X = r$ $X=r$ となる確率を $n$ $n$ を大きくしながら計算し、そのグラフを書くと、次第にグラフが左右対称になっていくことがわかる。そこで、二項分布を正規分布で近似することを考える。

二項分布の正規分布による近似

 $n$ が十分大きいとき、 $X \sim B (n, p)$ ならば近似的に $X \sim N (n p, n p q)$ である。

一般に、ある確率分布に従う変数を正規分布に従う変数に近似する変換を正規化あるいは正規近似と呼ぶ。

二項分布に従う確率変数を正規化した後、さらに標準化することで正規分布表を活用することができる。先ほどの標準化の式に $m = n p, σ = \sqrt{n p q}$ $m=np,\sigma ={\sqrt {npq}}$ を代入するだけなので、そこまで手間はかからない。

なお、二項分布においてはベルヌーイ試行の確率 $p$ $p$ が0.5に近ければ近いほど正規近似の精度が上がることが知られている。

二項分布の $n \to \infty$ $n\to \infty$ の極限を考えると、正規分布に分布収束することが知られている。これはド・モアブル=ラプラスの定理（或いは中心極限定理）によって示される。

半整数補正 $X \sim B (16, 0.5)$ $X\sim B(16,0.5)$ とすると $m = 16 \cdot 0.5 = 8, σ = \sqrt{16 \cdot 0.5 \cdot (1 - 0.5)} = 2$ $m=16\cdot 0.5=8,\sigma ={\sqrt {16\cdot 0.5\cdot (1-0.5)}}=2$ である。ここで、整数 $r (1 \leq r \leq 16)$ $r(1\leq r\leq 16)$ に対し $P (X = r)$ $P(X=r)$ が $r$ $r$ を底辺の中心とする幅1の長方形の面積で表されるような $r$ $r$ ー $P$ $P$ グラフを考える。このグラフに $Y \sim N (8, 2^{2})$ $Y\sim N(8,2^{2})$ の確率密度関数のグラフを重ねると、例えば $P = P (6 \leq X \leq 10)$ $P=P(6\leq X\leq 10)$ について $P ≒ P (5.5 \leq Y \leq 10.5)$ $P\fallingdotseq P(5.5\leq Y\leq 10.5)$ であることがわかる。 $Z = \frac{Y - 8}{2}$ $Z={\frac {Y-8}{2}}$ とおくと $Z \sim N (0, 1)$ $Z\sim N(0,1)$ であるから $P ≒ P (- 1.25 \leq Z \leq 1.25) = 2 p (1.25) = 0.78870$ $P\fallingdotseq P(-1.25\leq Z\leq 1.25)=2p(1.25)=0.78870$ 二項分布から直接求めると $(0.5)^{16} \cdot \sum_{k = 6}^{10}_{16} C_{k} = 0.78988 \dots$ $(0.5)^{16}\cdot \sum _{k=6}^{10}{}_{16}\mathrm {C} _{k}=0.78988\cdots$ であり、高い精度で近似できることがわかる。このように、 $m, σ$ $m,\sigma$ について0.5だけ摺ずらして置き換えることを半整数補正と呼ぶ。なお、半整数補正を行わないで計算すると、 $P ≒ P (6 \leq Y \leq 10) = P (- 1 \leq Z \leq 1) = 2 p (1) = 0.68269$ $P\fallingdotseq P(6\leq Y\leq 10)=P(-1\leq Z\leq 1)=2p(1)=0.68269$ となり、近似値が小さくなる。 $n p, n q$ $np,nq$ がともに5より大きいならば、半整数補正により実用上十分な精度で近似値を確保することができる。半整数補正を行わない場合は $n p, n q$ $np,nq$ ともにかなり大きくないと良い精度にならない。

統計的な推測

標本調査

調べたい対象全体のデータを集める調査を全数調査と呼ぶ。国勢調査などがこれにあたる。全数調査は対象が厖大な場合に多くの労力・時間・費用を必要とする。また、工場等においては調査によって製品が傷つく場合（耐久試験など）には好ましくない。このような場合、対象全体から一部を抜き出して調べ、その結果から全体の状況を推測する調査を行う。このような調査を標本調査と呼ぶ。

標本調査における調べたい対象全体の集合を母集団、調査のために母集団から抜き出された要素の集合を標本と呼び、母集団から標本を抜き出すことを標本の抽出と呼ぶ。また、母集団の要素の個数を母集団の大きさ、標本の要素の個数を標本の大きさと呼ぶ。なお、ここでの「母」は「そこから何かを生じさせるもとになるもの」を意味する（「酵母」、「母校」等と同じ用法）。

標本調査では標本を母集団の正しい縮図にするために、標本が特別な属性を持つものに偏らないようにする必要がある。母集団の各要素を等しい確率で抽出することを無作為抽出と呼び、無作為抽出で選ばれた標本を無作為標本と呼ぶ。無作為抽出では乱数賽や乱数表などが用いられることがある。詳しくは「w:乱数生成」を参照。

全ての要素を母集団全体から無作為抽出することは容易ではないため、層化抽出法、クラスター抽出法、多段抽出法などさまざまな抽出方法が編み出されており、それぞれに長所・短所が存在する。母集団分布

母集団に属する要素についてのデータをある変量の値の集合と考えることで、ここまで扱ってきたような統計的手法が使える。

大きさ $N$ $N$ の母集団において、変量 $x$ $x$ のとる値と要素の個数をそれぞれ $x_{1} x_{2} \dots x_{n}, f_{1} f_{2} \dots f_{n}$ $x_{1}x_{2}\cdots x_{n},f_{1}f_{2}\cdots f_{n}$ と置く。このとき、変量xの度数分布表は以下のようになる。

{\displaystyle x_{1}x_{2}\cdots \cdots x_{n}}

{\displaystyle f_{1}f_{2}\cdots \cdots f_{n}}

階級値	$x_{1} x_{2} \dots \dots x_{n}$ $x_{1}x_{2}\cdots \cdots x_{n}$	計
度数	$f_{1} f_{2} \dots \dots f_{n}$ $f_{1}f_{2}\cdots \cdots f_{n}$	$N$ $N$

また、変量 $x$ $x$ の平均 $μ$ $\mu$ と標準偏差 $σ$ $\sigma$ は以下のように求められる。

$μ = \frac{1}{N} \sum_{k = 1}^{n} x_{k} f_{k} = \sum_{k = 1}^{n} x_{k} \frac{f_{k}}{N}$ $\mu ={\frac {1}{N}}\sum _{k=1}^{n}x_{k}f_{k}=\sum _{k=1}^{n}x_{k}{\frac {f_{k}}{N}}$

$σ = \sqrt{\frac{1}{N} \sum_{k = 1}^{n} (x_{k} - μ)^{2} f_{k}} = \sqrt{\sum_{k = 1}^{n} (x_{k} - μ)^{2} \frac{f_{k}}{N}}$ $\sigma ={\sqrt {{\frac {1}{N}}\sum _{k=1}^{n}(x_{k}-\mu )^{2}f_{k}}}={\sqrt {\sum _{k=1}^{n}(x_{k}-\mu )^{2}{\frac {f_{k}}{N}}}}$

この母集団から大きさ $n = 1$ $n=1$ で無作為抽出するとき、その要素における変量 $x$ $x$ の値 $X$ $X$ は偶然に支配されるが、 $X = x_{k}$ $X=x_{k}$ となる確率 $p_{k}$ $p_{k}$ は $p_{k} = \frac{f_{k}}{N}$ $p_{k}={\frac {f_{k}}{N}}$ で与えられる。

よって $X$ $X$ は以下のような確率分布を持つ確率変数と考えられる。

$X$ $X$	$x_{1} x_{2} \dots \dots x_{n}$ $x_{1}x_{2}\cdots \cdots x_{n}$	計
$P$ $P$	$\frac{f_{1}}{N} \frac{f_{2}}{N} \dots \dots \frac{f_{n}}{N}$ ${\frac {f_{1}}{N}}{\frac {f_{2}}{N}}\cdots \cdots {\frac {f_{n}}{N}}$	$N$ $N$

この確率分布は母集団の相対度数の分布と一致する^※。

※このことから、度数分布に於いて相加平均の式で求めた $E (X)$ $E(X)$ と期待値の式で求めた $E (X)$ $E(X)$ が常に一致することがわかる。則ち期待値は相加平均の拡張であり、期待値を平均とも呼ぶのはこれが由来である。

一般に、母集団における変量xの分布を母集団分布、その平均値を母平均、分散を母分散、標準偏差を母標準偏差と呼ぶ。上の確率分布から、大きさ1の無作為標本における変量 $x$ $x$ の値 $X$ $X$ と母平均 $μ$ $\mu$ 、母分散 $σ^{2}$ $\sigma ^{2}$ 、母標準偏差 $σ$ $\sigma$ について、 $E (X) = μ, V (X) = σ^{2}, σ (X) = σ$ $E(X)=\mu ,V(X)=\sigma ^{2},\sigma (X)=\sigma$ が成り立つ。

実際の統計では母集団の大きさが非常に大きく、母集団分布は度数分布と同様に連続型確率変数の分布として近似される。そこで、正規分布に近似することで具合が良くなる場合が多い。復元抽出

母集団から標本を抽出するのに、毎回元に戻しながら次のものを取り出す抽出を復元抽出と呼ぶ。逆に、取り出したものを戻さずに続けて抽出することを非復元抽出と呼ぶ。

大きさ $n$ $n$ の標本の要素における変量 $x$ $x$ の値を $X_{1}, X_{2} \dots X_{n}$ $X_{1},X_{2}\cdots X_{n}$ と置く。標本が復元抽出によるものならば、母集団から大きさ1の標本を無作為抽出することを $n$ $n$ 回繰り返す反復試行であるから、 $X_{k}$ $X_{k}$ はそれぞれが母集団分布に従う互いに独立な確率変数となる。非復元抽出の場合でも、母集団の大きさ $N$ $N$ が標本の大きさ $n$ $n$ より十分大きい（ $N >> n$ $N>>n$ ）場合には近似的に復元抽出による標本と見なすことができる。標本平均

大きさ $n$ $n$ の標本について、 $\bar{X} = \frac{1}{n} \sum_{k = 1}^{n} X_{k}$ ${\overline {X}}={\frac {1}{n}}\sum _{k=1}^{n}X_{k}$ を標本平均、 $S^{2} = \frac{1}{n} \sum_{k = 1}^{n} (X_{k} - \bar{X})^{2}$ $S^{2}={\frac {1}{n}}\sum _{k=1}^{n}(X_{k}-{\overline {X}})^{2}$ を標本分散、 $S = \sqrt{\frac{1}{n} \sum_{k = 1}^{n} (X_{k} - \bar{X})^{2}}$ $S={\sqrt {{\frac {1}{n}}\sum _{k=1}^{n}(X_{k}-{\overline {X}})^{2}}}$ を標本標準偏差と呼ぶ。

$X_{k}$ $X_{k}$ は「母集団から標本を抽出する」という試行の結果で値が定まる確率変数なので、 $\bar{X}, S^{2}, S$ ${\overline {X}},S^{2},S$ も同様の試行の結果で値が定まる確率変数である。

復元抽出の場合、確率変数の値 $X_{k}$ $X_{k}$ は大きさ1の標本の確率変数と見なすことができ、それぞれ母集団分布に従うので、 $E (X_{k}) = μ, V (X_{k}) = σ^{2}, σ (X_{k}) = σ$ $E(X_{k})=\mu ,V(X_{k})=\sigma ^{2},\sigma (X_{k})=\sigma$ が成り立つ。

$X_{k}$ $X_{k}$ はそれぞれ互いに独立なので、確率変数の和の期待値・分散を求める公式より $E (\bar{X}) = E (\frac{1}{n} \sum_{k = 1}^{n} X_{k}) = \frac{1}{n} \sum_{k = 1}^{n} E (X_{k}) = \frac{1}{n} \cdot n μ = μ$ $E({\overline {X}})=E({\frac {1}{n}}\sum _{k=1}^{n}X_{k})={\frac {1}{n}}\sum _{k=1}^{n}E(X_{k})={\frac {1}{n}}\cdot n\mu =\mu$

$V (\bar{X}) = V (\frac{1}{n} \sum_{k = 1}^{n} X_{k}) = \frac{1}{n^{2}} \sum_{k = 1}^{n} V (X_{k}) = \frac{1}{n^{2}} \cdot n σ^{2} = \frac{σ^{2}}{n}$ $V({\overline {X}})=V({\frac {1}{n}}\sum _{k=1}^{n}X_{k})={\frac {1}{n^{2}}}\sum _{k=1}^{n}V(X_{k})={\frac {1}{n^{2}}}\cdot n\sigma ^{2}={\frac {\sigma ^{2}}{n}}$

$σ (\bar{X}) = \sqrt{V (\bar{X})} = \frac{σ}{\sqrt{n}}$ $\sigma ({\overline {X}})={\sqrt {V({\overline {X}})}}={\frac {\sigma }{\sqrt {n}}}$

非復元抽出の場合も $N >> n$ $N>>n$ ならば同様である。標本比率

母集団全体の中である特性Aを持つ要素の割合を特性Aの母比率、標本の中で特性Aを持つ要素の割合を特性Aの標本比率と呼ぶ。

特性Aの母比率が $p$ $p$ である十分大きな母集団から、大きさがnの標本を無作為抽出するとき、標本の中で特性Aを持つ要素の個数を $T$ $T$ とおくと、 $T \sim B (n, p)$ $T\sim B(n,p)$ である。ここで、 $q = 1 - p$ $q=1-p$ として正規化すると、近似的に $T \sim N (n p, n p q)$ $T\sim N(np,npq)$ である。

特性Aの標本比率を $R$ $R$ とおくと、 $R = \frac{T}{n}$ $R={\frac {T}{n}}$ より $R$ $R$ は確率変数であり、 $E (R) = \frac{1}{n} E (T) = \frac{1}{n} \cdot n p = p$ $E(R)={\frac {1}{n}}E(T)={\frac {1}{n}}\cdot np=p$

$V (R) = \frac{1}{n^{2}} E (T) = \frac{1}{n^{2}} \cdot n p q = \frac{p q}{n}$ $V(R)={\frac {1}{n^{2}}}E(T)={\frac {1}{n^{2}}}\cdot npq={\frac {pq}{n}}$

であるので、近似的に $R \sim N (p, \frac{p q}{n})$ $R\sim N(p,{\frac {pq}{n}})$ である。

特性Aの母比率が $p$ $p$ である母集団において、特性Aを持つ要素を1、持たない要素を0で表す変量 $x$ $x$ を考える。このとき、 $X_{k}$ $X_{k}$ はそれぞれ1または0である。特性Aの標本比率 $R$ $R$ はこれらのうち値が1であるものの割合であるから、 $R = \frac{1}{n} \sum_{k = 1}^{n} X_{k} = \bar{X}$ $R={\frac {1}{n}}\sum _{k=1}^{n}X_{k}={\overline {X}}$ が成り立つ。よって、標本比率は標本平均の特別な場合である。

一般に、標本平均 $\bar{X}$ ${\overline {X}}$ について以下の法則が成り立つ。

標本平均の分布

標本の大きさ $n$ が大きいとき、近似的に $\bar{X} \sim N (μ, \frac{σ^{2}}{n})$ である。

母集団分布が正規分布のとき、常に $\bar{X} \sim N (μ, \frac{σ^{2}}{n})$ である。

大数たいすうの法則

標本標準偏差について、 $lim_{n \to \infty} σ (\bar{X}) = lim_{n \to \infty} \frac{σ}{\sqrt{n}} = 0$ $\lim _{n\to \infty }\sigma ({\overline {X}})=\lim _{n\to \infty }{\frac {\sigma }{\sqrt {n}}}=0$ より、 $n$ $n$ が大きくなると $\bar{X}$ ${\overline {X}}$ は母平均 $μ$ $\mu$ の近くに集中して分布する。すなわち、 $\bar{X}$ ${\overline {X}}$ が $μ$ $\mu$ に近い値をとる確率を $p$ $p$ とすると、 $lim_{n \to \infty} p = 1$ $\lim _{n\to \infty }p=1$ である。

$lim_{n \to \infty}$ $\lim _{n\to \infty }$ は「 $n$ $n$ を限りなく大きくする」という意味の記号である。詳しくはこちらを参照。

したがって、以下が成り立つ。

大数の法則

大きさ $n$ の無作為標本の標本平均 $\bar{X}$ は $n$ が大きくなるにつれて母平均 $μ$ に近づく。

区間推定

母平均の推定

母集団が大きいとき、母平均を求めるには時間も労力も相当にかかる。そこで、標本平均から母平均を推定することを考える。

標本の大きさ $n$ $n$ が大きいとき、近似的に $\bar{X} \sim N (μ, \frac{σ^{2}}{n})$ ${\overline {X}}\sim N(\mu ,{\frac {\sigma ^{2}}{n}})$ であるのは先程学んだ。 $\bar{X}$ ${\overline {X}}$ の標準化を考えて $Z = \frac{\bar{X} - μ}{\frac{σ}{\sqrt{n}}}$ $Z={\frac {{\overline {X}}-\mu }{\frac {\sigma }{\sqrt {n}}}}$ とおくと、近似的に $Z \sim N (0, 1)$ $Z\sim N(0,1)$ である。

ここで正規分布表より $P (| Z | \leq 1.96) ≒ 0.95$ $P(|Z|\leq 1.96)\fallingdotseq 0.95$ なので、

$P (μ - 1.96 \cdot \frac{σ}{\sqrt{n}} \leq \bar{X} \leq μ + 1.96 \cdot \frac{σ}{\sqrt{n}}) ≒ 0.95$ $P(\mu -1.96\cdot {\frac {\sigma }{\sqrt {n}}}\leq {\overline {X}}\leq \mu +1.96\cdot {\frac {\sigma }{\sqrt {n}}})\fallingdotseq 0.95$

すなわち $P (\bar{X} - 1.96 \cdot \frac{σ}{\sqrt{n}} \leq μ \leq \bar{X} + 1.96 \cdot \frac{σ}{\sqrt{n}}) ≒ 0.95$ $P({\overline {X}}-1.96\cdot {\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\overline {X}}+1.96\cdot {\frac {\sigma }{\sqrt {n}}})\fallingdotseq 0.95$ である。

この式は区間 $\bar{X} - 1.96 \cdot \frac{σ}{\sqrt{n}} \leq x \leq \bar{X} + 1.96 \cdot \frac{σ}{\sqrt{n}}$ ${\overline {X}}-1.96\cdot {\frac {\sigma }{\sqrt {n}}}\leq x\leq {\overline {X}}+1.96\cdot {\frac {\sigma }{\sqrt {n}}}$ が値 $μ$ $\mu$ を含むことが約95%の確実さで期待できることを示している。

この区間を母平均 $μ$ $\mu$ に対する信頼度95%の信頼区間と呼び、 $[\bar{X} - 1.96 \cdot \frac{σ}{\sqrt{n}}, \bar{X} + 1.96 \cdot \frac{σ}{\sqrt{n}}]$ $[{\overline {X}}-1.96\cdot {\frac {\sigma }{\sqrt {n}}},{\overline {X}}+1.96\cdot {\frac {\sigma }{\sqrt {n}}}]$ のように表す。

母平均 $μ$ $\mu$ に対して信頼度95％の信頼区間を求めることを、「母平均 $μ$ $\mu$ を信頼度95％で区間推定する」という。

信頼度95％とは、大きさ $n$ $n$ の無作為抽出を繰り返し、得られたそれぞれの標本平均に対し区間推定をして信頼区間を多数作ると、母平均 $μ$ $\mu$ の含まれる区間が95%の割合で現れることが期待できることを指している。

信頼度99％で推定する場合、正規分布表より $P (| Z | \leq 2.58) ≒ 0.99$ $P(|Z|\leq 2.58)\fallingdotseq 0.99$ なので、信頼区間は $[\bar{X} - 2.58 \cdot \frac{σ}{\sqrt{n}}, \bar{X} + 2.58 \cdot \frac{σ}{\sqrt{n}}]$ $[{\overline {X}}-2.58\cdot {\frac {\sigma }{\sqrt {n}}},{\overline {X}}+2.58\cdot {\frac {\sigma }{\sqrt {n}}}]$ となる。

なお、実際の統計では母標準偏差 $σ$ $\sigma$ がわからない場合が多いので、 $n$ $n$ が大きいときは代わりに標本標準偏差 $S$ $S$ を用いて良い。母比率の推定

母平均と同様、標本比率 $R$ $R$ から母比率 $p$ $p$ を区間推定することもできる。

標本の大きさ $n$ $n$ が大きいとき、先ほど学んだように $R \sim N (p, \frac{p q}{n})$ $R\sim N(p,{\frac {pq}{n}})$ である。したがって、母平均の推定の場合と同様に考えて $P (R - 1.96 \sqrt{\frac{p q}{n}} \leq p \leq R + 1.96 \sqrt{\frac{p q}{n}}) ≒ 0.95$ $P(R-1.96{\sqrt {\frac {pq}{n}}}\leq p\leq R+1.96{\sqrt {\frac {pq}{n}}})\fallingdotseq 0.95$ である。

$q = 1 - p$ $q=1-p$ であり、大数の法則より $n$ $n$ が大きいとき $p$ $p$ は $R$ $R$ と見做して良いから、 $Q = 1 - R$ $Q=1-R$ とおくと、母比率 $p$ $p$ に対する信頼度95％の信頼区間は $[R - 1.96 \sqrt{\frac{R Q}{n}}, R + 1.96 \sqrt{\frac{R Q}{n}}]$ $[R-1.96{\sqrt {\frac {RQ}{n}}},R+1.96{\sqrt {\frac {RQ}{n}}}]$ である。

信頼度99％で推定する場合、標本平均の場合と同様に考えて信頼区間は $[R - 2.58 \sqrt{\frac{R Q}{n}}, R + 2.58 \sqrt{\frac{R Q}{n}}]$ $[R-2.58{\sqrt {\frac {RQ}{n}}},R+2.58{\sqrt {\frac {RQ}{n}}}]$ となる。

$X_{k}$ $X_{k}$ のとる値は1または0であるから、 $X_{k}^{2} = X_{k}$ $X_{k}^{2}=X_{k}$ である。ここで $R = \bar{X}$ $R={\overline {X}}$ を用いると、標本分散 $S^{2}$ $S^{2}$ について以下のように変形できる。

$S^{2} = \frac{1}{n} \sum_{k = 1}^{n} (X_{k} - \bar{X})^{2}$ $S^{2}={\frac {1}{n}}\sum _{k=1}^{n}(X_{k}-{\overline {X}})^{2}$

$= \frac{1}{n} \sum_{k = 1}^{n} (X_{k}^{2} - 2 X_{k} \bar{X} + \bar{X^{2}})$ $={\frac {1}{n}}\sum _{k=1}^{n}(X_{k}^{2}-2X_{k}{\overline {X}}+{\overline {X^{2}}})$

$= \frac{1}{n} \sum_{k = 1}^{n} X_{k}^{2} - \frac{2}{n} \cdot n \bar{X} \cdot \sum_{k = 1}^{n} X_{k} + \bar{X^{2}}$ $={\frac {1}{n}}\sum _{k=1}^{n}X_{k}^{2}-{\frac {2}{n}}\cdot n{\overline {X}}\cdot \sum _{k=1}^{n}X_{k}+{\overline {X^{2}}}$

$= \frac{1}{n} \sum_{k = 1}^{n} X_{k} - 2 \bar{X^{2}} + \bar{X^{2}}$ $={\frac {1}{n}}\sum _{k=1}^{n}X_{k}-2{\overline {X^{2}}}+{\overline {X^{2}}}$

$= \bar{X} - \bar{X^{2}}$ $={\overline {X}}-{\overline {X^{2}}}$

$= R - R^{2}$ $=R-R^{2}$

$= R (1 - R)$ $=R(1-R)$

先ほど母標準偏差 $\sqrt{p q} (q = 1 - p)$ ${\sqrt {pq}}(q=1-p)$ を確率変数 $\sqrt{R Q} (Q = 1 - R)$ ${\sqrt {RQ}}(Q=1-R)$ で置き換えたが、上式より $\sqrt{R Q} = S$ ${\sqrt {RQ}}=S$ なので、この置き換えは母平均の推定で行なった「母標準偏差 $σ$ $\sigma$ を標本標準偏差 $S$ $S$ で置き換える」ことの特別な場合である。

ここでは信頼区間を大括弧[]で表したが、実は一般に区間 $a \leq x \leq b$ $a\leq x\leq b$ は「閉区間」と呼ばれ、 $[a, b]$ $[a,b]$ で表される。詳しくは数学Ⅲの極限で扱う。

なお、ある区間でもって母集団の特性値を推定する区間推定に対し、一つの値から母集団の特性値を推定することを点推定と呼ぶ。例として、大数の法則を利用して標本平均から母平均を近似することが挙げられる。区間推定と点推定を併せて統計的推定と呼ぶ。

仮説検定

数学Iで扱ったように、仮説検定とは以下の手順で仮説が正しいか判断する手法である。

正しいかどうか判断したい仮説[1]に反する仮説[2]を立てる
仮説[2]のもとで事象が起こる確率を調べる。
確率が小さく、仮説[2]のもとで事象が起こりにくいと判断できるとき、仮説[2]は正しくないと判断できる。
仮説[2]が偽と判断されたため、それに反する仮説[1]が真であると判断される。

なお、仮説[2]が正しくないと判断できないとき、仮説[1]の真偽を判断することはできない

仮説[1]を対立仮説、仮説[2]を帰無仮説と呼び、仮説が正しくないと判断することを「仮説を棄却する」という。棄却の基準となる確率を有意水準あるいは危険率と呼び、 $α$ $\alpha$ で表す。有意水準にはよく5%（ $α = 0.05$ $\alpha =0.05$ ）、1%（ $α = 0.01$ $\alpha =0.01$ ）が用いられる。有意水準に対して帰無仮説が棄却されるような確率変数の値の範囲を棄却域と呼ぶ。また、有意水準 $α$ $\alpha$ を用いて仮説検定を行うことを「有意水準 $α$ $\alpha$ で検定する」という。なお、対立仮説、帰無仮説をそれぞれ「仮説 $H_{1}$ $H_{1}$ ：〇〇」「仮説 $H_{0}$ $H_{0}$ ：☆☆（〇〇でない）」のように表すこともある。また、仮説が棄却されないことを「仮説を採択する」という場合がある。

数学Iでは、公正なコインを投げて裏表の出る回数を調べる試行の相対度数から帰無仮説のもとで事象が起こる確率を求めたが、ここでは正規分布を利用することを考える。両側検定

母比率の検定において、帰無仮説のもとで二項分布に従う確率変数 $X$ $X$ を設定すると、正規分布表を利用することができる。

上の例題において、正規近似と標準化を同時に行なっていることに注意。

母平均の検定も、同様に行うことができる。

なお、上の例題において $α = 0.05$ $\alpha =0.05$ ならば帰無仮説を棄却できる。このように、有意水準の値を変えると結論が変わる場合がある。

上の二つの例題では、棄却域を正規分布の両側にとっている。このような検定を両側検定と呼ぶ。片側検定

両側検定に対し、棄却域を正規分布の片側にとる検定を片側検定と呼ぶ。両側検定との違いは、対立仮説が「確率（平均）値が示されている値通りである」でなく「確率（平均）値が上がった（下がった）」である点である。

棄却域を片側にとっているため、正規分布で近似する値は $1 - α$ $1-\alpha$ ではなく $0.5 - α$ $0.5-\alpha$ であることに注意。

仮説検定の問題を解く際は、文脈から両側検定なのか片側検定なのか判断することになるので、文章読解力が必要になる。

なお、実際に検定を行うとき、「両側検定・片側検定の片方で帰無仮説が棄却されないからもう片方を試す」という操作は「検証が恣意的」と判断されてしまう可能性があるためしてはいけない。過誤（発展）

仮説検定を行うと、2種類の誤りが生じる可能性がある。一つは、帰無仮説が本当は正しいのにも拘らず、得られたデータが棄却域に入ってしまったことにより帰無仮説が棄却されることである。これを第一種の過誤と呼ぶ。このとき有意水準 $α$ $\alpha$ は第一種の過誤が起こる確率であり、有意水準のことを「危険率」とも呼ぶのはこれが理由である。

もう一つは、帰無仮説が本当は誤っているにも拘らず、得られたデータが棄却域に入らなかったために帰無仮説を採択してしまうことである。これを第二種の過誤と呼ぶ。

纏めると、以下の表のようになる。

	帰無仮説を棄却	帰無仮説を採択
帰無仮説が正しい	第一種の過誤	正しい判断
帰無仮説が誤り	正しい判断	第二種の過誤

この二つの過誤を品質管理に当てはめると、第一種の過誤は「本当は製品に問題がないにも拘らず、製品の検査段階で不良品と判断して出荷しないこと」に対応し、生産者リスクと呼ばれる。また、第二種の過誤は「本当は製品に問題があるにも拘らず、検査段階で問題なしと判断され出荷されてしまうこと」に対応し、消費者リスクと呼ばれる。

演習問題

付録

正規分布表

$p (- u) = p (u)$ $p(-u)=p(u)$ なので、 $u$ $u$ が正の値のときみ記載する。

$u$ $u$	.00	.01	.02	.03	.04	.05	.06	.07	.08	.09
0.0	0.00000	0.00399	0.00798	0.01197	0.01595	0.01994	0.02392	0.02790	0.03188	0.03586
0.1	0.03983	0.04380	0.04776	0.05172	0.05567	0.05962	0.06356	0.06750	0.07142	0.07535
0.2	0.07963	0.08317	0.08706	0.09095	0.09484	0.09870	0.10257	0.10642	0.11026	0.11409
0.3	0.11791	0.12172	0.12552	0.12930	0.13307	0.13683	0.14058	0.14431	0.14803	0.15173
0.4	0.15542	0.15910	0.16276	0.16640	0.17003	0.17365	0.17724	0.18082	0.18439	0.18793
0.5	0.19136	0.19497	0.19847	0.20194	0.20540	0.20884	0.21226	0.21566	0.21904	0.22241
0.6	0.22575	0.22947	0.23237	0.23565	0.23891	0.24215	0.24537	0.24857	0.25175	0.25490
0.7	0.25804	0.26115	0.26424	0.26731	0.27035	0.27337	0.27637	0.27935	0.28231	0.28524
0.8	0.28815	0.29103	0.29389	0.29673	0.29955	0.30234	0.30511	0.30785	0.31057	0.31327
0.9	0.31594	0.31859	0.32121	0.32381	0.32639	0.32894	0.33417	0.33398	0.33646	0.33891
1.0	0.34135	0.34376	0.34614	0.34850	0.35083	0.35314	0.35543	0.35769	0.35993	0.36214
1.1	0.36433	0.36650	0.36864	0.37076	0.37286	0.37493	0.37698	0.37900	0.38100	0.38298
1.2	0.38493	0.38686	0.38877	0.39065	0.39251	0.39435	0.39617	0.39796	0.39973	0.40148
1.3	0.40320	0.40490	0.45608	0.40824	0.40988	0.41149	0.41309	0.41466	0.41620	0.41774
1.4	0.41924	0.42073	0.42220	0.42364	0.42507	0.42647	0.42786	0.42922	0.43056	0.43189
1.5	0.43319	0.43448	0.43575	0.43699	0.43822	0.43943	0.44062	0.44179	0.44295	0.44408
1.6	0.44520	0.44630	0.44738	0.44845	0.44950	0.45053	0.45154	0.45254	0.45352	0.45449
1.7	0.45544	0.45637	0.45728	0.45819	0.45907	0.45994	0.46080	0.46164	0.46246	0.46327
1.8	0.46407	0.46485	0.46562	0.46638	0.46712	0.46784	0.46856	0.46926	0.46995	0.47062
1.9	0.47128	0.47193	0.47252	0.47320	0.47381	0.47441	0.47500	0.47558	0.47615	0.47670
2.0	0.47725	0.47778	0.47831	0.47882	0.47933	0.47972	0.48030	0.48077	0.48124	0.48169
2.1	0.48214	0.48257	0.48300	0.48341	0.48382	0.48422	0.48461	0.48500	0.48537	0.48574
2.2	0.48610	0.48645	0.48679	0.48713	0.48746	0.48778	0.48809	0.48840	0.48870	0.48899
2.3	0.48928	0.48956	0.48983	0.49010	0.49036	0.49061	0.49086	0.49111	0.49134	0.49158
2.4	0.49180	0.49202	0.49224	0.49245	0.49266	0.49286	0.49305	0.49324	0.49343	0.49361
2.5	0.49379	0.49396	0.49413	0.49430	0.49446	0.49461	0.49477	0.49492	0.49506	0.49520
2.6	0.49534	0.49547	0.49560	0.49573	0.49586	0.49598	0.49609	0.49621	0.49632	0.49643
2.7	0.45653	0.49664	0.49674	0.49683	0.49693	0.49702	0.49711	0.49720	0.49728	0.49737
2.8	0.49745	0.49752	0.49760	0.49767	0.49774	0.49781	0.49788	0.49795	0.49801	0.49807
2.9	0.49813	0.49819	0.49825	0.49830	0.49836	0.49841	0.49846	0.49851	0.49856	0.49860
3.0	0.49865	0.49869	0.49874	0.49878	0.49882	0.49886	0.49889	0.49893	0.49897	0.49900
3.1	0.49990	0.49907	0.49910	0.49913	0.49916	0.49918	0.49921	0.49924	0.49926	0.49929
3.2	0.49931	0.49934	0.49936	0.49938	0.49940	0.49942	0.49944	0.49946	0.49948	0.49950
3.3	0.49952	0.49953	0.49955	0.49957	0.49958	0.49960	0.49961	0.49962	0.49964	0.49965
3.4	0.49966	0.49968	0.49969	0.49970	0.49971	0.49972	0.49973	0.49974	0.49975	0.49976
3.5	0.49977	0.49978	0.49978	0.49979	0.49980	0.49981	0.49982	0.49982	0.49983	0.49984

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

この記事を書いた人

MirrorMaster

高等学校数学B/確率分布と統計的な推測

確率分布

確率分布

同時分布

二項分布

正規分布

統計的な推測

標本調査

区間推定

仮説検定

演習問題

付録

正規分布表

この記事を書いた人

コメント

コメントするコメントをキャンセル

高等学校数学B/確率分布と統計的な推測

確率分布

確率分布

同時分布

二項分布

正規分布

統計的な推測

標本調査

区間推定

仮説検定

演習問題

付録

正規分布表

この記事を書いた人

関連記事

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル