バナナでもわかる話

計量経済学・統計学が専門の大学院生です。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

統計検定1級対策問題集~一様分布編~

さて、意外と鬼門な一様分布に関する想定問題(及び過去問)とその解答例を作成して見ました。

目次


スポンサーリンク



離散一様分布の期待値、分散、歪度

問1 確率変数Xが1,2,...nの値を取る離散一様分布に従うと仮定する。この時期待値、分散、歪度を求めよ

期待値について
 E[X]=\sum_{x=1}^n \frac{x}{n}=\frac{n+1}{2}

分散について
 E[X^2]=\sum_{x=1}^n \frac{x^2}{n}=\frac{(n+1)(2n+1)}{6}

 Var[X]=E[X^2]-E[X]^2=\frac{(n+1)(n-1)}{12}


歪度について
 E[X^3]=\sum_{x=1}^n \frac{X^3}{n}=\frac{n(n+1)^2}{4}

E[\frac{(X-\mu)^3}{\sigma^3}]=\frac{1}{\sigma^3}E[X^3-3\mu X^2 +3\mu^2 X -\mu^3]=\frac{1}{\sigma^3} × \frac{(n+1)^2}{4} × 0=0


連続一様分布の期待値、分散、歪度、積率母関数

問2 確率変数Xが区間 [a,b]上で連続一様分布に従うと仮定する。この時期待値、分散、歪度、積率母関数を求めよ。


期待値について
 E[X]=\int_{a}^b \frac{X}{b-a} dX=\frac{a+b}{2}


分散について
 E[X^2 ]=\int_{a}^b \frac{X^2}{b-a} dX=\frac{a^2+ab+b^2}{3}

 Var[X]=E[X^2]-E[X]^2=\frac{(a-b)^2}{12}


積率母関数について
 E[exp(tX)]=\frac{1}{b-a} \int_{a}^b exp(tX)dX=\frac{exp(tb)-exp(ta)}{t(b-a)}


歪度について
 E[X^3]=\int_{a}^b \frac{X^3}{b-a}dX=\frac{(b+a)(b^2+a^2)}{4}

[tex: E[\frac{(X-\mu)^3}{\sigma^3}]=\frac{1}{\sigma^3}E[X^3-3\mu X^2 +3\mu^2 X -\mu^3]=0


変数変換後の分布

問3 Xが区間 [0,1]上で連続一様分布に従うと仮定する。この時 X^2の累積分布、密度関数、期待値、分散を求めよ


密度関数について
 Y=X^2とおく。 f(x)=1,g(y):Yの密度関数とする。

密度関数の定義より
 P(x < X < x+\Delta x)=P(y < Y < y + \Delta y)

 ⇔ f(x) \Delta x = g(y) \Delta y

よって

 g(y) = f(x) \frac{dx}{dy}=\frac{1}{2} Y^{-\frac{1}{2}}


累積分布について
 G(y)=\int_0^y \frac{1}{2}Y^{-\frac{1}{2}} dY =y^{\frac{1}{2}}


期待値について
 E[Y ]=\int_{0}^1 \frac{1}{2} Y^{\frac{1}{2}} dY =\frac{1}{3}


分散について
 E[Y^2 ] = \int_{0}^1 \frac{1}{2} Y^{\frac{3}{2}} dY = \frac{1}{5}

 Var[Y ]=\frac{4}{45}


max,minの分布

問4 U,Vは独立に区間  [0,1]の一様分布に従うと仮定する。X=max(U,V),Y=min(U,V)とおく。X,Yの累積分布、密度関数、同時密度関数、相関係数を求めよ


累積分布について
(X ≤ x)⇔(U ≤ x)&(V ≤ x)

 G_1(x)=Pr(X ≤ x)=Pr(U ≤ x)Pr(V ≤ x)=\int_{0}^x 1 du \int_{0}^x 1 dv=x^2


 G_2(y)
 =Pr(Y ≤ y)=1- Pr(Y ≥ y)=1-Pr(y ≤ U)Pr(y ≤ V)
 =1-\int_{y}^1 1 du \int_{y}^1 1 dv = 1-(1-y)^2


密度関数について
 g_1(x)=\frac{d G_1(x)}{dx}=2x

 g_2(y) = \frac{d G_2 (y)}{dy}=2(1-y)


同時密度関数について
同時分布 G(x,y)を考える。

 G(x,y) = Pr(X ≤ x, Y ≤ y)=Pr(X ≤ x)-Pr(X ≤ x, y ≤ Y)
 = Pr(X ≤ x)- Pr( y ≤ U, V ≤ x) = x^2 - \int_{y}^x 1 du \int_{y}^x 1 dv = y(2x-y)

よって同時密度関数 g(x,y)

 g(x,y)=\frac{G(x,y)}{\partial x \partial y}=2


相関係数について
 E[X]=\frac{2}{3}
 E[Y]=\frac{1}{3}

ここでY≤Xなので

 E[XY]=\int_{0}^1 \int_{0}^x 2xy dy dx =\frac{1}{4}

 E[X^2]=\frac{1}{2}
 E[Y^2]=\frac{1}{6}

よって相関係数 \rho(x,y)
 \rho(x,y)=\frac{1}{36}

最尤推定量

これは、前に記事にしたので、以下の記事の一様分布の欄を参照。
www.bananarian.net


スポンサーリンク


逆関数法

問5 連続確率変数Zについて累積分布F(z)=P(Z≤z)について、U=F(z)は区間[0,1]の一様分布に従うことを示せ


これは、ほとんど自明ですが

まず、累積分布関数は単調増加関数なので
 F(z)=P(Z ≤ z)=P(F(Z) ≤ F(z))

つまり F(z)=uとおくと、

 P(F(Z) ≤ u)=u

これは一様分布の累積分布関数である。


二番目に小さいものの分布

問6  U_1,U_2,U_3が独立に区間[0,1]の一様分布に従うと仮定する。二番目に小さいものをXとおく。この時のXの密度関数を求めよ


統計検定1級の過去問で「最小のものを X_1,次に小さいものを X_2,最も大きいものを X_3とした時の密度と期待値を求めよ」が出題されていますが、本記事の問4と問6を組み合わせると解くことが出来ます。


分布関数Gをまず考える。

 G(x)= Pr(X ≤ x)
ここで U_1 ≤ U_2 ≤ U_3を一旦仮定してやると(X ≤ x)が成り立つに当たって考えられる条件は次の2通り。

 U_1 ≤ x かつ U_2 ≤ x かつ U_3 ≤ x...①

 U_1 ≤ x かつ U_2 ≤ x かつ U_3 ≥ x...②

ここで、①は U_1からU_3の大小問わず成り立つが、②は大小の組み合わせに応じて3通り存在する。

よって  Pr(X ≤ x)は次のようになる。

G(x)=Pr(X ≤ x)=Pr(U_1 ≤ x)Pr(U_2 ≤ x) Pr(U_3 ≤ x)+3\{(\int_{0}^x 1 du)^2 (\int_{x}^1 1 du)\}
 = x^3+3 x^2 (1-x)

以上より密度関数は

 g(x)=\frac{d G(x)}{dx}=6x(1-x)