負の二項分布という分布があります。
この負の二項分布ですが、解説書によって定義が違っているため、
事前に確認しないと何を指しているのかよくわからなくなる分布です。
Rには、負の二項分布からの乱数を出力する関数としてrnbinom関数があるのですが、それがどの負の二項分布からの乱数なのかも確認しておきます。
①1個目の負の二項分布
成功率で回成功するまでに必要な試行回数を確率変数とする確率分布を負の二項分布と呼びます。
質量関数は次の通り。
②もう一つの負の二項分布
成功率で回成功するまでに必要な失敗回数を確率変数とする確率分布も負の二項分布と呼びます。
まあ実質やっていることは同じですね。
質量関数は次の通り。
当然必要な試行回数はY+rをすれば出てきますね。
rnbinom関数
Rでは負の二項分布の乱数を出す関数としてrnbinom関数があります。
この関数から出力される乱数は①と②のどちらでしょうか。
まあ実際に乱数を取り出してみればすぐわかります。まず、関数の説明から。
とりあえず関数はこんな感じ。
rnbinom(n, size, prob)
一応muというのもありますが、その辺の話はまた別の記事で。
は取り出す乱数の個数
は成功回数です。先ほどの文字で言うとですね。
は成功率です。
それじゃあ適当に乱数を取り出してみます。
> rnbinom(n=10, size=3, prob=1) [1] 0 0 0 0 0 0 0 0 0 0
成功回数3,成功率1でやってみました。
もし、必要な試行回数が確率変数だとすると、出てくる値は3以上のはずです。
よって、このrnbinom関数から出ている乱数は②の負の二項分布から出ているようですね。
最後にヒストグラムでも出して終わっておきます。
barplot(table(rnbinom(n=100000, size=5, prob=0.3)),main="size=5,prob=0.3")
負の二項分布については、もっと詳しい仕組みがあって、具体的に言うとポアソン分布とガンマ分布に関係するのですが、それについてはまた次回の記事で説明します。