バナナでもわかる話

計量経済学・統計学が専門の大学院生です。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

統計

統計検定1級対策問題集~ガンマ分布編~

統計検定1級対策のために役立ちそうな計算問題をまとめるやつやっていきます。 統計検定前の最終チェックや、統計検定の勉強何をすれば分からないという場合に活用ください。 今回はガンマ分布関連。 ガンマ関数の処理に慣れるまでは難しいかもしれません。 …

統計検定1級対策問題集~指数分布編~

統計検定1級対策のために役立ちそうな計算問題をまとめるやつやっていきます。 統計検定前の最終チェックや、統計検定の勉強何をすれば分からないという場合に活用ください。 今回は指数分布関連。 今回はそんなに難しい話はないです。 スポンサーリンク (ad…

統計検定1級対策問題集~正規分布編~

統計検定1級対策のために役立ちそうな計算問題をまとめるやつやっていきます。 統計検定前の最終チェックや、統計検定の勉強何をすれば分からないという場合に活用ください。 今回は正規分布関連。 多変量正規分布はまた別記事でやるとして、今回は1変量の正…

統計検定1級対策問題集~負の二項分布編~

統計検定1級対策のために役立ちそうな計算問題をまとめるやつやっていきます。 統計検定前の最終チェックや、統計検定の勉強何をすれば分からないという場合に活用ください。 今回は負の二項分布関連。 統計検定1級は、割と分布の畳み込みと、モーメント関連…

統計検定1級対策問題集~ポアソン分布編~

統計検定1級対策のために役立ちそうな計算問題をまとめるやつやっていきます。 統計検定前の最終チェックや、統計検定の勉強何をすれば分からないという場合に活用ください。 今回はポアソン分布関連。 統計検定1級は、割と分布の畳み込みと、モーメント関連…

統計検定1級対策問題集~二項分布編~

統計検定1級対策のために役立ちそうな計算問題をまとめるやつやっていきます。 統計検定前の最終チェックや、統計検定の勉強何をすれば分からないという場合に活用ください。 今回は二項分布関連。 統計検定1級は、割と分布の畳み込みと、モーメント関連の計…

企業でのデータ解析は、「動くコードが書ける」だけではダメみたい

こんにちは! 最近ブログの更新が滞ってしまっていて申し訳ないです。前にもお伝えしていた通り、某社で1か月ほどデータサイエンティストとしてインターンをさせていただいています。今回は、そこで勤めてみて、初めて知ったことを雑記していこうと思います…

1週間で知識ゼロの初心者がSQL操作を身に着ける方法

インターン先で急にSQLが必要と言われ、急遽身に着ける必要が生じ、本当に何も知らない状態からのスタートだったのですが、結構簡単に身について、今はそこそこスムーズにデータを取り出すことが出来るようになりました。メモがてら何をやったか書いていこう…

ゼロ過剰負の二項回帰のStanによる実装

今回は、ゼロ過剰負の二項回帰モデルをやりたいと思います。 なんか名前がゴツゴツしいですね。 とりあえず、今回もStanコードを書くのがメインなので、モデル部分はザックリいきます。目次 モデル ゼロ過剰とは 負の二項分布 負の二項回帰 Stanによる実装 …

階層ベイズ生存解析を用いたwebサイトの訪問者分析に関するStanでの実装

今回も少し難しめの話。 前回生存解析についてまとめたので、生存解析を使っているマーケティングモデルでも勉強してみようかと探してみたところ、次の論文があったので、論文モデルを整理しながらStanで実装してみようと思います。前回の生存解析の記事 www…

Rで行える生存解析を出来る限り初歩から解説してみる~ハザード率、cox比例ハザード、ログランク検定等~

今回は生存解析をやろうと思います。 生存解析に関する解説をしているブログは巷に溢れかえっていますが、他のブログよりもハザード率の解説を丁寧に行うことにより差別化を図っていければいいなと思っています。目次 ハザード率(Hazard Rates) 2種類のハザ…

消費者の情報探索行動の目的を反映した購買モデルをStanで実装する

今回も中々高度な話をやっていきます。消費者は何か物を買うときに「情報探索行動」を行います。 しかし、情報探索行動は特に物を買う気の無い消費者も行います。 例えば、特に買いたいものはないけど、流行をチェックするために服屋をぶらつくだとか、本屋…

多項プロビットモデルの最尤推定をRで行う方法と数理、気を付けるべき点

今回は多項プロビットモデルです。少々高度な内容になります。目次 多項プロビットモデル 具体例 数式 与えられているデータ 購買情報を踏まえた尤度 GHKアルゴリズム Rによる多項プロビット回帰 使用するデータ mlogit.data関数 mlogit関数 実行&結果 多項…

Rで多変量正規分布の最尤推定量を求める

今回は多変量正規分布についてやっていこうと思います。目次 多変量正規分布とは 求めたいパラメータ 使用する関数 mvnorm関数 optim関数 Rで実装 スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 多変量正規分布とは n次元確率変数ベ…

R言語で勾配とヘシアンを出力する関数を作成する

Rには、微分して値を出力したり、ヘシアンを出力する既存関数としてderiv関数というものがあるみたいなのですが、 なんかネットで調べて試してみても、何か使い方がよくわかんなかったので、まどろっこしくなって作りました。関数形と微分したい変数名、変数…

Rで線形回帰において総当たり法を行う関数を作成する

今回は、前回書いた0と1の組み合わせを全て出力する関数を応用して、説明変数選択の自動化(総当たり法)を行ってみたいと思います。 ちなみに前回書いた記事とはこちら Rで任意の個数の0と1の組み合わせパターンを出力する関数を作る - バナナでもわかる話 何…

Rで任意の個数の0と1の組み合わせパターンを出力する関数を作る

今回はタイトルのような関数を作ってみたいと思います。 0と1の組み合わせってなんやねんっていうと、例えば2個のもので考えるならこんな感じ。この組み合わせの総数はあるので、手作業で頑張るのは個数が大きくなってくるとしんどいです。 ※5個の時点で32パ…

多項プロビットモデルだけで1冊書いてる本を見つけた

今日大学の図書館の書庫を彷徨っていたら、面白そうな本を見つけました。Multinomial Probit: The Theory and Its Application to Demand Forecasting なんとこの本、multinomial probit(多項プロビットモデル)だけで1冊の本になっているらしく、多項プロビ…

Rで行えるプロビット回帰に関するまとめ~最尤法、ベイズ~

今回はRでプロビット回帰を行う際に使用できる分析方法と、その注意点を上げておきます。目次 プロビット回帰とは 最尤法 モデル Rによるコード シミュレーション ベイズ 注意点とコメント 関連記事 スポンサーリンク (adsbygoogle = window.adsbygoogle || …

Rで行うEMアルゴリズム~ゼロ過剰ポワソン分布を例にして~

今回は、EMアルゴリズムを用いて、ゼロ過剰ポワソン分布のパラメータの推定を行ってみようと思います。目次 過去記事 最尤推定 ゼロ過剰ポワソン分布の尤度関数 最尤推定量 Mの理論値 EMアルゴリズム アルゴリズム 実例 スポンサーリンク (adsbygoogle = win…

Rで行えるロジスティック回帰に関するまとめ~最尤法、Penalized Likelihood (Firth)、ベイズ~

今回はロジスティック回帰について、Rで出来ることを数式込みでまとめておきます。 目次 ロジスティック回帰とは 最尤法 モデル Rによるコード Penalized Likelihood (Firth) 数値的に 0 か 1 である確率が生じました モデル Rによるコード 両者のシミュレー…

Rで行える線形回帰分析法の一覧とその方法~最小二乗法・最尤法・ベイズ~

今回は、線形回帰分析に関するRでの分析法を1記事にまとめておこうと思います。目次 線形回帰分析とは シミュレーション用データ 最小二乗法 計算 Rによる最小二乗法 最小二乗法の特徴 最尤法 計算 Rによる最尤推定 最尤法の特徴 ベイズ 解説 Rstanによる実…

サービスの4つの特性と統計モデリングでの注意点

今日は、有名なサービスの4特性を通じて、サービスに関するデータ解析で注意すべき点を記事にしようと思います。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); サービス まず、サービスとはという話ですが、例えばコンビニや銀行、…

Rのplotを使ってNealの漏斗を可視化してみる

今日は、「StanとRでベイズ統計モデリング」という本の10章にあるNealの漏斗問題の可視化を簡単なコードだけで行ってみたいと思います。ちなみにStanとRでベイズ統計モデリングとは、こちらの本です。 こちらの本、全てのコードがしっかりサポートページに掲…

次元削減とは

今日は統計学や機械学習、その他画像認識等の場面で登場する「次元削減」の話について書こうと思います。 まず、次元削減とは、次元データを次元にうつすことで、次元を下げることを指します。簡単に例を出すと、 例えば国語・数学・理科・社会の4科目(1科目…

一様事前分布は無情報ではないという話

ベイズで何かを議論する際に、よく無情報事前分布として一様分布が用いられます。 何をもって""無情報""と呼ぶかっていうのは難しい問題で、今回はその話をしようと思います。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); まず、一…

順序選択モデルの数理と解釈~ベイズモデルの構成法~

今日は順序選択モデルというモデルについて書くことにします。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 具体例 例えば焼肉屋さんで、ライスを頼みたいと思ったとします。 この時に小ライスか、中ライスか、大ライスが選べると…

因子分析におけるスクリープロットの意味と解釈

今回はスクリープロットに関する話をします。 前記事でも書きましたが、探索的因子分析を行うにあたっては構造に特定の仮定を置かず、全ての因子から全ての項目に対しての関係を想定し、そこから探索的に構造を見つけていく必要がありました。 【初心者向け…

因子分析のクロンバックのアルファをどう解釈すべきか

今回は因子分析におけるクロンバックのアルファって何?っていう話をしようと思います。 因子分析自体よく知りませんという方はとりあえず、下リンクからどうぞ! 因子分析 カテゴリーの記事一覧 - バナナでもわかる話 スポンサーリンク (adsbygoogle = wind…

相関関係から因果関係を判断するために注意すべきこと

今日は因果関係の話でも。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 「収入が増えれば消費が増える」とか「広告を打てば売上が上がる」とかいったことを考えるにあたって、簡単に回帰分析をしてみましょう~!みたいな話はよく…