バナナでもわかる話

開設当初は計量経済学・統計学が専門の大学院生でした。今はデータを扱うお仕事をしています。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

統計

多項プロビットモデルだけで1冊書いてる本を見つけた

今日大学の図書館の書庫を彷徨っていたら、面白そうな本を見つけました。Multinomial Probit: The Theory and Its Application to Demand Forecasting なんとこの本、multinomial probit(多項プロビットモデル)だけで1冊の本になっているらしく、多項プロビ…

Rで行えるプロビット回帰に関するまとめ~最尤法、ベイズ~

今回はRでプロビット回帰を行う際に使用できる分析方法と、その注意点を上げておきます。目次 プロビット回帰とは 最尤法 モデル Rによるコード シミュレーション ベイズ 注意点とコメント 関連記事 スポンサーリンク (adsbygoogle = window.adsbygoogle || …

Rで行うEMアルゴリズム~ゼロ過剰ポワソン分布を例にして~

今回は、EMアルゴリズムを用いて、ゼロ過剰ポワソン分布のパラメータの推定を行ってみようと思います。目次 過去記事 最尤推定 ゼロ過剰ポワソン分布の尤度関数 最尤推定量 Mの理論値 EMアルゴリズム アルゴリズム 実例 スポンサーリンク (adsbygoogle = win…

Rで行えるロジスティック回帰に関するまとめ~最尤法、Penalized Likelihood (Firth)、ベイズ~

今回はロジスティック回帰について、Rで出来ることを数式込みでまとめておきます。 目次 ロジスティック回帰とは 最尤法 モデル Rによるコード Penalized Likelihood (Firth) 数値的に 0 か 1 である確率が生じました モデル Rによるコード 両者のシミュレー…

Rで行える線形回帰分析法の一覧とその方法~最小二乗法・最尤法・ベイズ~

今回は、線形回帰分析に関するRでの分析法を1記事にまとめておこうと思います。目次 線形回帰分析とは シミュレーション用データ 最小二乗法 計算 Rによる最小二乗法 最小二乗法の特徴 最尤法 計算 Rによる最尤推定 最尤法の特徴 ベイズ 解説 Rstanによる実…

サービスの4つの特性と統計モデリングでの注意点

今日は、有名なサービスの4特性を通じて、サービスに関するデータ解析で注意すべき点を記事にしようと思います。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); サービス まず、サービスとはという話ですが、例えばコンビニや銀行、…

Rのplotを使ってNealの漏斗を可視化してみる

今日は、「StanとRでベイズ統計モデリング」という本の10章にあるNealの漏斗問題の可視化を簡単なコードだけで行ってみたいと思います。ちなみにStanとRでベイズ統計モデリングとは、こちらの本です。 こちらの本、全てのコードがしっかりサポートページに掲…

次元削減とは

今日は統計学や機械学習、その他画像認識等の場面で登場する「次元削減」の話について書こうと思います。 まず、次元削減とは、次元データを次元にうつすことで、次元を下げることを指します。簡単に例を出すと、 例えば国語・数学・理科・社会の4科目(1科目…

一様事前分布は無情報ではないという話

ベイズで何かを議論する際に、よく無情報事前分布として一様分布が用いられます。 何をもって""無情報""と呼ぶかっていうのは難しい問題で、今回はその話をしようと思います。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); まず、一…

順序選択モデルの数理と解釈~ベイズモデルの構成法~

今日は順序選択モデルというモデルについて書くことにします。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 具体例 例えば焼肉屋さんで、ライスを頼みたいと思ったとします。 この時に小ライスか、中ライスか、大ライスが選べると…

因子分析におけるスクリープロットの意味と解釈

今回はスクリープロットに関する話をします。 前記事でも書きましたが、探索的因子分析を行うにあたっては構造に特定の仮定を置かず、全ての因子から全ての項目に対しての関係を想定し、そこから探索的に構造を見つけていく必要がありました。 【初心者向け…

因子分析のクロンバックのアルファをどう解釈すべきか

今回は因子分析におけるクロンバックのアルファって何?っていう話をしようと思います。 因子分析自体よく知りませんという方はとりあえず、下リンクからどうぞ! 因子分析 カテゴリーの記事一覧 - バナナでもわかる話 スポンサーリンク (adsbygoogle = wind…

相関関係から因果関係を判断するために注意すべきこと

今日は因果関係の話でも。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 「収入が増えれば消費が増える」とか「広告を打てば売上が上がる」とかいったことを考えるにあたって、簡単に回帰分析をしてみましょう~!みたいな話はよく…

数学・統計初心者から始めて計量経済学で中上級者になるためのオススメ本

前に書いた統計本紹介記事(下リンク参照)が、とても評判がよかったので、計量経済学も書いてみようかと思います。 www.bananarian.netスポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 目次 計量経済学とは? 非研究者志望が計量経済学…

C++を使ってディープラーニングの基本を試す

最近、Rだけで統計解析したりすることに限界を感じているので、そうだ!C++を勉強しようと思い立ちました。そこでとりあえず下の本を参考に、ディープラーニングの実装しながらC++を勉強しようなんていう次第です。 コードをそのまま写経するのも勉強にはな…

階層ベイズモデルとは~国ごとの犯罪件数のデータからグループ差を考えるモデル

※すみません。データからとタイトルを書きましたが、実際のデータは使いません(見つからなかった....)。 あくまで階層ベイズの使い方の説明ということでご覧ください。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 例えば国毎の犯…

外れ値を考慮したコーシー分布に基づく線形回帰~最尤法とベイズの両面から~

今まで何度も普通の回帰分析は「外れ値に引っ張られる」から注意した方が良いという記事を上げてきました。ただそうは言っても、ちょっと他のデータから外れていそうなデータを無根拠に弾いていては、それは単なる恣意的なデータ操作では?と言われかねませ…

人間の選択をモデル化するプロビット・ロジットモデルの違いと経済学的解釈法

今日は人間の選択をモデル化する方法について書いてみようと思います。 一応事前にプロビット・ロジットについてネット記事が無いか漁ってみたのですが、・機械学習の文脈で説明されていることが多い ・プロビット・ロジットの選択基準が説明変数の観点から…

Rでミニゲームが出来る"fun"パッケージの解説~五目並べ,マインスイーパー,ライトアウトなど~

なんかRでマインスイーパーが出来ると聞いて、入れてみました!funパッケージ!ジョークで作られたパッケージですね。実用性は恐らくほぼありませんが、出来ることを解説していきます。まず、パッケージのインストールから install.packages("fun") library(…

時系列解析とは?時間の多項式トレンド(polynomial trends)を使った基本姿勢、計算方法とRコードの解説

そういえば時系列に関する話、あまり書いていないなと思ったので記事にしていこうと思います。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 時系列とは? まず、簡単に時系列とは何かっていう話ですが、例えば株価とかを考えてもら…

線形仮定を置かない相関係数の解釈~共分散に基づくもの~

何回か相関係数についての話をしてきましたが、今回が最終回です。 過去記事はこちら 相関係数の目安と解釈と注意点~舐めてかかると痛い目を見る話~ - バナナでもわかる話 最小二乗法による相関係数の導出~相関係数の意外な解釈法 - バナナでもわかる話 Rを…

Rを使った相関分析の気を付けるべき一例

この間までは、相関係数は意外と扱いが難しいよーという話をしました。 相関係数の目安と解釈と注意点~舐めてかかると痛い目を見る話~ - バナナでもわかる話 最小二乗法による相関係数の導出~相関係数の意外な解釈法 - バナナでもわかる話 今回は、因果に関…

最小二乗法による相関係数の導出~相関係数の意外な解釈法

前回は、相関係数って意外と難しいんだよーって話をしました。 相関係数の目安と解釈と注意点~舐めてかかると痛い目を見る話~ - バナナでもわかる話この記事のコメント欄にて、id:unemployed-economics さんから反応を頂けまして、分析に関して質問を頂いた…

相関係数の目安と解釈と注意点~舐めてかかると痛い目を見る話~

株式分析、回帰分析等々様々な場面で話題になる相関係数なんなら最近は高校でも習います。 「あー、知ってる知ってる。1か-1に近いほど直線になるんでしょう。」 でもちょっと待ってほしいんです。相関係数って意外と奥が深くて難しい代物だったりするんです…

期待値の無いコーシー分布の平均を取ると何が起こるか

コーシー分布と言う分布があります。この分布ですが、裾が厚いため、広い範囲で値を取り、期待値の無い分布であると言われます。仕組み的には要はバラバラと外れ値のような値を取るため、期待値が収束しないわけなのですが、本当か?というのをシミュレーシ…

リッジ回帰(ridge)で解決できる多重共線性問題と注意すべき点

リッジ回帰の記事でも書こうと思って、キーワード検索で「リッジ回帰」と打ち込んでみたら、「リッジ回帰 多重共線性」という検索候補が出て来たのでちょっとかいてみることにしました。多重共線性記事について書いていたところだったので、丁度いいですね。…

『AIアルゴリズムマーケティング 自動化のための機械学習/経済モデル』が個人的にとても面白かった

最近買った 『AIアルゴリズムマーケティング 自動化のための機械学習/経済モデル、ベストプラクティス、アーキテクチャ 』 という本がメチャメチャ面白かったので、紹介します。 ちなみに下の本です。 この本の概要 最新のマーケティングサイエンスのトピッ…

多重共線性を回避するためのVIF基準の解釈について

前回、多重共線性の注意点を上げた後に、相関以外にも多変量での関係を見る必要があり、その方法の一つとしてVIF基準があるという話をしました。 www.bananarian.net 今回はそのVIF基準をどう解釈すべきかについて説明します。 ちなみに海外のサイトですが、…

多重共線性とは~回避の方法として相関を見るだけでは.....

線形回帰分析(単回帰,重回帰)を学ぶときによく注意すべき点として多重共線性問題というものがあります。 スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 多重共線性は教科書次第で結構色々説明が違っていて、 ※これは単に教科書が想…

基礎からイメージで学ぶ統計学~仮説検定の問題点編~

仮説検定の話に入ろうと思うのですが、 仮説検定については、僕の記事なんかよりも非常によくまとまっているサイトがあったので、とりあえず何も知らない方はこちらをご覧ください。 仮説検定とは?初心者にもわかりやすく解説! | 全人類がわかる統計学私の…