バナナでもわかる話

開設当初は計量経済学・統計学が専門の大学院生でした。今はデータを扱うお仕事をしています。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

統計

機械学習を使ったデータリサーチコンサルって難しそうだなって思った

今日は色々用事があるので、軽めに思ったことを記事にしておきます。 統計・機械学習って結構便利で万能みたいな印象が多分まだまだ世の中にあって、人工知能ブーム減退期ではあるものの、未だ機械学習に対する万能感は世に根強いのかなと思っています。 で…

基礎からイメージで学ぶ統計学~最尤推定量編~

前回、一致推定量がどういうものかについて確認しました。 基礎からイメージで学ぶ統計学~一致推定量編~ - バナナでもわかる話 ここで一致推定量の一例として最尤推定量について解説します。 最尤推定量についても色々と面白い性質があるわけですが、初心者…

負の二項分布とRのrnbinom関数は何を表すのか

負の二項分布という分布があります。この負の二項分布ですが、解説書によって定義が違っているため、 事前に確認しないと何を指しているのかよくわからなくなる分布です。Rには、負の二項分布からの乱数を出力する関数としてrnbinom関数があるのですが、それ…

基礎からイメージで学ぶ統計学~一致推定量編~

前回は大数法則について確認しました。大数法則に従って、サンプルサイズを大きくしていった時に真の値に収束するような推定量を一致推定量と呼びます。 期待値の一致推定量 不偏推定量の話でやったは、前回の大数法則の記事で確認した通り一致推定量です。 …

基礎からイメージで学ぶ統計学~大数法則編~

大数法則は有名ですね。 要は標本サイズをどんどん大きくしていくと、 標本平均が真の期待値に(確率的な意味で)収束するという定理です。 今回の記事は、大数法則を直感的に理解するということで、シミュレーションでの確認を行いましょう。 シミュレーショ…

ゼロ過剰ポアソン分布の尤度関数

今回は統計学中級者向けの記事です。 前に解説したゼロ過剰ポアソン分布ですが、その尤度を示します。 前記事はこちら bananarian.hatenablog.com まあゼロ過剰ポアソン分布の尤度の書き方は色々あるのですが、検定問題の話もしたいので、それに沿った書き方…

中学で習う需要供給曲線に対する誤解が世の中に浸透しすぎて辛い

この記事を書こうと思ったのは、下の記事を読んだからです。中学校で習った「右下がりの需要曲線」は現実には存在しない――価格と需要量の真実 | 日刊SPA! この記事の言い分はざっくり言うと次の通りです。①中学校で習う需要曲線(直線)は、机上の空論である。…

ゼロ過剰ポアソン分布とは何か

統計学をやるとよくポアソン分布という分布を見かけます。詳細はこちら 基礎からイメージで学ぶ統計学~ポワソン分布編~ - バナナでもわかる話ただ、現実世界のデータ(特に経済データ)だと、ポアソン分布っぽいんだけど、ゼロが出る割合だけ異様に多くない?…

独立成分分析のマーケティングへの利用~fastICAを利用した顧客層の推定方法~

今回は独立成分分析という分析方法の、マーケティングへの利用についてお話します。 独立成分分析とは 主に音声やノイズをうまく分解する統計的な手法です。 色々な人の声や物音などが入り混じったノイズを、うまく分けます。 イメージは聖徳太子ですかね!?…

基礎からイメージで学ぶ統計学~最小二乗推定量編~

前回までで、不偏推定量とその評価軸として平均二乗誤差について学びました。 基礎からイメージで学ぶ統計学~不偏推定量編~ - バナナでもわかる話 今回は不偏推定量の一例として、最小二乗推定量について説明します。 線形回帰分析 今回は線形回帰分析の説明…

Rのapplyとforの計算時間比較~forだって遅いわけじゃない~

Rユーザーの間でよく言われる話として「forを使うのは初心者。こなれたRユーザーはapplyを活用する」なんて話があります。理由は「forを使うと計算が遅くなるから」「applyの方がコードが見やすいから」 ということで、基本的にはその通りなんですけど ここ…

(株)ALBERT【3906】の株価上昇が止まらない件

ALBERTっていうAI・データサイエンス系の企業があるんですが、この企業の株価の爆上がりがいつまで経っても終わらないともっぱらの話題なのでそろそろ記事にしておきます。 (株)ALBERT【3906】とは 公式サイトはここです。 www.albert2005.co.jp AI人材の育…

Rを用いたブランドスイッチ(遷移)に関する統計分析

そういえば、マーケティング関連の分析手法を記事にしたことがなかったので、少しずつ記事にしていこうと思います。今回はブランドスイッチングに関する分析です。・ブランドスイッチについての説明 ・ブランドスイッチの可視化(他サイトさんに丸投げ) ・強…

基礎からイメージで学ぶ統計学~不偏推定量編~

これまで何回かの記事で、正規分布、二項分布、ベルヌーイ分布、ポワソン分布など様々な分布を紹介しました。 bananarian.hatenablog.com 今回から推定量に関する話をします。 まず、統計学ですが、これは大まかに「推定」と「検定」に分けることができるん…

基礎からイメージで学ぶ統計学~ポワソン分布編~

前回、二項分布の話をして、一瞬出てきましたねポワソン分布。 bananarian.hatenablog.com 今回はポワソン分布の話をします。ポワソン分布の例としてよくあがるのは、こんな感じのヒストグラムです。 なんかほとんどゼロをとってますね。よくポワソン分布の…

学生向け無料Tableau(タブロー)のインストールと紹介&書籍紹介

なんか便利らしいのでTableauを自分のパソコンに入れてみました。 まだ、扱い方がよくわかっていないので、どんな感じかということと、学生プログラムのインストール方法を紹介しておきます。この手のやつって、学生の間に入れとけばお得だから、とりあえず…

Stan入門

前回はRstanの導入と実例に関する記事を書きました。 bananarian.hatenablog.com しかし、まあ実例なのでコードはなんとなくで見てくださいとは言ったものの、よくわからんなあといった感じで記事を眺めていた人も多かったのではないでしょうか。 今回はStan…

基礎からイメージで学ぶ統計学~二項分布編~

前回は正規分布について話しました。 bananarian.hatenablog.com 今回は二項分布です。 具体例 歪みのないコインをN回投げたとします。歪みがないので、コインを1回投げて「表」が出る確率も「裏」が出る確率も同じであるとします。今回はN回投げています。…

stanの導入方法とベイズ分析の例

前回まででベイズがどういうものかっていう話をしました。 bananarian.hatenablog.com ベイズを簡単に試すにはStanというソフトを使うのが手っ取り早いです。 Stan モデリング言語: ユーザーガイド・リファレンスマニュアル そこで、本記事ではStanをR上で利…

基礎からイメージで学ぶ統計学~正規分布編~

前回の記事で、確率変数の背後には確率密度関数があるという話をしました。 bananarian.hatenablog.com これから何回かの記事では、その背後にある確率密度関数にはどのようなものがあるのかという話をしたいと思います。 正規分布の形 正規分布は例えば次の…

ベイズ統計学入門の入門

少し前の記事でベイズ統計学っていうのはどういうものなのかという説明をしました。 bananarian.hatenablog.com でも、そういえばこのブログではベイズ統計学の解説記事を書いたことがないなあと思ったので、ちょっと続き物で書いていきます。一応、用語の説…

【AIに対する誤解】人工知能に代替される職業とされない職業

最近話題ですね。人工知能。人工知能って、その時代その時代で、意味合いが変わっていくみたいで、 一昔前はグーグル検索のことを「人工知能」なんて呼んでいた時代もありました。今の人工知能(AI)ブームも、そんな感じで、ブームが過ぎれば「あれが、人工知…

【初心者向け】2017年統計検定1級数理問5の解説

前回問4までやりました。 bananarian.hatenablog.com 今回で2017年の統計数理は最後ですね。 2017年 統計検定1級 統計数理 問5 対策用解説 を始めていきます。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 問5の概要 標準正規分布…

基礎からイメージで学ぶ統計学~確率変数編~

ブログ記事何を書こうと思っていた際に、読者の方から「もう少し統計学の基本的な話もやってほしい!」というお話を受けました! 確かに、統計学って特に、勉強のとっかかりが一番難しい印象があって、「確率変数???」「確率密度関数??」なんだなんだ?…

因子分析を勉強したい人のための目的別書籍紹介

前回までで因子分析がどういう場面で使われるのか、どういうイメージを持てばいいのかといったことを解説しました。 過去記事はこちら。因子分析のイメージ 【初心者向け】スピアマンの2因子説って何? - バナナでもわかる話 【初心者向け】因子分析とは何か…

統計学は最初から占い師や予知能力者を排除して物を考えている

統計学を勉強すると、やはり最初に教わるのは 不偏推定量 ではないでしょうか。 ※推定量等に関する解説記事はこちら bananarian.hatenablog.com 不偏推定量、まあ最近ではあまり重要な概念では無くなってきているんですが、個人的にこの概念は面白い意味合い…

【初心者向け】2017年統計検定1級数理問4の解説

前回までで問3までやりましたね。bananarian.hatenablog.com で、同じ要領で問4やっていきます。そういうわけで今回も2017年 統計検定1級 統計数理 問4 対策用解説 を始めていきます。スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); …

【初心者向け】2017年統計検定1級数理問3の解説

前回は問2を解説しました。 bananarian.hatenablog.com前回の記事の感想としては、問2は[1]と[3]さえ乗り切れば大したことない問題かなーとは思いましたが、完答はかなり勉強してる人じゃないとしんどそうですね。2017年 統計検定1級 統計数理 問3 対策用解…

【初心者向け】2017年統計検定1級数理問2の解説

前回は問1の解説を行いましたが、次は問2をやっていきます。 bananarian.hatenablog.comスポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({}); 2017年 統計検定1級 統計数理 問2 対策用解説 を始めていきます。 問2の概要 まず、問2のセット…

【初心者向け】因子分析をマーケティングに活用する

前回、前々回は因子分析について、分析方法について学びました。 bananarian.hatenablog.com bananarian.hatenablog.com 今回は実際のマーケットデータに応用してみます。ただし、実際のデータは使えないので架空のデータを作って利用します。 架空のデータ …