バナナでもわかる話

計量経済学・統計学が専門の大学院生です。統計学・経済学・投資理論・マーケティング等々に関する勉強・解説ブログ。ときどき趣味も。極力数式は使わずイメージで説明出来るよう心掛けていますが、時々暴走します。

機械学習

機械学習のバイアスバリアンス分解を古典的な統計学から丁寧に解説する

今日は、バイアスバリアンス分解の話をしようと思います。 目次 はじめに 古典的な統計学におけるMSEの分解 パラメータの推定 MSEの分解 機械学習におけるバイアスバリアンス分解 予測と分類 オーバーフィット バイアスバリアンス分解 まとめ double descent…

単純パーセプトロンとマージンに関するまとめ

今日は単純パーセプトロンの話をします。 実際の現場で役に立っているのは多層パーセプトロンや、SVMですが、その基礎となるパーセプトロンについて理解しておくことは重要ですので、とりあえず一通りまとめていきます。 目次 単純パーセプトロンとは何か 数…

統計検定1級対策解説~情報量基準編~

今回はAICです。 AIC周りの話は、カルバックライブラー情報量とAICにどういう結びつきがあるのか概要を知っておくことが重要になってきます。 AICとは 何の役に立つんだって話 オーバーフィットとは AICの式の意味 AICを使ってみる 余談(機械学習でよく使わ…

企業でのデータ解析は、「動くコードが書ける」だけではダメみたい

こんにちは! 最近ブログの更新が滞ってしまっていて申し訳ないです。前にもお伝えしていた通り、某社で1か月ほどデータサイエンティストとしてインターンをさせていただいています。今回は、そこで勤めてみて、初めて知ったことを雑記していこうと思います…

Rのplotを使ってNealの漏斗を可視化してみる

今日は、「StanとRでベイズ統計モデリング」という本の10章にあるNealの漏斗問題の可視化を簡単なコードだけで行ってみたいと思います。ちなみにStanとRでベイズ統計モデリングとは、こちらの本です。 こちらの本、全てのコードがしっかりサポートページに掲…

次元削減とは

今日は統計学や機械学習、その他画像認識等の場面で登場する「次元削減」の話について書こうと思います。 まず、次元削減とは、次元データを次元にうつすことで、次元を下げることを指します。簡単に例を出すと、 例えば国語・数学・理科・社会の4科目(1科目…

C++を使ってディープラーニングの基本を試す

最近、Rだけで統計解析したりすることに限界を感じているので、そうだ!C++を勉強しようと思い立ちました。そこでとりあえず下の本を参考に、ディープラーニングの実装しながらC++を勉強しようなんていう次第です。 コードをそのまま写経するのも勉強にはな…

画像認識始めました~Rでスクラッチでエッジ検出をやってみた~

ここ最近画像認識を勉強中です。 とりあえず読んだ傍からスクラッチで書いていっています! 参考本はこれ。 そして過去記事一覧はこちら 画像認識 カテゴリーの記事一覧 - バナナでもわかる話 前回はバイラテラルフィルタをやってみました。 今回はバイラテ…

画像認識始めました~バイラテラルフィルタをRで実装してみた

最近画像認識について勉強中です。とりあえず、数式で理解した後スクラッチで書いてみるのが一番早いかなと思ったので、読んだ傍からRで書いています。 画像認識始めました~手始めにRでスクラッチでフィルタリングしてみた~ - バナナでもわかる話 画像認識始…

画像認識始めました~ガウシアンフィルタをRで実装してみた

最近画像認識について勉強中です。 画像認識始めました~手始めにRでスクラッチでフィルタリングしてみた~ - バナナでもわかる話 とりあえず、数式で理解した後スクラッチで書いてみるのが一番早いかなと思ったので、読んだ傍からRで書いています。 参考本は…

画像認識始めました~手始めにRでスクラッチでフィルタリングしてみた~

なんか、最近自動運転だなんだと画像認識が流行りらしくて、私画像認識についてはあまり詳しくないので入門の為に買ってみました。 で、まだ全部は読んではいないのですが、とりあえず読んだ傍からスクラッチでコードを書いてみようかと思ってるわけです。ス…

人間の選択をモデル化するプロビット・ロジットモデルの違いと経済学的解釈法

今日は人間の選択をモデル化する方法について書いてみようと思います。 一応事前にプロビット・ロジットについてネット記事が無いか漁ってみたのですが、・機械学習の文脈で説明されていることが多い ・プロビット・ロジットの選択基準が説明変数の観点から…

リッジ回帰(ridge)で解決できる多重共線性問題と注意すべき点

リッジ回帰の記事でも書こうと思って、キーワード検索で「リッジ回帰」と打ち込んでみたら、「リッジ回帰 多重共線性」という検索候補が出て来たのでちょっとかいてみることにしました。多重共線性記事について書いていたところだったので、丁度いいですね。…

『AIアルゴリズムマーケティング 自動化のための機械学習/経済モデル』が個人的にとても面白かった

最近買った 『AIアルゴリズムマーケティング 自動化のための機械学習/経済モデル、ベストプラクティス、アーキテクチャ 』 という本がメチャメチャ面白かったので、紹介します。 ちなみに下の本です。 この本の概要 最新のマーケティングサイエンスのトピッ…

機械学習を使ったデータリサーチコンサルって難しそうだなって思った

今日は色々用事があるので、軽めに思ったことを記事にしておきます。 統計・機械学習って結構便利で万能みたいな印象が多分まだまだ世の中にあって、人工知能ブーム減退期ではあるものの、未だ機械学習に対する万能感は世に根強いのかなと思っています。 で…

【AIに対する誤解】人工知能に代替される職業とされない職業

最近話題ですね。人工知能。人工知能って、その時代その時代で、意味合いが変わっていくみたいで、 一昔前はグーグル検索のことを「人工知能」なんて呼んでいた時代もありました。今の人工知能(AI)ブームも、そんな感じで、ブームが過ぎれば「あれが、人工知…

【初心者向け】SVMのパラメタチューニング

前回ソフトマージンサポートベクターマシンの話をして、ラディアルカーネルにはパラメータが2つあるというところまでやりました。 bananarian.hatenablog.com 前回はパラメータをいじって、極端な値の場合は、マズそうだといったことを確認して終わったわけ…

【初心者向け】ソフトマージンSVMの実装

前回まででSVMの導入と計算方法は終わりました。SVMの導入 bananarian.hatenablog.com 最適化問題を解く話 bananarian.hatenablog.com しかし、前回までは頑なに データをきれいに線形に分類できる、線形分離可能という仮定を置いていました。 これをハード…

【初心者向け】KKT条件を使ってSVMの計画問題を解く

前回はSVMについての導入を行いました。 bananarian.hatenablog.com しかし、前回の記事では肝心の最適化問題を解く部分は長くなるのでカットしていました。そういうわけで今回はSVMに関係する部分だけピックアップして説明していきます。 KKT条件についても…

【初心者向け】2値分類SVM(サポートベクターマシン)の考え方と最適化問題

今日はSVM(サポートベクターマシン)について整理します。 サポートベクターマシンとは SVMは理系の方なら耳にすることも多いかもしれません。機械学習的な手法は文系にとってはあまり需要が無いので、文系の人は馴染みがないかもしれません。一つ説明する前…

統計学と機械学習の違いとは?

最近、機械学習やら人工知能やらAIやらその手の言葉をよく聞きます。ほうほうと思って勉強してみると、「あれ、機械学習と統計学って一緒じゃね?」と思ってみたりもしちゃうわけです。そんでもって何となく、「AIも機械学習も同じもの?なの?」とか考えて…