AI・機械学習 AIpickuppytnonR言語 それでもノンプログラマーにPythonではなくR言語をすすめる理由 2018年4月30日 近年、データサイエンティストが用いる言語として、RよりもPythonの人気が出てきている。たとえばプログラミング言語ランキングで有名なTIOBE Index(2018年4月)によると、Pythonが4位、Rが12位だ。最近、あまりにも「Python優位」の風潮があるため、一石を投じる目的で本記事を執筆する。 なぜPyt...
AI・機械学習 AIpickupデータサイエンス人工知能 人工知能・機械学習は、そもそも何を学習しているのか? 2018年4月29日 人工知能(機械学習)のコードを走らせると、しばらくの間コンピュータは計算を続ける。この間、コンピュータは何を求めようとしているのだろうか? コンピュータは何を学習したのだろうか? 機械学習がブロックボックスになっていないか? ここで少し自分を振り返っていただきたい。あなたは、ただ手順通りにコードを走らせてはいないだろう...
AI・機械学習 AIpickup人工知能機械学習 人工知能・機械学習アルゴリズムの簡単な使い分け方【後編】 2018年4月25日 「Garbage In Garbage Out」(ゴミデータからはゴミのような結果しか得られない)という機械学習の重要な鉄則がある。多くの場合、たとえ大量のデータを保有していたとしても、データの前処理をせずに学習すると芳しい結果を得られないことがある。実は、どの機械学習アルゴリズムを選択するかよりも、データの質や特徴量...
AI・機械学習 AIpickup人工知能機械学習 人工知能・機械学習アルゴリズムの簡単な使い分け方【前編】 2018年4月25日 いきなり結論だ。機械学習初心者にはランダムフォレストを推奨する。この記事では、なぜランダムフォレストなのかを、数式を使わず直感的に解説する。 ランダムフォレストとは何か? ランダムフォレストとは、決定木(データ構造を木のように表現したアルゴリズム)のパワーアップ版だ。厳密にいうと、決定木を弱学習器とするアンサンブル学習...
AI・機械学習 AIpickup人工知能機械学習 AIは未来のEXCEL―あなたが人工知能を習得するべき理由― 2018年4月24日 2013年に、統計学ブームというものがあった。「統計学が最強の学問である」(西内啓、ダイヤモンド社)がベストセラーとなったように、書店に赴くと統計学に関する書籍がそこかしこに並んでいた。テレビでも統計学に関する特集が組まれるほどだった。現在ではそのブームも落ち着きを見せたように思う。しかしだ。この統計学ブームは、弱火で...
AI・機械学習 pickupR言語クロス集計データサイエンス R言語でクロス集計ができるパッケージ―エクセルとの比較― 2018年4月9日 今回は、エクセルと比較をして、R言語でクロス集計を行う方法をご紹介します。 クロス集計を使う目的 クロス集計は、データの傾向を様々な角度から把握するために行います。具体的には、縦軸と横軸を決めます。 ※直感的に把握をしたいなら図を描くのも有効です。 使用するデータ R言語に最初から登載されているiris(あやめ)データ...
AI・機械学習 pickuppytnonデータサイエンス機械学習 Python言語オンラインークラウド上で実行可能ー 2018年4月5日 Python言語をオンライン上(クラウド上)で実行可能。もちろんインストール不要。...