データサイエンスやAIの学習はハードルが高いと思われがちです。実際、ある程度ハードルは高いのですが・・・(笑)。ここでは、ビジネスパーソンがデータサイエンスやAIを自分の仕事・業務に活用するレベルを想定します。したがって、データサイエンスの専門家になるレベルは想定していません。
ビジネスパーソンのための最短コース
Pythonによる機械学習プログラミングをぜひ学びましょう。機械学習は現在のAIやデータ分析の中核となる技術であり、AIやデータサイエンスを学ぶことは機械学習を学ぶことに近いです。記事の後半でプロを目指す人用の学習コースを示すのですが、そのとおりに学ぶと最初の数学で挫折する人が多くなることが容易に想像できます。まず、機械学習の楽しさを味わうのがよい考えます。そのための本としては、筆者が持っている本のなかで選ぶなら、
「Pythonによるあたらしいデータ分析の教科書(翔泳社、寺田学)」
のバランスが取れているかもしれません。読破の難易度は他の書籍よりも低く、それでいてある程度機械学習のイメージをつかめる書籍です。良くも悪くもわかった気になれます。決定木やランダムフォレストなどの機械学習アルゴリズムは、理論を深く知らない一般の人でも仕組みをイメージしやすく、実務への活用シーンも多いです。また、今は昔と違い、Udemyという動画教材も登場しています。キャンペーン時に購入すれば、非常に安価で(1500円前後)プログラミングやデータサイエンスを学べます。本が苦手な人はぜひUdemyを試してみるとよいでしょう。
ビジネスパーソンがさらに学習を進めていく順序は以下のようになります。
Python機械学習プログラミング→機械学習の理論→確率論と統計学
まずはプログラミングの楽しさを知り、さらに興味があれば理論面を徐々に学んでいってください。
ちなみに機械学習の理論としては、資格取得も狙えて幅広く理論を学べる以下がよいと思われます。
「深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト(翔泳社)」
統計学の入門としては、ベストセラーにもなった以下が読み物としても面白いです。実践編が特におすすめです。
専門家レベルの本来の学習コース
専門家を目指す人は、さきほどの学習手順と真逆になります。
確率論と統計学→機械学習の理論→Pythonによる機械学習プログラミング
データサイエンスを深く理解し活用するためには数学の知識および機械学習の理論面をしっかりとおさえておくことが重要です。プロほど表面的なプログラミングのコードではなく、その背景となる数学と機械学習の理論をしっかりとおさえています。だからこそ深く、本質をとらえた重厚なコードを書くことができるのです。ただ、数学的素養のない一般的なビジネスパーソンにこのステップを要求するのは酷でしょうし、また現実的ではありません。
楽しくデータサイエンスを学ぼう!
個人的な意見ですが、決定木やランダムフォレストなどを少し実務で活用するレベルであれば数学をガチガチに勉強しなくても…と考えています。少しでもデータサイエンスに興味がある人は、ぜひPythonプログラミングの楽しさからデータサイエンスに入っていきましょう。しかもPythonを使えばPC作業を自動化することも簡単です。