「仕事でデータ分析をすることになったけど、何から手をつけていいかわからない」
「データサイエンティストになりたいので、具体的な勉強方法が知りたい」
「人工知能や機械学習について、自分でプログラミングできるようになりたい」
この記事は、そんな方へ向けて書いています。
僕は以前外資系コンサルタントとしてデータアナリティクスのプロジェクトを経験し、現在は事業会社でデータアナリストとして働いています。
最近では良く聞くようになった、ビッグデータというやつを扱うお仕事ですね。
本記事ではそんな僕が、データアナリティクスをこれから勉強するための具体的な方法をお伝えします。
- ビッグデータ分析が注目を集める理由
- データアナリティクスに必要なプログラミング言語
- 具体的なデータ分析の勉強方法
ビッグデータ分析やアナリティクスが普及し始めた理由
勉強方法に入る前に、ビッグデータ分析やアナリティクスについて、一度整理しておきましょう。
ビッグデータとは、記憶メディアが安価になったことにより、これまで使い道がなく記録していなかたり削除していた非構造化データのことです。
アナリティクスとは、それらのデータをビジネスに役立つ形で整理し、視覚化することです。
わかりやすい例が、僕たちが普段使っているポイントカードの有効活用であったり、グーグルがGmailや検索エンジンなどでデータを集めた上で行う事業です。
たとえば、いろいろな店舗でポイントカードを作る時、年齢や住所など、様々な個人情報を登録することになると思います。
そして買い物をする度に、ポイントカードをバーコードで読み取ることによって、顧客の様々な情報を集めてビジネスに利用しているのです。
GmailもChromeも、一つのIDを利用してログインしていますよね?
グーグルはユーザーの様々な情報を集めて、ビッグデータとして解析し、ネットの広告を最適化して表示することで、収益を得ています。
最近になってこの分野が盛り上がっている理由が、ハードディスクを始めとした機器の値段が下がってきたり、スマホやネットなどのインフラが整ってきたことに起因します。
例えはハードディスクについては、ここ30年で価格が1/100万になりました。
そのため、「使うかわからないけれども、とりあえず何でもデータを貯めてしまおう!」
という指針になりつつあり、ビッグデータ分析を行いやすい材料が揃ってきたことになります。
同時に、携帯電話などの通信技術や後述するプログラミング・ライブラリの発展によって、それらのビックデータを活用する動きが、一層加速することになったのです。
データサイエンティストの需要は今後も一層加速する
今日でも、着々と僕たちの生活に浸透しつつある形で、データサイエンスがより具体的に活用されつつあります。
今後もこの流れはさらに加速して、ディープラーニングや自動運転の普及など、データサイエンスの需要は高まっていくことは確実です。
それに伴って、データサイエンティストの平均年収は米国だと1000万円を超えるとも言われており、非常に市場価値の高い職種になりつつあります。
ビッグデータ解析が進むことによって、これまで個人の経験や勘に頼っていたビジネスでさえも、データに基づいて客観的に行なうことができるようになりました。
優れたデータサイエンティストは、データを元に何が起きたかを可視化して、今後何が起きるか予測して、何をすべきか最適化して、経営陣への意思決定を促すことができます。
そのため、どの企業でもデータサイエンティストを喉から手が出るほど欲しがっている状態であり、人材の奪い合いになっています。
ビッグデータ分析やアナリティクスのための具体的な学習内容
では、ビッグデータ分析やアナリティクスをこれから学習する場合、何から手をつければ良いのでしょうか。
結論としては、実際に自分でプログラミングを通じて手を動かしつつ、様々な例題を解いてみることをおすすめします。
例えば、データ分析の現場で多く用いられているPythonと呼ばれるプログラミング言語では、基本的な配列処理や数値計算の他、データ分析や機械学習のライブラリが非常に充実しています。
現在多くのデータサイエンスの現場で用いられているのが、Pythonによるプログラミングとライブラリ活用です。
さらに人工知能やディープラーニングなど、今後のトレンドになる技術の核となっているのが、このPythonによるプログラミングになります。
Pythonはデータサイエンティストだけでなく、今後のWeb・IT業界においても、最も注目を集めている言語といっても良いでしょう。
データ分析に必要なプログラミング学習をする具体的な方法
ここからは、初心者の方が機械学習やデータ分析を学習をする方法を考えてみたいと思います。
先にもお伝えした通り、プログラミング学習については、やはり自分でコードを書いてみたり、アウトプットすることが、一番成果になります。
書籍を通じてデータ分析や機械学習の全体感を掴む
実際に手を動かすのが近道とはいえ、企業におけるデータ分析だったり、機械学習がどういったものかを理解するのは不可欠です。
そのため、以下の3冊の書籍などを通じて、これらの全体感をつかんでおくと良いでしょう。
一冊目は、データ分析界隈では著名な河本先生による書籍で、企業におけるデータ分析者へ求められるものなどを学ぶことができます。
二冊目は、具体的にデータ分析を使うとどのようなことが可能になるのかを説いた、因果推論に関する入門書です。
三冊目は、機械学習とそれに必要な初等数学、およびPythonのコードについて解説した入門書です。
どれも非常に読みやすいので、まずは手にとってみることをおすすめします。
世界最大級のオンライン学習サイトUdemy

書籍の次には、動画教材を通じて実際にパソコンで手を動かすのが良いでしょう。
特におすすめなのが、Udemyのようなオンライン学習教材サービスです。
Udemyとは、全世界で展開しているオンラインの動画教材サイトです。
動画を一度購入すれば無制限で視聴可能となり、自己学習を進めることができます。
プログラミングスクールとは異なり、動画によっては質問の可否は管理者によってまちまちです。
一方でコストが非常に安いので、データ分析にとりあえず触れてみたい方には、おすすめできる学習方法です。
僕が実際に学習した教材は、
【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門
もしくは、
AIの基礎を学ぶなら「みんなのAI講座」! 今なら¥2400
といったところです。
ほかにも沢山の動画教材がありますので、ぜひ一度サイトを覗いてみてください!
実際の企業におけるデータ分析の練習問題を解く
これ以降に独学で勉強しようと思えば、実際に例題を解いていくのが最も近道です。
具体的には、DeepAnalyticsのような実際の企業のデータを利用した練習問題に取り掛かりましょう。
DeepAnalyticsでは機械学習を使った予測モデルをアップロードすることで、精度の採点がなされます。
これを繰り返すことで、特徴量の作り方や予測精度の必要性など、業務に近い経験が学べるはずです。
本記事では、ビッグデータ解析やデータアナリティクスを学びたい方が、勉強すべき学習内容およびプログラミング言語と、具体的な方法についてご紹介しました。
ご自分にあった方法を選んで、どんどんデータ分析の学習を進めていきましょう!
合わせて読みたい>>>> 新卒の就活ではベーシックスキルが身につく企業を選ぶべき