アメリカのデータサイエンティストが書いた本『数式なしでデータサイエンス』を読んでみました。データサイエンスの手順、アルゴリズムなど、初心者でもわかるように基本から解説している本です。シンプルに書かれた本なのでさらっと読めます。しかし「本当に理解したのか?」とたずねられると、初心者は「あれれ?」となってしまうのではないでしょうか?
理解できなくてOK
この本はデータサイエンスの概論についてシンプルな文章で書かれています。また160ページと読みやすいサイズにまとめられているので、初心者向きの良い本だと思います。
数式なしでわかるデータサイエンス
著者:アナリン ウン
著者:アケネス スー
出版社:オーム社
しかし注意が必要かもしれません。初心者がこの本を読んで完全に理解できるとは思えません。むしろわからないことの方が多いかもしれません。でも安心してください!ちゃんと効果はあるんです。
冷静に考えてみましょう
これから学習するデータサイエンスってかなり難しいジャンルです。プログラミング、アルゴリズム、データ分析など膨大な知識と経験が必要なのに、このペラペラの本一冊でマスターできるわけではないですよね。だから理解できなくても大丈夫なんです。
何のために読むの?
今後データサイエンスを学習していく範囲を確認する・・・それくらい軽い気持ちで読んでみることをおすすめします。
一番初めに何を学習するのかちゃんと把握しておくことは大切です。独学でどこからどこまで学習するのか?また自分の学習したいところはどこなのか?ハッキリしてくると学習計画を立てることができます。
ひょっとすると「あれ?自分のやりたいことはデータサイエンスではない!!!」ってこともあるかもしれません。
専門用語を覚える?
この本にはたくさんの専門用語がでてきますが、無理して覚える必要はありません。
今後データサイエンスを学習していくうちに何度でも専門用語がでてきます。わからなかった時にバラバラとこの本をめくってみればOKです。
学習をすすめるうちに専門用語の解説が腑に落ちる時が来ると思います。そうなってしまえば無理に暗記しなくても自然と専門用語を覚えていると思います。焦らずにじっくりと学習すればOKです。
概論から次の学習へ
学習の範囲を理解できたところで、次は実際にデータサイエンスのプログラミングをしてみましょう。
わたしのおすすめは森巧尚さんの『Python3年生 機械学習のしくみ』です。この本では難しい理論よりもプログラミングを書きながらデータサイエンスを理解できます。
それでは『Python3年生 機械学習のしくみ』の目次を見てみましょう。
- 回帰
- サポートベクターマシン
- 決定木
- ランダムフォレスト
- k-近傍法
- クラスタリング
Python3年生 機械学習のしくみ 体験してわかる! 会話でまなべる!
著者:森巧尚
出版社:翔泳社
気が付きましたか?
「あれれれ?」目次を見て気が付きましたか?「数式なしでデータサイエンス」と同じような内容になっていますよね。
そうなんです!この『Python3年生 機械学習のしくみ』と組み合わせて読めば、内容が補完しあっているので学習効果があると思います。
組み合わせで学習
「理論」と「実践」この組み合わせで学習することで、やっと『数式なしでデータサイエンス』を読んでおいてよかったー!と実感することができたと思います。
もちろん、ここからが学習のスタート地点なので完全に理解できるわけではありません。でもどうですか?「次はどのアルゴリズムを中心に学習をすすめよう」とか「統計学をもう少し学習してみよう」など次のステップへ進めると思います。
森巧尚さんのPythonシリーズ
はじめてPythonを学習する人は「Python3年生 機械学習のしくみ」の前に下記のシリーズをチャレンジしてみてください。
このPythonシリーズでは、ちゃんとコードを入力できればプログラムが動きます。はじめてプログラミングを触った人は感動すると思いますよ!
*余裕のある方はスクレイピングの学習もしてみるといいでしょう。
参考資料
数式なしでわかるデータサイエンス
著者:アナリン ウン
著者:アケネス スー
出版社:オーム社
Python3年生 機械学習のしくみ 体験してわかる! 会話でまなべる!
著者:森巧尚
出版社:翔泳社