いいもんつくったー

今週の平積みさん#コンピュータ編@BookFirst

今週の平積み4冊を紹介します。

東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~

本書には、データサイエンティストになるための基礎をつめこんでいます。データサイエンティストは、Pythonや確率・統計、機械学習など、幅広くさまざまな分野の知識を必要とします。

すべての分野を1冊で学ぶことは無理ですので、各分野で深入りはせず基礎的な事項を取り扱っています。データサイエンティストになるための地図と羅針盤のような位置づけとなることをイメージしています。

この本は主にPython 3を使って、基本的なプログラムの書き方、データの取得、読み込み、そのデータ操作からはじまり、さまざまなPythonのライブラリの使い方、確率統計の手法、機械学習(教師あり学習教師なし学習とチューニング)の使い方についても学びます。取り扱っているデータは、マーケティングに関するデータやログデータ、金融時系列データなどさまざまで、モデリングの前にそれらを加工する手法も紹介しています。データサイエンティストになるには、どれも必要なスキルです。

本書には、さらに以下の3つの特徴があります。
・実際のデータを使って手を動かしながら、データサイエンスのスキルを身に付けることができる
・データ分析の現場で使える実践的な内容(データ前処理など)が含まれている
・練習問題や総合問題演習など実際に頭を使って考える内容がたくさんある

この本に書いてあることを実践し、読み終えた後には、実際の現場でデータ分析ができるようになるはずです。


独学プログラマー Python言語の基本から仕事のやり方まで

本書は「Pythonだけ」を学ぶ本ではありません。Pythonを使ってプログラミングを紹介していますが、伝えたい内容はPythonに限らない「プログラミング全般」の知識です。

プログラマになるためのスキルを独学できる本です。Pythonプログラミングの基本を学べるだけでなく、プログラマとして必要なスキル(シェル、正規表現、パッケージ管理、バージョン管理、データ構造、アルゴリズム、仕事の始め方・やり方)もひと通り学べるのが特徴です。
「プログラミングを始めたい」「できればその道でプロを目指してみたい」――そんな読者にオススメです。

本書の著者、コーリー・アルソフ(Cory Althoff)は、「独学プログラマー」です。本書は、彼が独学で、ゼロからプログラミングを学んだ体験に基づいて書かれました。
プログラミングを独学で身に付けるために、著者がPythonを通して学んだエッセンスが書かれています。彼の独学プログラマーとしての学び方は、Amazon.comでの本書の評価を見るとわかるように、多くの人に支持されています。
――訳者あとがきより


前処理大全[データ分析のためのSQL/R/Python実践テクニック]

Law of Awesome Data Scientist

データサイエンスの現場において、その業務は「前処理」と呼ばれるデータの整形に
90%以上の時間を費やすと言われています。
「前処理」を効率よくこなすことで、予測モデルの構築やデータモデリングといった
本来のデータサイエンス業務に時間を割くことができるわけです。

本書はデータサイエンスに取り組む上で欠かせない
「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。
ほとんどの問題についてR、PythonSQLを用いた実装方法を紹介しますので、
複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。


未来IT図解 これからのデータサイエンスビジネス

気鋭のデータサイエンティスト・タッグが、すべてのビジネスパーソンに贈る渾身の一冊。
これからの時代を生き抜く未来の羅針盤

この本を手に取られた方の中には、「今さらデータサイエンスの本ですか」?と思われた方もおられるかもしれません。でも「今だからこそデータサイエンスの本です」と私は主張します。

この本の最大の特徴は、データサイエンスビジネスを通じて経験した、失敗の痛みと苦しみも成功の喜びも熟知している著者たちがキレイゴトをいっさい排除して、誰にも忖度せず、ド直球で「だからデータサイエンスビジネスは失敗する!」「だからこうしたほうが良い!」と直言している点です。おそらく2011年からつい最近まで書籍では読めなかった、本当のデータサイエンスビジネス、今だからこそわかるデータサイエンスビジネスの話が満載です。もちろん、基礎的な部分もしっかり押さえています!

簡単に著者紹介をしておきましょう。謎の覆面男がマスクド・アナライズさんです。自らをイキリ(調子に乗っている)データサイエンティストと評していますが、メディアでAIに関する連載を持つだけでなく、全国各地で講演を行い、Twitterのフォロワー数は1万人を超えるインフルエンサーです。ちなみにマスクの中の顔は僕ですら知りません。

もう一人が私、松本健太郎です。データサイエンティストを名乗りますが、報告会でガラスの心が割れた回数は数知れず。涙の数だけ強くなれたのか、今では失敗の経験を踏まえて、「少なくともこうすれば失敗は防げるはず」という防御の構えだけは固まりました。

この本では、データサイエンスビジネスの今まで(PART1)と、これから(PART3)をマスクド・アナライズさんが、具体的なデータサイエンスビジネスの進め方(PART2)を松本が担当しています。何がダメでうまく進まなくて、本来どうするべきで、だから今後はこうなっていくだろう…そのような過去、現在、未来がわかるような構成になっています。