お気持ち練習帳

気持ちの整理や数学等の書きたいことを書きます

【読書記録】仕事ではじめる機械学習

読書記録をはじめたい

nareo7.hatenablog.com

今年の抱負で本を読んでお勉強しましょうね~という目標を立てました。そのときに、どうやって知識を定着させようかの問題がありましたが、一旦読書記録をつけることで

  • 読んだ本には何が書いてあったのか
  • 良い点/疑問点などを整理
  • 読んだあとに何をするのが良さそうか

などをまとめられると良さそうだと思いました。ただ、読んだ本全てにきちんとやろうとすると、勉強のモチベ自体が低下するおそれがあるので、程々にやっていこうと思います。また、ブログに全部を載せるかは微妙なので、それも考えつつ記録をつけていこうと思います。

「仕事ではじめる機械学習」とはどんな本だった?

今回読んだのは下記の本です。

amzn.asia

この本は、機械学習を実際の仕事でどう使っていけばいいかという部分に焦点を当てた本となっています。内容としては、機械学習のプロジェクトを進めるのに必要な知識を各論的に1~8章で説明したあと、9~12章でより実践的な話題を扱っています。各章をキーワード的に紹介すると、

  • 1章:機械学習プロジェクトの流れ
  • 2章:機械学習アルゴリズム紹介
  • 3章:モデルの評価方法
  • 4章:機械学習をシステムに組み込むときに気をつけること
  • 5章:学習データの集め方
  • 6章:MLOps
  • 7章:効果検証、A/Bテスト
  • 8章:モデルの解釈
  • 9章:EDAでのレポーティング
  • 10章:Uplift Modeling
  • 11章:バンディットアルゴリズム
  • 12章:オンライン広告での機械学習の使われ方

という内容になっています。約300ページで広範囲のことを扱っているため、各章の内容としては基本的な内容・まず最初に話すべき内容をまとめてあった印象です。ただ、基本的な内容だけでは満足できない読者向けに、詳細となる参考文献や、〇〇という観点はこの参考文献で紹介されてますなど、次に何を読めば良いのかの誘導がされており、読者への配慮がものすごくあって、読んでいて「助かります!!!」って気持ちになっていました。

感想/疑問点 等

感想等を文章で書こうと思ったけど、細切れの感想が多いので箇条書きで雑多に書いてしまおうと思います。最初の読書記録なのでまあいいでしょうという感じで。

  • 1章:解きたい課題をサーベイしようという点で、具体的にどこの学会論文が参考になるか書いてあるのが助かりました。。。まじでそこら辺の情報全然知らなかったので。。。
  • 2章:ロジスティック回帰はパーセプトロンで書けるというのは、言われると確かにそうだな~と勉強になりました。
  • 5章:教師データの作り方については多少知っている程度だったので、4つの方法をどの観点で考えるべきか整理してて、非常に勉強になりました
  • 6章:前処理を基盤に乗せるとき自動テストは地道に積み重ねるしかないとあったが、まずデータ加工のテストをどう書けば良いのかがそもそもわかってないので、知りたいと思っています。ググり方が悪いのか、いい情報を見つけられていないので。。。
  • 6章:MLOps周りの話はかなり勉強不足だということを実感したので、何かで勉強しておきたいです。
  • 7章:A/Bテストはオフライン検証→オンライン検証の方式がよくあるというのは初めてしれて良かったです
  • 7章:A/Bテストで最小の効果量を踏まえて仮説検定するには、対立仮説を「(Aの効果) > (Bの効果) + (最小の効果量)」とおけば良いというのは、その発想があったかという感じです
  • 7章:A/Aテストが何かをしれてよかったです。ただ、A/Aテスト→A/Bテストをすると多重検定になりそうだし、有意水準補正するのかなと漠然と思いました
  • 7章:A/Bテストの母集団ハックの具体的な事例を知れたのは良かったです。知らないと、普通に引っかかってしまいそうと思いました。
  • 8章:多重共線性で係数が大きくなる理由も知れてよかった。数理的になんでそうなるかは知りたいですが。
  • 8章:回帰係数のp値を求めているところでは、20個以上のp値を一気に出しているので、かなり気をつけて解釈しないといけなそうだなと思いました。
  • 9章:EDAの一連の流れの例を見ることができたのは良かったです。どういう思考でやっているかを知れる機会はあんまりないので...
  • 10章:Uplift Modelingは初めて知りましたが、理解するのに時間がかかった。けど概要をつかめるとA/Bテストの拡張として自然なものだと思えるようになりました。

全体としての感想は、取りこぼしていた概要をきちんと勉強できたので非常に良かったです。また、本自体もさらっと読めるようになっていたので、1,2週間程度で最初から最後まで読むことができたので、本の内容を忘れずに最後まで一気に駆け抜けられた点も非常に助かりました。