データを読む技術
「データ分析読解の技術」菅原琢著
今春、都内の各大学で「データサイエンス系」の学部が続々とスタートする。中高年もデータを読む技術が求められている。
◇ ◇ ◇
東大と慶大でデータ分析の授業を担当する著者。本書はその現場から生まれたというが、教科書でも学術書でもない。著者の狙いは、自分ではデータ分析などしない人が世間にあふれる「データ分析に騙されないため」に基本的な読み方を教えることにある。本書はネットを含むちまたにあふれる多数のデータ分析を具体例にする。
たとえば、人口10万人当たりの美容院の数が一番多い秋田県は「見えっ張り」とする記事から、選挙で次点で落選した自民党の候補者は次の選挙では当選しやすいという政治記事まで、もっともらしい解説の落とし穴をていねいに解説してくれる。2つの数字の間になんらかの関係があるという「相関関係」と、原因と結果で両者が間違いなく結びつく「因果関係」の違いといった初歩の初歩からの解説も初心者にはありがたい。また、ツイッターのリツイートされた数の大きな候補者が当選しやすいとする新聞社と大学の共同調査記事の解説など、著者が政治学の専門家だけに読み物としてもスリリングだ。
本書を地道に読みこなすことで、データ分析を発注したコンサルタントの報告のよしあしなどを見抜くこともできるかもしれない。
(中央公論新社 1078円)
「データ思考入門」荻原和樹著
データは現実のすがたを表す指標。しかし、その存在はシロウトには見えない。
そこで登場するのが「データ可視化」。経済記者出身でデータ可視化のエキスパートとして活躍する著者は、グラフや表で可視化されたデータの「誤読」の例をあげる。
たとえば、日本の防衛費急増を報じる記事は4.7兆円以下を切り捨てた表を根拠にしているが、切り捨てない数字で表すと棒グラフのカーブはとたんに平坦になるのだ。
著者の専門であるデータ可視化の「デザイン」を紹介した第5章は読みどころ。高校野球の投手の投げ過ぎ問題で吉田輝星、田中将大、斎藤佑樹らの甲子園での投球数を可視化してアメリカの少年野球の規則と照らし合わせた例など野球ファンにも面白い。
(講談社 990円)
「数字のセンスを磨く」筒井淳也著
家族社会学の専門家で計量社会学者でもある著者。
複雑な人間関係がからむ家族の問題に、数字をもとにした量的調査手法で迫るには「センス」が必要だ。
本書の第1章「数量化のセンス」では、数字をカテゴリーに分けるには質的な判断が必須という話が面白い。
たとえば、国勢調査における「人種」や「民族」。アメリカのような多人種多民族国家では異なった人種や民族の結婚から生まれる人も多く、肌の色もさまざま。ゆえに回答は自己判断で決まるのだ。
またアメリカでは学校での少人数クラスの学習効果などを測定する社会実験が積極的におこなわれるが、日本では教育現場の不公平感を恐れて実験に踏み切れないなど、データの裏にある国民性や社会体質の違いなども興味深い。
データ分析を本格的に学びたいという読者を念頭にした巻末のアドバイスも親切だ。
(光文社 990円)