「データサイエンス入門」 竹村彰通著/岩波新書/2018年
ビジネスパーソンから「データサイエンスについて知りたいので、入門レベルの良い本を紹介してほしい」と尋ねられることがよくある。「いろいろ読んでみたけれど、竹村彰通先生の『データサイエンス入門』が専門的内容のレベルを落とさずに、わかりやすく説明している」と言って本書を勧めている。
重要なのは、データサイエンスにとって不可欠のツールとなっているコンピューターが計算機である(それ以上でも以下でもない)という現実を押さえておくことだ。
<人間の脳は計算機と同じような計算をしているのかという点についてはよくわからない。/(中略)人間の脳は神経組織からなる機械のようにも考えられるが、自然の一部でもあり、現在のコンピュータと同じ原理で動いているとは考えにくい。/計算に帰着できる、あるいは高速な計算で模倣できるような人間の知的な作業は、人工知能技術で置き換わっていくと考えられる。ビッグデータの時代となり、例えばセンサーなどで計測されるデータ量があまりに多く、人間が直接にすべてを見ることができない場合には、データの前処理をコンピュータがおこない、データの縮約や間引きが必要となる。しかしデータから意思決定をおこなうのは人間である>
計算機から発展したAI(人工知能)も人間のように考えることはできない。ビッグデータを統計的に処理しても、その意味を読み解く作業は人間に委ねられる。
AIと競合する仕事については、今後、急速に淘汰されていくであろう。他方、ビッグデータをAI技術によって処理したデータを読み解き、そこから意味を発見し、意思決定を行う機能は人間に委ねられる。読解や意思決定に資する幅広い教養がますます求められるようになってくる。
データサイエンスを理解するためには、統計に関する基礎知識が不可欠だ。高校で文科系クラスに属し、大学は文科系で数学に真剣に取り組まないまま社会に出た人たちにとっては、まず、高校数学レベルを数学Ⅲまで、マスターすることが必要だ。今後、高校(場合によっては中学)数学の学び直しの需要も増えてくるようになると思う。 ★★★(選者・佐藤優)
(2019年7月5日脱稿)