読者です 読者をやめる 読者になる 読者になる

シグナル&ノイズ 天才データアナリストの「予測学」 / ネイト・シルバー

どうでもいいけど、この手のダサい副題はウケがいいのかな。

まあ原著の副題をそのまま訳して、

「なぜこれほど多くの予測は失敗し…いくつかはうまくいくのか」

とかするのもイマイチだと思うけど。

 

著者は統計学、特に様々な分野のデータを基にした将来予測の専門家。

マネー・ボールの元になった会社の予測モデルを作ったり、

政治予測のブログを作ってて、2008年の大統領選の結果をほぼ100%的中させたり。

 

ただし、上記の原著の副題(原文:Why so many predictions fail - but Some Don't)で分かるように、

華々しい予測の歴史を綴った書ではない。

 

むしろ逆に、

自信過剰バイアスが経済予測の信頼性を低いものにしていること、

特定の病気の注目度増大による自己成就予言的な症例数の増大などなど、

現実のノイズにまみれたデータからシグナルだけを見つけ出し、

それを予測の「成功」に結びつけることがいかに難しいかに関する話の方が多い。

 

では、様々な分野において、予測の精度を上げるためにはどうすべきか?

 

答えは単純(ただし簡単ではない)、

①市場、経験、知識等から現状に関する見積を立てること

②なるべく沢山予測を立て、適宜修正すること

の二つ。

 

これは、現代統計学の基盤たるベイズ推定、その事前確率と条件(文脈)による修正という考え方に対応している。

 

要するに、一定のものの見方(バイアス)を持ちつつも囚われすぎず、

(バイアスを「持たない」ことはありえない。それは事前確率がないのと等価だから)

予測の数をこなして適宜修正していきましょうという話。

 

データはあくまで材料、モデルは道具でしかなく、

文脈の中で判断しないと「フットボールの結果と株価に相関がある」みたいな意味不明な結論を信じちゃいますよ…

ってのは確かにそうなんだろうけど、言うは易く行うは難しなんだろうとも思います。

 

あと、例えば政治は「今後どうなるか」というより「今後どうしたいか、どうあるべきか」を考えるものなので、

必ずしも予測がとても重要な要素かはよく分からない。

 

ただ、ベイズ的にものを考えるというのは、予測に限らず検討すべき考え方かと。

本文中の例を引き合いに出すと、スポーツで贔屓チームが連敗している時に、

「連敗しているのは構造的な欠陥によるものだ」と考えるか、

「連敗しているが、主力の離脱がある中で内容は悪くない(文脈)。したがって今後盛り返す」と考えるかとかね。

 

当たるか外れるかはともかく、論理的思考のトレーニングとしてはちょうどいいかと思います。