予測分析
僕は毎年この時期になると、「Fantasy Baseball」というオンラインシミュレーションゲームを始める。
詳細は割愛しますが、これを紐解いていくと、必ず「ネイト・シルバー(人名)」というキーワードに当たる。この人は若き天才データサイエンティストで、偉業を挙げるとこんなものがある。
- 2012年の米大統領選でのオバマ再選と50州での勝敗を全て的中させた
- MLB選手の成績予測をする統計的評価システム「PECOTA(ペコタ)」を発明した など
これらがどういうものかざっくり言うと、さまざまな要素に重みをつけて、ビッグデータの近しいケースと比較し、その未来を予測するというもの。いや、この人の場合、予測を超えてもはや精度の高い予言といえる。
今度はネイト・シルバーをキーにしてぐぐっていくと、「Google翻訳」という記事に当たった。これは初耳で意外だった。
Google翻訳の仕組みは、これまたビッグデータから最適なテキストパターンを見つけて、訳文を予測して生成してるんですって。これを統計的機械翻訳というんだと。
というわけで、過去データを参照してプロアクティブに分析するこれらの手法で、ひとつ、身近なものの予測をしてみたいと思います。ちょうどいいネタ「本屋大賞2014」の発表が4月8日にあるので、大賞作品をズバリ当てちゃいたいと思います。
結果からいうとこんな感じ
大賞:「村上海賊の娘」和田竜
2位:「さようなら、オレンジ」岩城けい
3位:「教場」長岡弘樹
(もしこれが的中したら、本屋はいよいよ単純だな)
選考方法は、本屋大賞の趣旨と過去の傾向、僕が読んだか(読んでいないか)を基準に考えた。
- 「本屋大賞」ってブランドがつけば本は売れる=売れるもの・売れてるものの受賞はない
- ストーリー性、エンタメ重視=純文学(芥川賞系)の受賞はない
- サスペンスはせいぜいベストスリー止まり、短編ものもなし、新人作家もなし、僕が読んでない本は当然なし
- 2年連続で過去にノミネート経験がある人の作品が大賞=森見登美彦、万城目学、和田竜が有力っぽい
以上をふるいにかけていくと、和田竜作「村上海賊の娘」が有力で、さらにこの作品は、時代もので今やってる大河ドラマ「軍師官兵衛」と時代背景が重なるという旬の要素があり、さらに上下巻なので大賞を獲れば2倍の売り上げが見込める。
僕ならこんな感じに順位を操作して本を売りますな!
ちなみにノミネート作品の中で僕がお薦めするのは「去年の冬、きみと別れ」中村文則