Overfiction

本とデジタルガジェットの感想を好きに語る

【感想】ベストセラーコード

f:id:yukitan_i:20170707234556j:plain

ベストセラーコードを読んだ。

テキストマイニングと機械学習によって、「売れる」本の法則を解き明かそうという試みについて書かれた本。

興味深いテーマではあるものの、統計的な手法としてはそれほど目新しいものではないと思う。実際、アルゴリズムが世界を支配する (角川EPUB選書)では、(2013年の本なのに)人工知能によってハリウッド映画の脚本を判定して興業成績を事前に予想するEpagogixという企業や、アルゴリズム分析によってヒット曲を予想する技術が紹介されてて、それらに比べれば、この本がやってる分析は荒削りで稚拙な印象を受けた。

本書の中で語られているベストセラーの法則とやらは、たとえば、「ベストセラーにもっともよく見られるテーマは親密な人間関係で、登場人物の心の交流に焦点をあてたものになる」とか、「三幕構成で均整のとれたプロットラインが読者をひきつける」とか、「テーマやプロットが正しくても、文体への理解がなければヒットは難しい」とか、その程度の大雑把な分析である。読み物としては面白いが、実際の創作に役立つ知見を求めている人にとっては、正直ちょっと微妙な内容かもしれない。

とはいえ、人工知能の助けを借りて面白い作品を書こう、と考える人々は、プロアマ問わずこの先増えていくだろうし、その先駆的な試みのひとつとして価値のある本だと思います。ものすごく簡単にではあるけれど、著者が作品の評価に使った手法も紹介されてるし。

もうひとつ、この本の価値を高めているのは、統計家の西内啓さんという方による巻末の解説。これは本当に素晴らしかった。本文を読んでいるときに感じた問題点が、すっきり言語化されている。むしろこっちのほうがメインコンテンツではないかと思えたくらい。

  1. 本書で示された結果はすべて、あくまでアメリカの小説市場に関するものである。
    • 国や読者が変われば当然求められるものは異なりうるし、映画や漫画など、異なる媒体であればやはりヒットの条件は変わるかもしれない。
  2. 多くのデータ分析による知見は、「現状がこのまま続くとして」という仮定が成立するという前提でのみ役に立つ。
    • 読者の価値感や言語感覚、生活といったさまざまなものの中には、ちょっとしたきっかけで大きく変化するものもある。
    • あまりに流行りすぎたスタイルは飽きられて古臭いものという扱いになるのではないかという考え方もある。
  3. 本書で用いられている分析手法が、因果関係の洞察という点では不十分である。
    • (統計に関してはド素人である自分から見ても、疑似相関っぽい、と感じる部分はけっこうあった)

「現状通りの状況が続くと仮定して売れる作品かどうかを予測して出版するかどうかを決める」だけなら本書の予測モデルでもいいけど、「企画を立てる」「文体や構成を直す」というアクションにつなげたいなら、もっと別の手法もあるよ、とのこと。参考になります。


以下、雑感。

人工知能によって作家や出版社が「売れるパターン」の解析を始めると、作品が画一化して似たような作品ばかりになる、という不満がときどき聞こえてくる。

ただ、最近のコンピューターによる将棋や囲碁を見ていると、それは逆ではないのか、というふうにも感じる。ベストセラーが生まれると二番煎じみたいな企画の本がたくさん出たり、プロの棋士でも戦法の流行り廃りがあったりするわけで、売れたもの・流行りモノの後追いをするのは主に人間のほうなのではないかと。逆に人工知能のほうが、定跡にない新手をさして人々を驚かせていたりする。

流行によってスタイルの多様性が失われると、どこかのタイミングで「取って代わる」ようなスタイルが相対的な価値を持つようになる。そうした「人間が気づきにくい、新たな価値感の予兆」を検出することにもデータ分析は使える、と本書の解説の中で西内氏は伝えている。

そんな感じで(本書のテーマとは逆に)人工知能によって創作の可能性が広がることを個人的に期待しているし、自分自身、そういうふうに統計とか人工知能とか使えるようになりたいです。

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム