Google、川柳の自動生成アルゴリズムを解説

Googleがエイプリルフールに「Google 川柳 β」をローンチしたのですが、Google Japan Blog: 川柳の自動生成アルゴリズムの紹介(どうしたら 機械で川柳 詠めるかな)というエントリーで、川柳の自動生成の手順を解説しています。

2009-04-03_1530.png

今回は、Google が人工知能 CADIE を開発し、その CADIE が世界中で面白いサービスを提供するという設定で Google 川柳を提供しました。人工知能 CADIE は架空のものですが、コンピューターによる川柳の自動生成を行ったのは、ウソではありません。

1. 川柳とは何かを学習する
2. 「瞬間」を切り取る
3. 「瞬間」から川柳を切り出す
4. 世の中の興味にマッチさせる

4 月 1 日にお見せした川柳は、こうして生成されたものから、ユーザーの皆様にお見せするのが憚られるものを人手で除いたものです。

なんとなく誰かの手によって作られたものだと思っていたのですが、きちんとアルゴリズムがあったとは! すごい!

全部400個くらいあったらしいのですが、中には200個以上を見つけてしまった人もいたそうです。

この Google 川柳は、昨年のエイプリルフールでご提供したダジャレサーチと同じように、Google の「20% ルール」からスタートしました。昨年の秋にエンジニアリングチームで実施した、Tokyo Engineering Hackathon という 2 泊 3 日の開発合宿で、淺川、大倉が開発しました。

20%ルールから生み出されたものだったですかー。

■関連エントリー

【随時】「エイプリルフール」ネタのまとめ【更新中】