GoogleやYahoo!がNLP communityにもたらすもの(いい加減な私的考察)
個々のペーパーを読む時間が取れないので、一般的な感想をもう一つ。
ここ数年NAACLに顔を出していたのだけれど、今年特に気がついたのはGoogleやYahoo!が違和感なくNLPの分野にフィットしているという事実だ。
数年前まではGoogleのペーパーはもっとwebよりで、NLPで見たのはranking algorithmの応用みたいな話。見ても、「ふうん、何これ。本当にうまくいくのかなあ」というのがほとんどだった。
近年、Google, Yahoo!は多くのNLPケンキュウシャを雇用したことによって、GY発ののペーパーがNLPのメインストリームに沿うようになった気がする。それと同時に彼らが発表してきたdistributing computingのフレームワークに関する技術がNLPケンキュウシャにも受け入れられてきているように思える。NLPのペーパーでHadoopを使うものも出て来たのも、そのうちの一つだろう。
個人的には、GYが安価にdistributing computingを実現する方法を提案することによって、今までリソース不足のため実現不可能だといわれてきたモデルやアルゴリズムに陽の目が当たるといいなと思っている。
とはいえ、どんなモデルであってもがちがちのsupervised learningモデルではtraining dataを準備するためのコストがどうしてもネックになるので、大量のunannotated dataをどう使っていくかに焦点が当てられれるのではないかな。
当たり前の結論でごめんなさいです。
ではでは