松井です。YANS(NLP若手の会)にお誘い頂き、2023/8/30に探索に関するチュートリアルをします。CVPRチュートリアルの日本語版+NLP関連話です。

画像処理とNLPを比べて考えるに、探索技術というのは相対的にNLPのほうが相性が良いと思うところもあります。というのも、探索技術を用いるということは、「複雑な問題を単純だが大規模な探索問題に置き換えて解く」ということを意味します。典型的な例は、認識問題を複雑な機械学習で解く代わりに、「距離学習 + kNN認識で解く」というものです。ここでは距離学習さえ実現できれば、単純なkNN探索で問題に対処することができます。

ここで、画像処理では画像の枚数はたかが知れているものであり、現実的にはbillion級の処理をリアルワールドで行う事例は多くはありません。一方で、NLPの世界では文字や単語は画像の世界に比べれば簡単にbillionのオーダーに到達します。よって、「構成要素の個数」という観点からは、NLPのほうが探索と相性がいいかもしれません。このあたりの議論もさせていただければと思います。

NLP会議への参加発表は初めてなので楽しみです!