松井です。CVPR 2023において、Neural Search in Actionというチュートリアルを実施します。

  • 日時: 6/19午後
  • 場所: Vancouver Convention Center, Vancouver, Canada

データを深層特徴量で表現し探索を行うことを、近年はNeural Searchと呼びます。 Neural Searchは、非常にシンプルであり、様々な問題に対して適用しやすいです。 すなわち、ひとたびモデルを訓練してしまえば、あとはデータから特徴量を抽出し近傍探索を行うというわかりやすい形で問題にアプローチできます。 ここで重要なことは、如何にしてに大量のデータを高速に扱うかという点です。本チュートリアルではそれらに焦点を当てて解説します。

探索というのは昔からある古典的な話なのですが、近年は特に以下の文脈でさらに重要さを増しているように思います。

  • CLIPといったマルチモーダル特徴量の流行
  • Feature storeやベクトル探索エンジンといった、特徴量を中心としたパイプライン
  • LLMsとの情報の交換

Neural Searchは、ある意味で、機械学習が受け持つ部分を探索という処理で肩代わりしていると言えます(全てを機械学習でやるのではなく、特徴量という形で機械学習の外に出す)。よって、Neural Searchは、機械学習・処理速度・メモリ消費が絡み合う、面白い処理体系を形成していると言えます。

このチュートリアルは探索の理論的側面の研究者であると同時にann-benchmarks/big-ann-benchmarksの中心的人物でもあるMartin、Neural Seachに関するユニコーンスタートアップJina.aiを創立したHanと一緒に行います。

バンクーバーにいらっしゃる方は、是非見に来てください!