画像認識技術を応用して「写真の自動タグ付け(写真の中の顔を判定して写真に人の名前等のタグを自動で付ける)技術」保有VBのRiya(Ojos, 10月末のPostで取り上げた)をGoogleやMicrosoftが買収するかも、という噂がここシリコンバレーで1ヶ月ずっと出回っていたが、CEOのBlogに当面同社はIndependentで行くとポストがあり、どうやら買収話は流れたようだ。
関連Blogポスト、Tech Churchのこれとか、Jeff Clavierのこれとか。
が、いずれにしても、この手の「認知」系のベンチャーは大変気になる存在である。
いずれ時間を作って熟考&書きたいと思っているが、このベンチャーがTryしているような「情報へのタグ付けを自動化する方向」は、当該情報の特徴点(文章であれば頻出単語等、画像であれば顔データ等)の抽出を皮切りに、次にContextの汲み取りのTryへ行くだろう(端的な例では、直接一時情報に記述が無い単語や画像データ概念をタグとして生成するなど)。が、現在のコンピュータサイエンスではこの「Contextを取り扱う」のは大変困難であり、当面はいわゆるSocial Search的な人力パワーを借りてハイブリッド型で進むだろう。
当方が注目しているのは、この「ハイブリッド」の先、すなわち機械自身が情報のContextを汲み取ってタグ付けを行ったり高度な検索機能を提供して行くような萌芽が見られる事象である。残念ながら今日現在、まだそのような萌芽は見つかっていないが、ここで何らかのブレークスルーを達成したベンチャーは間違いなく台風の目になるだろう。
どのような形でブレークスルーが達成されるかはわからないが、はっきり言えるのはContextを汲み取るには「エンジン」だけでは駄目で、幾つか「データの蓄積」がいる。そういった情報を集めている人が、多分要注目だと思う。
1つは、ドメイン知識の蓄積やモデリングが不可欠。Contextを汲み取るには、一時情報に書かれていることそのものを知っているだけでは不十分であり、当該一時情報が所属しているドメインの知識蓄積がいる。ということは、このブレークスルーは多分、汎用系のサービスではなく、Verticalなサービス分野からまず出て来るのかも知れない。
もう1つ、Contextを汲み取るには、検索分野であれば「何故検索するのか」という情報が多分必須である。言い換えれば「検索をした後にそれを使ってどのような情報処理をするのか」という事。例えば人に仕事を頼む時、「**の情報集めといて」と言うだけでなく、続けて「++に使うからさー」と言い足した方が的確な仕事をして貰える可能性が高い、と言えば伝わるだろうか。よって、まずはこういう問題定義をするプレーヤ(「何を検索するのか」から「何故検索するのか」を問題として認識している人)を探し、この問題設定に耐えられるような情報の収集(検索理由)を仕組みとして取り込む工夫をするような動きが無いか、注目して行きたい。
Comments