CNETの記事から。「Yahoo hires DARPA director to head research」
昨日書いた通り、Web系サービスの進化にはAI的アプローチと人間系のハイブリッドが当面主流と思う。網羅性は機械が頑張り、Contextの汲み取りに人間系の認知プロセスを援用する。そしてこれも昨日書いたが、次のステップとして機械にContextを汲み取らせる為に、1)ドメイン知識を踏まえた処理、2)検索等の情報要求の背景や当該要求前後のワークフローを取り込んだ処理がTryされると思う。
いずれもAI的なアプローチであり、YahooのResearch HeadにAIの専門家がつく、というのは(具体的な直近の仕事の内容は無論知らないが)自然な流れとして受け止められる。
ちなみに当方は、大学院時代に「システム開発の要件分析を形式化する」テーマに取り組んでいた。要求仕様をより形式的な仕様言語で記述する試みである。これを形式化出来れば要件の曖昧さから来るその後の工程での手戻りを減らせるし、究極的には(100年くらいかかるかも知れないが)システム開発の自動化を実現出来る。まずは要件分析を形式的に記述し、次に設計情報へのConversionを実現することがターゲットだった。
で、このConversionを行うには、やはりドメイン知識とシステム「前後」の業務処理全体のプロセスを機械に与えてあげないといけないが、あらゆるAIが陥る問題として、汎用的な問題解決マシンを目指すと必要なドメイン知識が発散して収拾がつかない。結局、問題空間を思いっきり絞り(在庫管理システム分野とか)、業務処理プロセスの定番系を決め打ちして、その定番系に合致する要件に限ってある程度の形式的要件定義と設計情報へのConversionを実現する処理系を目指す、という逃げを打った。昨日・今日のエントリには、当時の経験・悩みがベースにある。
というわけで、情報のContextを汲み取ってタグ付けや検索を行う、といった処理系は、問題空間をある程度区切れるVerticalな分野から出てくるだろうし、且つタグ付けや検索処理単体ではなく、その前後の情報処理サービスとセットになって提供されるだろう、というのが当方の感覚である。
具体的には、たとえば特定分野にFocusしているSNSやSBM(上で言うVertical)が、Community上で様々なアプリサービスを展開して行く流れで、当該アプリサービスの処理の一環としてContexualなタグ付けやサーチが入る(上で言う「前後の情報処理サービスとセット」)、と考えるのが自然と思う。
そして、このような処理系がどれだけGeneral Purposeな方向を追求して行けるか、という点に、コンピュータを使って神の領域に挑戦する人間の英知が結集されて行く。無論、これを一足飛びに実現することは無理であり、ほふく前進的な試みが今後ずっと続くだろう。そういう意味で、Social Search的な「ハイブリッド」なアプローチを人類が手に入れた意義は大きい。長期に渡るほふく前進を続けながら、ビジネスが出来るからである。
デリシャス買収の本質でもありますよね。
Posted by: SW | December 19, 2005 at 04:02 PM
まさにその通りと思います!
個人的には、Yahooもdel.icio.usもVerticalな方向に一旦進んでAI的な実験を沢山やってみて欲しいと思う今日この頃です。
Posted by: Dave | December 19, 2005 at 05:29 PM
すみません。ちょっとよく分からなかったので質問いたします。
「AIにContextを汲み取らせるには、前もって問題空間をある程度区切ってやる必要がある。そのため、Verticalな分野からトライしていくことになる。」という文意だと思いますが、複数のタグを付けることにより、問題空間を区切ることはできないのでしょうか?
もっとも、そうなると1つのページに10も20もタグが付くことになり、タグが細分化しすぎて意味が無くなるような気もしますが・・。
Posted by: どど迷路 | December 19, 2005 at 08:14 PM
お返事遅れてすみません。
そもそもタグを人間がつける、という行為自身が長い目で見ると過渡期的現象ではないかと考えています。(過渡期的現象であって欲しい、という当方個人の願いでもあります。)
情報の塊(Blogのエントリ等)に対していちいち人間がタグをつけて行かなくても、当該情報のコンテクストを踏まえた検索や整理が出来ないか、というのが究極の命題。
当面は、「人間がコンテクストを汲み取る能力」=「タグ付け能力」の力を借りながら状況は推移するも、次第のこのContextを汲み取る能力に対して次第に機械が受け持つ領域が拡大して行く、というイメージです。
本分野の新たな提案が世の中に出て来た場合の当方の評価の座標軸は、この「役割分担」に何らかの「境界線変更」や「そもそもの役割分担の仕方を変えるような動きがあるか」を探す、という感覚です。
答えになっていますでしょうか。
Posted by: Dave | December 23, 2005 at 02:33 PM
お返事ありがとうございます。
ちょっと私の文章が言葉足らずだったためか、本意が伝わらなかったようなので、改めて質問いたします。
私が言いました「複数のタグを付けることにより、問題空間を区切る」というのは、人間の手によって行われる、という意味ではありません。「AIが自分で付けた複数のタグから、問題空間を絞り込む」という意味です。
複数の問題空間にまたがって使われるタグが付けられたページに対して、タグの組み合わせパターンによってその問題空間を絞ることができるのではないか、と考えたわけです。
例えば、このエントリーに対して[Web]というタグだけでは問題空間が広範でAIが処理できないとします。この場合、AIはエントリーで使われている単語の[Yahoo][Search]というタグを追加し、[Web][Yahoo][Search]という「タグの組み合わせ」で問題空間を絞り込めるのではないか?という事です。
ただ問題なのは、果たしてAIにメタ的な「タグの組み合わせ」のタグ付けを行わせることができるのか?ということです。
アルゴリズムだけでなく、データの蓄積も必要と思われますので、当面は人間が問題空間を区切ってやらなければならないかもしれません。
タグを付けまくって力ずくで絞り込む、というのも考えられますが、それではタギングの意味が無いかも、という事でした。
分かりにくい上に長文ですみません。
お尋ねしたかったことは『AIが「タグの組み合わせ」で問題空間を絞り込む、というのは非現実的なのでしょうか?』ということでした。
Daveさんのご意見を聞かせていただければ、幸いです。
Posted by: どど迷路 | December 24, 2005 at 12:33 AM
エントリから機械&自動でタグを切り出していって、それでAIに資する問題空間の限定を行う、というのはある意味トートロジー(循環論法)ではないでしょうか??
私には以下①~⑤の無限ループにも見えます。
①「Generalな情報処理が出来るマシンを目指すと収拾がつかない」
②「なので問題空間の限定を行おう」
③「とある情報を見て問題空間の定義や絞込み・限定を機械に実行させられないか」
④が、「問題空間を絞る」為には、「実は問題とすべき領域以外の知識も必要ではないか」
全体を知っているからこそ、部分を部分として認識することが出来るのではないか。
⑤しかし、全体を知っている機械って・・・・。上記①に戻る。
要は、効果的に問題空間を絞り込めるほどうまくタグを付けられる処理系というのは、裏を返せば「問題空間と今回はしないものは何か」についても良く知っていなければならないでしょう。大きな情報の集合を知っているからこそ、特定のエントリが対象としている情報の範囲を規定出来る。Setを知っているからSubsetを意識出来る、ということだと思います。というわけで、貴ご質問については、突き詰めれば難しいのではないかと感じます。
Posted by: Dave | December 26, 2005 at 05:04 PM
トートロジーだというのはご指摘の通りだと思います。
大変参考になりました。
お忙しい中何度もご回答くださり、ありがとうございました。
Posted by: どど迷路 | December 27, 2005 at 02:40 AM