JavaScript対応ブラウザで表示してください。
KUBOTA Lab. JAPANESE→ENGLISH
研 究概要

研究内容の紹介です。
(注意)
現在、「研究概念」「研究内容」については、更新中のため、
リンク切れになっているページがありますが、ご容赦下さい。

知能を考え、システムを創造する

現在に至るまで知能やシステムに関して様々な考えが提案され、議論がなされてきました。本研究室では、「ロボットパートナー」に関する研究を通して、計算論的な視点から「知能やシステムとは何か」を考えています。まずは、本研究室で行っている知能やシステムに関する研究を計算論的な視点から考えてみます。



マーク 研究室のロボットの紹介
マーク パートナーの定義
マーク 知能に関する議論
マーク 状況の知覚と学習
マーク ロボットの知能化と認知発達
マーク システム論的な考え
マーク 身体性の拡張と情報構造化空間



パートナーの定義


  最近、パートナーロボットやロボットパートナーという言葉をよく耳にします。一般には、秘書的な機能や人間の身体的補助を目的としたロボットを指すのでしょう。普段、私たちが使っている「パートナー」という言葉は、ある目的を一緒に達成するための相手を指します[1]。例えば、ハリウッドのFBIのアクション映画では、最初、全く性格が異なる二人の刑事がペアにさせられて、事件を解決していくうちに、互いの危機をクールに助け合いながら、友情や信頼感がめばえてくるというようなシナリオをしばしばみかけます。そこでは、最初、ぎこちないコミュニケーションにハラハラしたり、笑いを誘ったりしますが、最後は、「阿吽の呼吸」のコミュニケーションに魅了されます。
 
 さて、パートナーという言葉は、人に限らず、モノや道具にも使われます。例えば、作家の使い慣れた万年筆やスポーツ選手のシューズは、まるで体の一部のようでもあります。また、ずっと使い続けている手帳には、何がどこに書いてあるのか、必要な情報を瞬時に探すことができ、使い慣れた道具は、我々の期待を裏切りません。さらに、長年、乗り続けている車は、エンジンの方から聞こえる音や体に伝わる振動でその日の車の調子がわかるような気がしますし、遠隔操作している機械やロボットも、例え離れていても、まるで目の前にいるように感じたり、操作できたりします。

  このように、道具とはいえ、まるで人とコミュニケーションをとっているかのように感じられます。当然のことかもしれませんが、阿吽の呼吸や期待を裏切らない反応には、タイミングが重要になります。タイミングを議論する上で役に立つのが、「カップリング」の考えです。カップリングに関する概念は、自律分散システムに関する研究で 議論されています。ここで、「タイトカップリング」と「ルースカップリング」の境界を明確に議論することは困難ですが、例えば、2つの自律したシステム間で共有される変数の数により決定されると考えると、2つの自律したシステム間で共有される変数の数が多いほどタイトカップリングになり、また、システムの組織化や構造化が進むにつれ、より少ない変数でタイトカップリングへと発展しうると考えられます。さらに、タイトカップリングでは、一方のシステムの挙動が、もう一方のシステムへの挙動に大きく影響を与えます。このように考えると、物理的な道具による拡張には、使い慣れた筆やシューズのようなタイトカップリングが存在します。また、人間やロボットなどとの関係は、互いに調整しあうことを通して、タイトカップリングにもルースカップリングにもなりえます。ここでいう調整とは、個々の知覚と行為の循環的プロセスを介して,知覚可能な情報と多様な行為の可能性を互いに限定しあうことを意味します[2]。
 
例えば、はじめてあった人からアイコンタクトや目配せをされても(知覚可能な情報の意味を特定できない)、どのように反応していいのか分かりませんが(多様な行為の可能性を限定できない)、気心の知れた友達に対しては、アイコンタクト一つで思いのまま、動かせたりできます。バスケットボールやサッカーなどのチームプレーも同じです。つまり、パートナーであるということは、相手の挙動、例えば、アイコンタクトやジェスチャなどの少ない情報で意図を明確に伝えあえることができるようになります。このような関係を構築するためには、経時的な「学習」や「適応」などの考えが必要になります。
 
 本研究室では、人間や動物の知能や認知発達の仕組みを様々な観点から議論し、学習や適応に関する方法論を確立するとともに、ロボットパートナーや遠隔操作システムなどに関する研究開発を行っています。


マーク ロボットパートナーに関する研究(小松・石川・坂田・矢口)
マーク 遠隔操作システムに関する研究(戸田・鈴木)
マーク 自律分散システムに関する研究(相沢)
マーク アイコンタクトやジェスチャに関する研究(木村)


[1]
久保田直行,知覚-行為循環によるパートナーロボットとのコミュニケーション(パターン・記号統合 基礎と応用-ペットロボットのペットらしさを求めて, 古橋,萩原編), 丸善株式会社, pp.158-171, 2004.
[2]
久保田 直行,三嶋 博之,知覚と行為の循環的プロセスと拡張身体性,計測と制御,Vol.48, No.12,pp.864-870, 2009.





知能に関する議論


 知能に関する議論は古くから行われており、知能の定義は時代背景にも大きく依存します。例えば、初期の人工知能(ArtificialIntelligence;AI)では、人間の記号作と探索に関する能力の実現を目指していましたが、DeepBlueがチェスの世界チャンピオンに勝利したときには、人間の知能を別の観点から議論し始めました。ここで、この事例で最も印象深かったことは、チェスの世界チャンピオンが、「DeepBlueに人間には無い別の知性を感じた」と発言したことです。また、PfeiferとScheierは、著書UnderstandingIntelligenceにおいて、様々な知能の定義を引用した上で,知能を「生き残る能力」と定義していますし[3]、Bradyは,ロボティクスに関する研究を「知覚から行為への知的な結合である」と定義しています[4]。このように、知能に関する議論は、ロボットに関 する研究を含め、様々な観点から行われています。本研究室では、知能を計算論的な観点から議論したいと思います。
 歴史的には、Bezdekは、知能を、3つの異なる観点、人工的(artificial)、生物的(biological)、計算論的(computational)から比較し、これらをあわせて、以下のように「知能のABC(ABC ofIntelligence)」とよんでいます。

・ Artificial Intelligence(AI、人工知能)
・ Biological Intelligence(BI、生物的知能)
・ Computational Intelligence(CI、計算知能)

 それぞれの特徴を明確に議論するため、知能のABCを下図のように考えます。AIをトップダウン的な外部からの記述を用いた記号処理、CIをボトムアップ的な内部からの記述を用いた数値処理に基づく知能として捉えることにより、AIとCIを比較していますが、BIを議論する上で、脳内の神経伝達物質の流れや物理的な信号の流れだけでなく、知能を発現しうる何かを「α」という記号を用いて考え、この「α」の解明こそが生物知能に関する研究の本質であると考えられています。しかしながら、AIとCIの境界は、方法論的には明確ではなく、多くの方法論を共有しながら、発展しています。


                                          図1.知能のABC

 本研究室では、センサ情報を用いたCIに基づくボトムアップ的な数値処理と人間とのコミュニケーションで用いる自然言語を用いたAIに基づくトップダウン的な記号処理を双方向から進めなら、研究を行っています[5]。例えば、知能の断片的な能力である推論・計画・学習などが相互依存的に機能する枠組みとして構造化知能(StructuredIntelligence)の概念を提案し[2]、さらには、ファジィシステムとニューラルネットワークを、それぞれ言語に基づく「論理的推論」と非線形写像に基づく「直感的推論」と捉え、さらに、これらの手法を併用し、予測誤差や学習誤差をモニタリングする役割を果たす「自己意識」の機能から構成される方法論を提案してきました。特に、ロボットが環境や人間と相互作用しながら、様々な学習を行うための方法論に関する研究を行っていますが、学習を以下のように「学習のABC(ABC of Learning)」と分類することにより、知能化を考えています。

・ Adaptive Learning(適応的学習)
・ Behavioral Learning(行動学習)
・ Cognitive Learning(認知学習)

 行動学習は、ロボットやエージェントが、行動獲得するための方法論に関する研究で、認知学習は、知覚や認識を扱う方法論に関する研究です。基本的に、認知学習と行動を切り離して考えるのは困難ですが、認知学習では、計測データに基づく知覚情報処理やジェスチャ認識の他、対話システムに関する研究が 含まれ、行動学習では、試行錯誤的な強化学習や模倣学習の他、複数ロボットの協調行動に関する研究が含まれます。適応的学習は、知覚と行為を対にして捉え、環境の変化などに適応的に学習を行う方法論として考えます。さらに、本研究室では、構造化学習(StructuredLearning)の概念を提案してきました。構造化学習は、複数の学習モジュールが相互依存的に各種パラメタを調整しながら、構造的にカップリングされた学習を行う方法論です。
 学習と適応という用語は、しばしば曖昧に定義されますが、ここでは、知覚や行為などの機能を調整するための方法を「学習」として考え、与えられた環境に対し、調整することを「適応」として捉えます。したがって、入出力関係を単に獲得することは学習であり、その入出力関係を用いて様々な環境と相互作用した結果、調整されることを適応とよぶことにします。それでは、次に、適応について考えます。環境への適応を以下のように適応の3Sと分類して考えてみます[7,8]。

・ Self-Adaptation(自己適応)
・ Selective Adaptation(選択低適応)
・ Structurizing Adaptation(構造化的適応)

 自己適応は、環境が与えられた上での受動的な適応であり、自らの行動を環境条件にあわせて、適応していく方法論です。これは、ニューラルネットワークを用いた学習や強化学習などの行動獲得に関する研究の他、環境条件に適応するために、ロボット自身が自ら必要なセンサやアクチュエータを選択し、交換するような進化的学習などが含まれます。次に、選択的適応は、渡り鳥のように、自らの身体性にあわせた環境を選択することにより行われる適応であり、群ロボットなどにおける労働分化や棲み分けなどに関する研究などが含まれます。最後の構造化的適応は、動物が巣を作ったり、人間が家やダムを建設するように、自らの身体性にあわせて、環境そのものをつくり変え、環境を(再)構築・構造化することによる適応で、この構造化的適応を自律的に行うことができれば、かなり高いレベルの知能化が実現できます。また、時間的、あるいは、生物学的な観点から、適応は、感覚器的適応、生理的適応、進化的適応に分類されます。感覚的適応は、順応などに相当し、感覚器官がある一定の刺激状況に持続的にさらされると、時間経過に伴い、感覚的体験の強度や質、明瞭さなどが変化するような適応です。生理的適応は、ニューラルネットワークの学習のように、刺激に対し、ある特定の反応を示すようになり、進化的適応は、進化を通した形態や機能の変化の結果、環境に適応するような適応です。

マーク 予測に基づく 知覚システムのための構造化学習(西田)
マーク デザインと機能の共進化的最適化(西村)
マーク 計測データに基づく知覚情報処理
マーク 対話システムに関する研究
マーク 複数ロボットの協調行動に関する研究(安田)
[3]
R. Pfeifer and C. Scheier, UnderstandingIntelligence, Hillsdale, The MIT Press., 1999.
[4]
M.Brady and R.Paul, Robotics Research, TheFirst International Symposium, The MIT Press, Massachusetts, 1984
[5]
山口亨,久保田直行,高間康史著,インテリジェントネットワークシステム入門,コロナ社, Jun. 2008.
[6]
T.Fukuda and N.Kubota, An IntelligentRobotic System Based on A Fuzzy Approach, Proceedings of IEEE, 1999,Vol.87, No.9, pp.1448-1470, 1999.
[7]
久保田直行, 進化的ロボティクスと適応, システム/制御/情報, Vol.47,No.12, pp.565-570, 2003.
[8]
久保田直行, 15.2.進化型ロボティックス, pp,217-222,進化技術ハンドブック, 第T巻基礎編, (社)電気学会 進化技術応用調査専門委員編, Jan.31, 2010.





状況の知覚と学習


 状況の知覚に関しては、situationawarenessに関する研究が行われており、人間がロボットや人工物といかに状況を共有するかなどが重要な課題の一つとされています。状況そのものの記述は非常に困難ですが、エージェントやロボット(以下、エージェント)が取った行為によって環境状態が変化しうることを考慮すると、現在、取りうる行為によって異なるであろう未来の環境状態を予測でき、その環境状態の意味や価値がフィードバックされ、現在の環境状態に未来の意味や価値を見いだすことができると考えます(図2)。ここでは、見やすいように離散的に表現していますが、図中のノードは状態を矢印は行為を表し、知覚可能な状態と取りうる行為により状況が特定されると考えます。例えば、将棋やチェスの盤上でみえているのは、現状の状態の優劣ではなく、先読みした未来の盤上の優劣であることと類似します。すなわち、状況の知覚とは、現在の状態そのものの意味や価値ではなく、現在の状態に未来の状態の意味や価値を見いだすことです。一方、過去に遡って、現在の状態が生起した原因を過去の状態と現在に至る行為に見出すことを因果関係の知覚と考えます。したがって、このような状況の知覚や因果関係の知覚のためには、知覚と行為の循環的なプロセスが必要となります。

図2 異なる時間スケールにおいて環境との相互作用に基づく状況の知覚と因果関係の知覚

 生態心理学では、知覚と行為は互いに相補的な関係であるとともに、循環的な関係を持つものとして定義され、このような循環的なプロセスを「知覚-行為循環」とよびます[9-11]。すなわち、知覚が行為を導くとともに、行為が知覚を導くものとして定義され、知覚システムは行為を特定する情報を抽出し、行為システムは知覚を特定する姿勢を生成します。ここでの姿勢は、もちろん、物理的な意味での姿勢も含みますが、より広い意味で「構える」ことであり、構えることは、ある特定の情報に注意を向け、それに対応する行為の可能性を特定する活動として捉えることができます(図3)。例えば、格闘技やスポーツの練習では、まずは、「構える」ことを習得します。構えることは、自分の行為の可能性を顕在化させる(ある特定の行為を取りやすくする)とともに、相手の行為の可能性を限定します(ある特定の行為を取りにくくする)。例えば、バスケットボールやサッカーなどの球技では、ディフェンスが構えることにより、オフェンスの動きに対応しやすくなり、同時に、オフェンスにシュートやパスを出させにくくすることができます。さらに、道具を持つことにより、その道具にあわせた行為が組織化されるとともに、道具を介して、その道具固有の知覚がなされます。


図3  知覚と行為の循環的プロセスにおける注意と姿勢の関係

 生態心理学では、環境がその中で生きる動物に与える行為の機会や可能性を「アフォーダンス(affordance)」として定義していますが、知覚と行為の双対的関係をより明確化するために、このアフォーダンスと対をなし、アフォーダンスの知覚と相補的な行為主体の側の特性として,「エフェクティビティ(effectivity)」の概念を導入しています。エフェクティビティは行為の実現可能性であり、アフォーダンスがエフェクティビティを特定し、エフェクティビティがアフォーダンスを特定するという循環的な構造になっています。「姿勢」の調整は、エフェクティビティを特定するための一つの方法となります。さらに、知覚システムと行為システムは、独立したシステムとして存在するのではなく、知覚システムと行為システムが相互参照しあう互いに入れ子の構造になっています。
 さて、上述のように、知覚と行為の循環が状況を特定し、未来の状態が予測可能になると、その未来の状態に向かうための意図が生成されますが、「状況の知覚」と「意図の実現」もまた、循環的なプロセスを構成します。例えば、将棋やチェスで、相手に勝つという意図を実現するために、相手の駒を取るという二次的な意図(目的)を生成した際、その手段(方策)がまだ見つかっていない場合、現在の盤面から一連の手(多段階的な意思決定や行為系列)を考え未来の盤面を予測することにより状況の知覚をします(「意図の実現」から「状況の知覚」へ)。また、その思考の中で、より良い未来の状態を予測することができれば、二次的な意図を修正したりします(「状況の知覚」から「意図の実現」へ)。このように、状況の知覚と意図の生成もまた循環的なプロセスになります。さらに、このような議論は、生態心理学では、IntentionalDynamicsの概念として議論されています[1]。さて、本研究では、「状況の知覚」と「意図の実現」の循環的なプロセスを、「状況-意図循環(situation-intentioncycle)」とよぶことにし、「知覚-行為循環」が、情報を介して、環境と直接、相互作用する循環的なプロセスであるのに対し、「状況-意図循環」は、「知覚-行為循環」により特定される価値を介して生じる「状況の知覚」と「意図の実現」による循環的なプロセスであり、意図の実現のために必要とされる「知覚-行為循環」が選択される。つまり、環境や他者とタイトカップリングを構成している場合は、ある特定の「知覚-行為循環」により知覚と行為がなされ、ルースカップリングにおいては、環境や他者とカップリング可能な複数の「知覚-行為循環」の候補の中から意図の実現に向けたある特定の「知覚-行為循環」の選択がなされうると考えます。これは、一つの考え方ですが、普段、私たちが当たり前と考えているようなことも、エージェントやロボットに構成論的に実装しようと試みると、計算論的に実装できる枠組みとして捉えていく必要があり、このような知覚と行為の循環的なプロセスを逐次意思決定の観点から考えると、強化学習に関する研究と深く関係します。

図4 「知覚-行為循環」と「状況-意図循環」に基づき人間と相互作用するロボットパートナーの構造
 逐次意思決定過程の観点から知覚と行為の循環的なプロセス考えると、強化学習の研究は非常に興味深く、過去の経験に基づく学習や未来に得られるであろう価値を推定しながら行為を決定する方法論は、知覚-行為循環や状況-意図循環のアルゴリズム的な実現方法の一つとなりうる。
 一般に、強化学習(reinforcementlearning)は、逐次意思決定問題において、エージェントが環境から得られる報酬や罰に基づき、獲得できる積算報酬を最大にする適切な方策を求めるための手法です。基本的な強化学習の枠組では、エージェントは、時刻tの状態stを観測し、方策πに基づき、行動atをとった結果、次の状態st+1 に遷移し、報酬rt+1を受け取ります(図5)。ここで、状態st+1への遷移と得られる報酬rt+1が現在の状態stにおける行動atにのみ依存する場合、マルコフ決定過程とよばれます。エージェントは、何らかの行動をとることにより報酬を得ることはできますが、方策πを更新するための教師信号は、直接的には得られないと仮定します。したがって、強化学習では、逐次意思決定過程において、この得られる積算報酬を最大化することを目標とします。

 ここで、現在の状態stを観測した際に、未来に得られるであろう重みづけられた積算報酬の期待値を現在の状態stの価値(value)として考えます。上述の議論と対比すると、状況の知覚とは、この価値を現在の状態に見出すことに相当します。また、上述の式において、方策πの集合(Π)が変化すると、取り得る行為が変化するため、予測可能な未来の状態も変化します。その結果、得られるであろう積算報酬の期待値も変化しま。強化学習の手法の一つであるTD(TemporalDifference)法では、状態に対する価値を見積もるためにルックアップテーブル等が用いられ、学習係数をη、割引率をγとし、以下の状態価値関数を用いて更新されます。

 このような価値関数の推定を伴う強化学習の方法論は、価値関数を用いていつか得られるであろう報酬の構造を推定し(図6(a))、この見積もられた価値関数を用いて方策が決定されます。この学習は、環境同定型学習(exploration-basedlearning)ともよばれ、状態st+1の推定された価値を用いて更新している点が重要です。つまり、未来の価値が現在の価値にフィードバックされていくわけです。したがって、目標とする最終状態において、最も高い報酬が得られるのであれば、その報酬の値を用いて、一つ手前の状態の価値に反映され、仮想的なポテンシャル場のように伝達されていきます。その結果、学習後には、現在から未来に向かい、最も高い積算報酬へ向かう行為系列を探索することができるようになります。さて、ここで、将棋やチェスにおいて、現在の状況を知覚できるのは、それ以降、展開される局面と勝ちや負けにつながる一連の手を探索できるときである。ここで状況が知覚できないときには、すなわち、相手がどのような手を考えているのか分からない場合には、相手の出方を伺うために探りを入れるための手をとることがあります。これは、認識を促すためにとられるEpistemicActionと類似し、また、TD法における方策の探索(価値関数の同定)のために取られる行為に相当します。したがって、状況の知覚とは、その状況と対になる方策(行動則)を準備できることとして考えられます。また、価値関数の最適化のためには、方策の最適化が必要であるとともに、方策の最適化のためには、価値関数の最適化が必要であるという互いに入れ子の構造は、知覚のためには行為が必要であり、行為のためには知覚が必要であるという互いに入れ子の構造と類似します。最後に、状況-意図循環の観点から考えると、「意図の実現」は、ある状況において価値を最大化する試みであると考えられます。

図5 環境と相互作用するエージェントの強化学習の枠組み


(a) 環境同定型学習


(b) 経験強化型学習


(c) 進化型学習
図6 価値関数の同定や評価値に基づく学習のための割引率の考え方
 強化学習に関する研究では、他にも色々な方法論が提案されています。例えば、利益共有法は、ある報酬が得られた後、次の報酬が得られるまでを1つのエピソードとすると、離散時刻tにおいて得られた報酬をrt、時刻t-jに実行された方策(ルール)iの強度をSi、学習係数をη、割引率をγとすると以下の式を用いて、ルールの強度が強化されます。

 これは、TD法とは異なり、状態価値関数を同定するのではなく、方策を直接的に評価したり、生成したりするのに用いられます。過去に遡って、報酬が強度という形で方策に割り当てられるため、現在の状態が過去にとった行動との関連、すなわち、因果関係として原因を過去に求めようとする試みと捉えることができ、因果関係を間接的に学習することが期待されます(図6(b))。この学習は、経験強化型学習(exploitation-basedlearning)ともよばれ,ヒューリスティックな(経験的に正しい)学習であると考えられています。環境同定型学習ではマルコフ性が仮定され、全ての状態について十分な探索を行えば、収束性が議論できる一方、経験強化型学習では最適性が保証されない反面、マルコフ性が仮定されない動的な環境下でも、ある程度、学習可能であることが報告されています。
 また,遺伝的アルゴリズムを用いて方策(行動ルールの集合)を獲得するピッツアプローチでは、個々の行動ルールに対する評価が与えられず、一つのエピソードが終了した際に、ルール集合全体に適応度という形で与えられます。すなわち,個々の状態に対する行動の評価は詳細には行われず、各行動ルールには、一様に報酬が分配されるものと考えられます(図6(c))。ここでは、便宜上、局所的な状態や行動の学習に基づく環境同定型学習と経験同定型学習等と区別するために、このアプローチを進化的学習(evolutionarylearning)と呼ぶことにします。この方法を用いると、個々の行動ルールが評価されないため、行動ルールを局所的に改善することは困難であり、探索時間を多く必要とする反面、行動ルール集合全体のルール数の最適化や推論システムの構造の最適化も同時に行える可能性があります。
 以上のように、状態、知覚、行為、価値、状況、意図などを計算論的に扱うことにより、具体的な学習の枠組みに展開していくことができます。ここまでは、評価が報酬という形で与えられると考えてきましたが、ロボットの行動学習の全体的が枠組みについて考えると、ロボットの学習は、大きく分けて、正確な教師データが利用可能な教示学習と、利用できない自己学習に分類されます(図7)。ここでいう正確な教師データとは、スポーツなどのトレイナのように、行動そのものをどのように改善していけばよいかが明確に与えられるデータを意味します。さらに、自己学習は、強化学習、進化的学習、教師無し学習に分類可能となる。上述のように、強化学習は、逐次意思決定過程において、得られる報酬から価値関数を学習することにより行動学習を行い、進化的学習は、価値関数の学習を伴わずに、直接、行動を探索・学習する方法論となります。さらに、このような報酬も受け取ることなく、観測されたデータから何らかの学習を行うのが、教師無し学習になります。一方、教示学習は、正確な教師データを直接、利用可能である誤差に基づく学習と人間のモデルを観測的に利用することにより行われる社会的学習とに分類可能です。また、社会的学習は、教示者から学習者への一方向である模倣学習、学習者の学習状態を認識しながら行えるインストラクティブラーニング、さらには、事前に正解を知らずに、自ら探し出す協同学習などがあります。このように利用可能な教師データの構造からも、計算論的な様々な方法論に分類し、議論することができます。


図7 ロボットの学習の方法論


マーク 知覚-行為循環(増田)
[9]
James Gibson, The Ecological Approach to Visual Perception, Houghton Miffilin Company, 1979.
[10]
M.T.Turvey and R.E.Shaw, Ecological Foundations of Cognition I. Symmetry and Specificity of Animal-Environment Systems, Journal of Consciousness Studies 6,No.11-12, pp.95-110, 1999.
[11]
R.E.Shaw and M.T.Turvey, Ecological Foundations of Cognition II. Degree of Freedom and Conserved Quantities in Animal-Environment Systems, Journal of Consciousness Studies 6,No.11-12, pp.111-123, 1999.



ロボットの知能化と認知発達


 ロボットは大きく分けて、自律型と操縦型に分類されます。自律型は、自ら意思決定し、行動するのに対し、操縦型は、人間からの操作信号に基づき、動作します。いずれにしても、人間とかかわる機械として考えることができますが、人間の意図をロボットが理解できるのでしょうか。操縦型のロボットは、直接的にロボットに動作信号を送信することもできますが、自律型のロボットの場合、人間の対話や行動を理解する必要があります。しばしば、「ロボットは、人間を理解できるのか?」というような哲学的な問いがなげかけられたりしますが、人間同士でも互いに理解し合うことは難しい状況は多々あります。それでは、まず、理解について考えてみようと思います。「理解」も「知能」と同じで、直接的な定義は困難なような気がします。特に、ロボットの理解となると、合意を得るのは困難かもしれません。したがって、ここでは、理解を以下の4つに分類して考えてみます。

 ・ 共感的理解(Empathic Understanding)
 ・ 模倣的理解(Imitative Understanding)
 ・ 視覚的理解(Visual Understanding)
 ・ 論理的理解(Logical Understanding)

 また、これらは、機能的な側面から、情動的理解、行為的理解、知覚的理解、記号的理解に対応すると考えられます。共感的理解は、情動に基づき、他者と同じ感情を想起、もしくは、その情動の状態になることと考えます。模倣的理解は、実際に他者の行動を模倣してはじめてわかる理解で、自転車に乗る、ボールを投げるなど、実際に、行為のダイナミクスを体験したり、再現したりことにより得られる理解です。視覚的理解は、他者の行動を観察して得られる理解で、すでに、模倣学習などで、類似の行動を獲得済の場合、実際に行為を再現しなくても、視覚イメージなどで得られる理解です。最後の論理的理解は、文字やジェスチャなど記号化されたものを用いて、記号操作などを伴い論理的に得られる理解であると考えます。さらに、これらは、計算論的には、共感的(あるいは、情動的)理解からボトムアップ的に拡張可能です。情動モデルを用いて、疑似的にロボットに情動を生成し、情動を用いて知覚情報や行為情報の意味づけを行います。つまり、模倣学習により獲得された行動の価値や意味を、情動パラメタを用いることに定義することができます。次に、視覚的理解は、上述のように視知覚により、獲得済の行為を想起することにより、他者の行為を再現することなく理解することができます。最後に、獲得された行為や知覚された情報を記号化することにより、論理的理解の記号的要素として用いることができます。「ロボットは、人間を理解できるのか?」という問いを、理解の機能的側面に置き換えて議論することにより、ロボットの理解に関する構成論的、計算論的議論が行えます。しかしながら、このような理解をロボットに実現するためには、人間との経時的な相互作用とコミュニケーションを介した学習と適応が必要になり、認知発達ロボティクスという研究分野で議論が展開されています。本研究室では、ロボットパートナーの認知発達を考える上で、下図のような社会的相互作用における認知レベルの階層性を提案してきた[12]。


                                                 図8  社会的相互作用における認知レベルの階層性

マーク  情動モデル に基づく強化学習(脇坂)
マーク  見まねに基 づく模倣学習
[12]
Naoyuki Kubota and Kenichiro Nishida,Intelligent Control of the Perceptual System for Partner Robots,Emerging Technologies, Robotics and Control Systems Volume 2,International Society for Advanced Research, pp.204-209, Jun. 2007.





システム論的な考え


 ロボットの知能化や認知発達を議論する上で、システム論的な考えは非常に役に立ちます。近年、システム論的な考え方やものの見方に基づき、様々な議論がなされている[13-18]。Second-OrderCyberneticsでは、サイバネティクスの源流として、(1)ウィーナーのサイバネティクス、(2)チューリングのサイバネティクス、(3)マカロックとピッツのサイバネティクスがあると考えられています。これと類似する形で、システムの構造的側面から、しばしば、(1)動的平衡系、(2)記号論理系、(3)自己組織系に分類されます。
 動的平衡系では、キャノンが提唱した恒常性(ホメオスタシス)に代表されるように、ある一定の範囲内で安定となる系が議論されてきました。ウィーナーは、サイバネティクスの概念を提唱し、開いた系におけるホメオスタシスの機構の原理を解明し、フィードバックの概念を制御系に導入するとともに、生命や社会における内部の安定性の議論を展開しました。その後、フォン・ベルタランフィらによって一般システム論として連立微分方程式を用いた一般化がなされてきました。
 チューリングは、計算する機械と知性に関する研究を行い、現在の直列型コンピュータのアーキテクチャを記号を操作する機械であるチューリングマシンとして提唱しました。記号論理系では、記号を高度に扱うことができる人間の能力が着目され、主に知識情報処理に関する議論がなされ、入力情報に対し論理演算処理や推論・学習を行う機構について議論され、記号処理に基づく人工知能の研究が活発に行われてきました。
 自己組織系では、マカロックとピッツが、ニューロンのモデルを提唱して以来、多入力1出力システムであり、閾値処理などの単純な機能しか持たない均質なニューロンを複数、結合することにより、複雑な非線形写像を学習可能であるニューラルネットワークに関する様々な研究が盛んに行われてきました。また、ハーケンらは、シナジェティクスに関する研究において、均質なユニットユニットの挙動が全体としての秩序や機能を自律的に生み出すことの重要性を示唆し、プリゴジンは、物性物理学などにおいて、そのような秩序的な構造を散逸構造とよび、分岐点での不安定性の存在などに関する議論を行い、自己組織化に関する体系化がなされてきた。
 さらに、マトゥラーナとバレーラは、オートポイエーシスを提案し、構成要素の生成過程における作動により、システム自身の境界を生成する自己産出系の重要性を示唆し、構造的カップリングや自己言及性に関する議論が展開されてきた。ルーマンは、オートポイエーシスに基づく社会システム理論を展開しました。従来、社会システムの構成要素として人間や行為が扱われてきましたが、ルーマンは、社会システムの構成要素をコミュニケーションとして捉え、人間を環境とするような議論を行いました。また、構造的カップリングの概念では、複数のシステムが互いに他のシステムに依存しているが、同時にそれらのシステムが自律的なはたらきをしており、互いに他のシステムに対しては環境であり続けているという非常に興味深い関係性が議論されています。
 以上のように,サイバネティクスにおける安定性に関する議論にはじまり、均質な構成要素の挙動、システムを構成する要素の境界や要素間の関係性に関する議論など、様々な観点から議論が行われてきました。本研究室では、システム論の考え方を、「境界」と「関係性」の観点から概観することにより、「境界と関係性の科学」に関する議論を行っています。さらに、境界と関係性の科学の観点から、人間や認知に関する議論を行い、ロボットに必要とされる知覚能力や認知能力に関する議論を行っています。

 一般に、システムとは2つ以上の構成要素の集まりで、各要素は、ある特定の機能を果たすとともに、構成要素の属性間に相互関係が存在し、全体としてある目的や秩序をもつものとして定義されます。また、環境とは、ある与えられたシステムの外部にある全ての要素の集合であり、その属性の変化がシステムに影響を及ぼすとともに、システムの動作によって、その属性が影響を受けるものとして定義されます。さらに、サブシステムは、システムの部分的な構成要素の集合であり、あるサブシステムは他のサブシステムを環境とみなすこともできます。システム論における代表的、かつ、共通的な考え方として、全体は部分の単なる総和以上のものであり、部分は全体の単なる断片以上のものであると議論されています。一般に、前者は「合成の法則」、後者は「分解の法則」とよばれます。また、システム論的なものの見方では、「部分から部分を見る」、「部分から全体を見る」、「全体から部分を見る」ことにより、対象を様々な観点から考えることの重要性を示唆しており、このような議論はワインバーグの一般システム思考入門で議論されています[19].
 ホールとファーゲンは、システムを、オブジェクト間、または、オブジェクトの属性間の関係を含めたオブジェクトの集合として捉えていました。彼らの議論で重要な点は、オブジェクト間の対応付けや関係づけを行うときに、自己矛盾が生じない時に、そのオブジェクトへの分割が妥当であると議論した点です。
 ワインバーグは、不変性原理において、任意の与えられた性質について、それを「保存する変換」と「保存しない変換」とが存在すると述べ、言い換えると、与えられた変換について,それによって「保存される性質」と「保存されない性質」とが存在すると述べています。この不変性原理を別の観点から考えると、我々は、不変であるものを観測することによってのみ、変化を理解し、変化されるものによってのみ、不変性を理解すると考えられます。この考えは、生態心理学におけるアフォーダンスや不変項に関する議論と類似します。また、ワインバーグは、法則保存の法則において、ある事実が法則と矛盾する場合、(1)その事実を拒絶するか、(2)法則を変更せずに定義を変更すべきであると議論しています。一般に、何かを議論するためには、まず、何かを定義し、その定義に基づく法則を議論するのが妥当であると思われがちですが、保存されるものは、法則であって定義ではないと議論している点が重要です。
 藤澤は、システムとは、比較的、安定な境界によって区切られる境界を含んだ内側の全てであるとし、この境界の内外の区別が明らかであるほど、すなわち、安定性が高いものほど、強いシステムであると述べています[20]。また、システムの考え方として、時間・空間に対して一定の規則性(安定性)が存在し、様々な実現型において統計的な共通性(共変動性や相関性)が存在するパタンをシステムであると述べています。したがって、システムの安定性が高くなるためには、あるシステムと他のシステムとの差異が大きくなるべきであり、外部からの観測者にとって、凝塊性を持つことがシステムの必要十分条件であり、複数の外部システムとの間で閉じた安定的境界を持つことが重要であると述べています。すなわち、システムとシステムとの境界は、周期的で局所安定的であるよりも、定常的であればあるほど強いシステムであり、システムの目的はシステム自身の強化、境界の安定性維持であり、境界の明確化であると述べています。
 以上の議論をまとめ、

(1)法則保存の法則では、保存されるものは法則であり、定義でない。
(2)関係性保存の法則では、保存されるものは、関係性であり、境界ではない。
(3)システムの目的は境界の安定性であり、境界の明確化である。

に基づき、システムの関係性を保存するためには、境界を生成・更新することが重要であることがわかります。複数のシステムに対し、あるシステムの境界の安定性が他のシステムとの関係性において決定されるということを前提にすると、システムの境界を明示的に生成しないことには関係性が顕在化できない半面、関係性が顕在化されないことにはシステムの境界の安定性が議論できないという互いに入れ子構造となる関係が存在します。このような性質を扱うために、本研究室では、このような考えに基づき、「境界と関係性の科学」という学術的な議論を行っています。

マーク シナジェティクスに関す る研究(高瀬)
マーク 構造的カップリング(寄 田・脇坂)
マーク 境界と関 係性の科学(森)


[13]
N.Wiener, Cybernetics, John Wiley and Sons,New York, 1948.
[14]
W.R.Ashby, An Introduction to Cybernetics,Chapman & Hall, London, 1956, Internet (1999):http://pcp.vub.ac.be/books/IntroCyb.pdf.
[15]
S.A.Umpleby and E.B.Dent, The Origins and Purposes of Several Traditions in Systems Theory and Cybernetics,Cybernetics and Systems, Vol.30, pp.79-103, 1999.
[16]
A.M.Turing, Computing Machinery and Intelligence, Mind, Vol.59, pp.433-466, 1950.
[17]
J.A.Anderson and E.Rosenfeld,Neurocomputing, The MIT Press, 1988.
[18]
久保田直行,認知エージェントの視座,pp.3-4,認知機能を持つエージェント技術とその応用,認知機能を持つエージェント技術に関する調査専門委員会編,電気学会技術報告,第1174号, 2009.
[19] G.M.ワインバーグ,一般システム思考入門,紀伊國屋書店,1979
[20] 藤澤等,複合システム・ネットワーク論,北大路書房,1997.

身体性の拡張と情報構造化空間


 現在に至るまで、身体の拡張に関する議論は、様々な観点から行われています。例えば、マクルーハンは、1950年代にテレビを中心としたメディア革命がおこったとき、「ディアとは人間の身体の拡張である」とする身体拡張説を唱え、人間が使う技術というものは身体の活動の延長であり外在化であると述べています[21]。例えば、人間が視るという活動を行うための眼は写真や映画などの視覚メディアにより拡張されます。
 システムの目的が状況にあわせた境界の安定性維持であり境界の顕在化であるのであれば、拡張身体性の議論は、まさに、物理的・生物的身体の境界を道具などにより拡張することにより生成された機能的システムとしての、拡張された身体の凝塊性や安定性と深く関係します。身体性は様々な分野で議論されており、例えば、メルロ=ポンティは、単なる物理的な身体的性質だけでなく、経験や学習により得られた性質も「身体性」に含まれると議論しています。
 身体性を拡張するための概念や方法論に関する議論を空間知に関する研究において行ってきました[22]。例えば、身体性を拡張するための方法論として、(1)物理的な道具などによる拡張、(2)人間やロボットなどの自律的な他者による拡張、(3)インテリジェントルームなどの空間自体による拡張などが考えられます。空間知では、ロボットの外側を「空間」と定義し、従来、ロボットの内部に組み込まれてきた機能などを空間側に埋め込むことにより付加される機能を「空間知」と定義し、空間知と相互作用可能なロボットの外部にある情報から構成される空間を「情報構造化空間」とよんでいます。情報構造化空間に関する研究は、物理的な観点からは,RFIDタグなどを用いた対象物識別に関する技術,ロボットにとって実環境の情報を取得しやすくするための技術、ロボットを取り巻く実環境そのものを構造化するための技術に関する研究などがあり、情報的な観点からは、ロボットにとって必要となる情報の取捨選択を行うための方法論や対象物を操作するための知識の記述方法や利用方法に関する研究が含まれます。したがって、空間知では、ロボット側の情報処理機構と環境側の情報処理機構から生成される情報を双方向で効率よく利用することにより発現する新しい知の姿を議論しています。もちろん、このような空間知における空間とロボットの役割や機能は、これらを利用する人間にとって使いやすい存在でなければなりません。
 このような空間知や情報構造化空間の概念にしたがい、境界と関係性の科学の観点から身体性の拡張に関する議論を行うために、本研究では、カップリングの結合強度により拡張された身体の内側と外側の境界が顕在化されるものと仮定します。すなわち、拡張された身体システムの内側には、タイトカップリングされた対象が内在し、外側には、ルースカップリングされた対象が存在することと考えています。人間やロボットなどの自律的な他者による拡張は、互いに調整しあうことを通して、タイトカップリングにもルースカップリングにもなりえます。ここでいう調整とは,個々の知覚と行為の循環的プロセスを介して,知覚可能な情報と多様な行為の可能性を互いに限定しあうことです。インテリジェントルームなどによる空間自体による拡張は、マクルーハンが主張するメディアによる身体の拡張に近く、人間が必要とする様々な視覚情報や聴覚情報などを提示・伝達します。しかしながら、これらの情報は個々人にあわせた形で抽出・変換・提示・伝達する必要があり、空間知における情報構造化空間の構築が重要になります。ここで、人間の身体を拡張するために空間知が果たす主な役割は、人間やロボットを含む環境における知覚情報の抽出や行為の可能性の計算などであり、ロボットが参照・利用可能な情報構造へと実時間で変換することです。x
 このように、本研究室では、知能のABCや学習のABCからはじまり、構造化知能(StructuredIntelligence)・構造化学習(Structured Learning)・適応の3S・情報構造化空間(Informationally Structured Space)へと研究を展開、つまり、「ABCからS」へと構造化しながら、システムを創造しています。
マーク  情報構造化空間(大保)
マーク  3次元可視化システム(成田)
[21]
石田英敬,現代思想の地平,日本放送出版協会,2005.
[22]
久保田直行, 人間と情報構造化空間の相互関係,第8回計測自動制御学会システムインテグレーション部門講演会論文集, pp. 95-96, 2007.




マーク 研究室のロボットの紹介



Copyright (C)2005-2009 KUBOTA Laboratory, All rights reserved.