知識表現

トップページ研究分野と周辺

知的システムを構築する場合、知識をどのようなデータ構造(知識表現)にするかが重要な問題となる。知識表現は勿論、推論が可能な形態にする必要があるし、人間並みに幅広い知識を扱える事が望ましい。
最も代表的な知識表現として、以下のような枠組みが考えられて来た。また、最近では概念とその関係を記述する大規模な電子化辞書等も作られている。概念の切り出しとその関係を定義する事が重要になる。

代表的な概念関係

概念記述の考え方

フレーム構造

知識を宣言的知識(Declarative Knowledge)と手続き的知識(Procedural Knowledge)に区別する考え方がある。前者は或る物事に関する状態や(AはBである)等の命題を表す知識で、後者は何かをするための方法(ノウハウ)等の順序に意味がある知識とされる。

フレーム(Frame)は人工知能の大家、M.Minskyにより提唱(1975年)された宣言的知識に関する知識表現である。或る事柄を表すフレームは事柄の名称、事柄の属性、事柄の属性の値の大きく三つの組からなる。属性はスロット(Slot)ともいう。

図の色付きの枠が属性で、右側に対応属性値がある。事柄の名称が「Aさん」の場合、属性の一つに「性別」があり、値は「M(男)」となっていて、Aさんが男性である事を定義している。「is-a」という属性は、値に上位概念を取る(Aさんは人間の一種である)。上位概念の持つ属性は、例外を指定しない限り下位概念に継承される。

例えば或る事柄の属性を全て列挙出来るか、は現実の概念に当てはめると非常に難しい事が知られ、これらはフレーム問題と言われる。

フレームの例

スクリプト構造

スクリプト(Script、台本)は、手続き的知識の知識表現として、人工知能の父とも言われるR.Shank等により提唱された(1977年)。或る特定の場面で、どの様な事が行われるかを時系列的に表現したものになる。エピソード記憶と呼ばれる種類の記憶を表現する。単なる順番であるが、フレーム構造とは異なるものとして扱われる。

図はレストラン・スクリプトの例になる。或る過程をさらに細かく記述する事も出来るし、料金の支払いについても注文時に払う場合と後払いの場合等、条件分岐が導入される場合もある。これを「順番1」「順番2」といった属性により、フレーム構造で無理に表現する事も可能である。

スクリプトの概念図

格文法

格文法(Case Grammar)は、言語学者C.J.Fillmore(フィルモア)により提唱された文法理論である(1968年)。人工知能の分野にも応用され、我々が用いる様々な概念を整理する知識表現に使われている。格文法は動詞を中心に捉え、様々な概念を、動詞(用言)的概念とそれに対する様々な役割(格)を持つ名詞(体言)的概念に整理する。

この用言に対する体言の役割は、、例えば「動作主格」「道具格」「対象格」等が挙げられる。これらは必ずしも文章の表層に明示されるとは限らず、深層格と呼ばれる。「私は鉛筆で絵を描いた」の場合、動作主格が「私」、道具格が「鉛筆」、対象格が「絵」、動詞的概念は「描く」になる。日本語では格は助詞(は、で、を等)で表現される。

現在も情報通信研究機構で開発が続くEDR電子化辞書は、図のように格文法に基づく格(関係子)を定義、動詞的概念(ブルー)、関係子(矢印)、名詞的概念(ピンク)の組みを一単位とする膨大な概念辞書を作成し、常識のデータ化を試みている。例えば「太陽は光る」は、(光る、agent、太陽)となる。

EDRの概念関係子

概念依存理論

概念依存(Conceptual Dependency)理論は、R.Shankにより提唱された(1973年)。どんな言語にも共通する最も根源的な意味を抽出しようという試みで、全ての文章の意味を11の基本的な動詞の組合せと、名詞概念、動作の修飾概念、名詞の修飾概念、時間の概念、場所の概念で表現しようとしている。図に掲げられている基本概念は、様々な概念の最上位にある概念群として位置付けられる。格文法が根源的な「関係」に焦点を当てているのに対し、根源的な「概念」を探る試みだったと言える。

概念依存理論の基本

意味ネットワーク

意味ネットワーク(Semantic Network)は、図のように二つのノード(円)とリンク(矢印)で結んだ関係(三つ組)を多数繋ぎ合わせ、複雑な概念関係を表現しようとする。初期のものとしてCollinsとQuillianにより提案されたネットワークモデル(1969)等が有名である。フレーム構造の概念(ノード)、属性(矢印)、属性値(ノード)も表現出来るし、格文法の動詞的概念(ノード)、格関係(矢印)、名詞的概念(ノード)も表現出来る。さらに複数の三つ組を一つのノードとする入れ子構造を考えれば、「~という事は~だ」といったより複雑な概念を表現出来る。

図は「犬」という概念を取り巻く小規模なネットワークの例だが、推論を用いて自動的に拡張したり(上位概念の承継:赤破線矢印)、人為的にデータを追加する事が出来る(青破線矢印)。矢印も、確実な関係や確率的な関係、仮説等の結合の強弱や様態も表現すれば、人工神経回路(ニューラルネットワーク)に似てくるし、より実際の脳の在り方に近づく。インターネット上の情報を意味的に整理しようとするセマンテック・ウェブ(Semantic Web)も、例えばノードをページ、矢印をハイパーリンクで置き換える等、意味ネットワークの方法を用いていると考えられる。

Semantic Networkの解説図