概念記述の考え方

トップページ研究分野と周辺知識表現

概念の切り出し方、概念関係の記述方法、記述されていない知識をどう扱うか等、概念記述と論理的操作に必要なメタ的方法論が存在する。
これについても、様々な考え方や具体的方法が提唱され、絶対的な方法は決まっていない。

例外知識の扱い(優先度・デフォルト推論)

例外の説明に殆ど例外なく登場するのが、飛べない鳥、ペンギンである。
述語論理では、∀X(B(X)→F(X))(Bは「鳥である」、Fは「飛ぶ」の述語。「鳥ならば飛ぶ」)と、∀X(P(X)→B(X))(Pは「ペンギンである」、「ペンギンは鳥だ」)となる。
ここまでの知識だけでは、演繹推論により、∀X(P(X)→F(X))(「ペンギンは飛ぶ」)が導かれてしまう。
例外知識は、∀X(P(X)→¬F(X))(「ペンギンは飛ばない」)と記述され、上記の結論と矛盾する。
新たな命題が追加されても、以前の命題の真偽が変化しない論理を、「単調論理」と呼ぶ。
例外知識等、新しい命題の追加により、一旦導かれた「ペンギンは飛ぶ」といった命題の真偽が変化するような論理を「非単調論理」と呼んで区別する。
解決方法の一つは、論理式に「優先度」を導入する。例外を優先して∀X(P(X)→¬F(X))の方を、一般的な∀X(B(X)→F(X)より優先して推論を行なえば、正しい結論が導かれる。
もう一つの方法は、推論規則に条件を付ける事で、p:r→qといった記号が使われる。:rは、「命題rが真であれば」といった意味で、「一般的な鳥である」等が該当する。
「ペンギンは一般的な鳥ではない」等の知識を追加すれば、優先度を使わなくても正しく推論出来る。このような方法を「デフォルト推論」と呼ぶ。
例外知識はそもそも、「鳥は飛ぶ」といった大雑把な一般法則を導入するから生じたとも言える。実際に在るのは「鳩は飛ぶ」「スズメは飛ぶ」「ペンギンは飛ばない」といった個別の現象だけなので、それらを記述すれば良いという考え方も在るだろう。
しかし、概念データベースの簡潔さを考えると、グループによる一般化は重要なので、やはり例外知識は必要と言える。

記述されていない知識の扱い(閉世界仮説)

真偽値が分からない命題を偽として扱う方法を、閉世界仮説という。記述されない知識は当然、真偽値が分からないので、閉世界仮説では偽となる。
閉世界仮説では、或る命題が真である事の証明に失敗したら、その命題は偽であるとする(これを「失敗による否定」と呼ぶ)。
「飛行機は飛ぶ」という知識が記述され、「自動車は飛ぶ」は記述されていないときに、「自動車は飛ぶか?」という質問に偽の答えを返すのは、常識的にも合致している。
閉世界仮説を用いなければ「分からない」と答えるか、「自動車は飛ばない」「洗濯機は飛ばない」「郵便局は飛ばない」・・・とあらゆる事物に関する記述をする必要(事実上不可能なフレーム問題)が出て来る。
「飛行機以外のものは飛ばない」というルールを追加すると、今度は逆に「鳥は飛ぶ」等との矛盾が問題になる。
仮に「A以外はBではない」が真であっても、それは閉世界仮説を採用しているのと同じ事になる。閉世界仮説はかなり重要な働きをしていると言える。

複合概念の扱い(単独概念として記述するか)

概念を、それ以上単純な概念に分ける事の出来ない基本概念と、それ以外の複合概念に分ける考え方がある。単純に単語の表記だけでは区別出来ない場合もある。
恐らく「ラーメン」は基本概念だろう。しかし、「味噌ラーメン」は「味噌」+「ラーメン」の複合概念と考えられる。
しかし、考え方によっては「ラーメン」は「拉」+「麺」の複合概念(中華料理の麺)で、基本概念は「麺」であったのかもしれない。
基本概念を「麺」と「ラーメン」のどちらにするか、「味噌ラーメン」を単独の概念として記述するか否かは勿論、設計者の判断による。
複合概念でも、単独概念として概念データベースに登録されている概念を「結合前概念」、登録されていないが結合可能規則に基づき、システムによって生成された複合概念を「結合後概念」と呼んで区別する場合もある。

言葉の意味の範囲の扱い

例えば「切る」という動詞の意味は、まず「物を刃物で二つに分ける」といった内容が思い浮かぶ。
しかし、刃物を使わなくても、切る事は出来るかもしれない。また、二つに分離せずに切り込みを入れるだけの場合もある。
また、「口火を切る(物事を始める)」のように、最初は転用で使われた言葉が、一般的な使い方として定着しているケースも多い。
どこまでが本来の意味で、どこからが派生的な意味であるかの線引きは、或いは国語辞典がかなり参考になるが、なかなか難しい面もある。
言葉は生き物のように、時代とともに変化する。人々の使い方(例えば転用)で意味が変わるとすると、言葉の意味は原理的に「不確定」と考えるべきかもしれない。
しかし、概念データベースを作成する以上、言葉の意味は暫定的に定義しなければならない。
或る動詞の主格の範囲、道具格の範囲等、どのような基準に基づいて定義したのか明らかにする必要がある。

関連単語ベクトルによる概念記述

一つの概念を定義する際、その概念は複数の概念と関係を持っている事に注目した方法である。
記述したい概念をX、関連のある複数の概念をY1,Y2,...Ynとする。其々の関連概念について、Xとの関連の度合いを数値化して、r1,r2,...rnとする。
X=(Y1,r1),(Y2,r2),...,(Yn,rn)といった形で、概念Xを定義する。
例えばXを「冬」とすると、冬=(寒い,0.7),(ストーブ,0.4),(雪,0.5)・・・といった具合になる。
この方法では概念の複雑な定義が可能だが、概念XとY1がどのような関係にあるかは直接記述されず、関係の強さだけが示される。
関係の強さを、個人の主観で数値化したのでは、あまり信頼性のあるデータベースにはならない。
従って、様々な国語辞典等の記述をテキストマイニングして、単語の出現頻度を客観的に求める方法等が研究されている。