キカベン
機械学習でより便利な世の中へ
G検定対策
お問い合わせ
   

第2次AIブーム:知識表現

thumb image

1. 学習目標🔝

第2次ブームで中心的な役割を果たした知識表現の研究とエキスパートシステムを学ぶ。

  • 人工無能
  • 知識ベースの構築とエキスパートシステム
  • 知識獲得のボトルネック(エキスパートシステムの限界)
  • 意味ネットワーク
  • オントロジー
  • 概念間の関係(is-aとpart-ofの関係)
  • オントロジーの構築
  • ワトソン君と東ロボくん

キーワードイライザ(ELIZA)イライザ効果マイシン(MYCIN)、DENDRALインタビューシステムis-aの関係has-aの関係part-ofの関係Cycプロジェクト推移律ウェブマイニングデータマイニングワトソンQuestion-AnsweringセマンティックWeb

2. 人工無能🔝

人工無能は人間的な会話の成立を目指したプログラムです。言葉の意味を理解しないが質問などに対する自然な応答を事前に準備しておく手法を使っている。現在で言うところのチャットボットだ。

2.1. イライザ(ELIZA)🔝

イライザは元祖の人工無能で、1966年にジョセフ・ワイゼンバウムが発表した。単純な自然言語処理プログラムでもカウンセラーのように人間と対話できることを示した。

余談だが、emacsに標準でインストールされておりESC-x-doctorで起動することができる。

実際に使ってみると、本物の人間と話しているような錯覚を与える。これをイライザ効果と呼ぶ。

ワイゼンバウムは、ユーザーがイライザに心を開く様子にショックを受けた。その後、人工知能に対して批判的になった。人間らしい感情や知恵を欠くので、コンピュータに人間にとって重要な決定を任せてはいけない、と主張した。

しかし、イライザの成功は、その後の音声対話システムに影響を与えた。

3. エキスパートシステム🔝

専門知識を蓄積して利用し、専門家(エキスパート)のように振る舞うエキスパートシステムと呼ぶ。

3.1. DENDRAL🔝

1960年代にスタンフォード大学で開発された世界初のエキスパートシステム。LISPで書かれている。

豆知識:LISPは1958年にジョン・マッカーシーMITにいた期間に考案された。彼は1956年にダートマス会議を提案し「人工知能」という言葉を初めて使ったことで有名。

開発したエドワード・ファイゲンバウムは実用的なAIを推進し知識工学を提唱した。「エキスパートシステムの父」と呼ばれている。

DENDRALは未知の有機化合物を分析し、有機化学の知識を駆使して特定する。ヒューリスティクス(経験則)を使い、化学者が行う判断と問題解決の過程を自動化している。名称は “Dendritic Algorithm”(樹枝状アルゴリズム)に由来する。

派生したシステムとして、MYCIN、MOLGEN、MACSYMA、PROSPECTOR、XCON、STEAMER などがある。

3.2. MYCIN(マイシン)🔝

1970年代に、スタンフォード大学で開発されたエキスパートシステム。これもLISPで書かれた。伝染性の血液疾患を診断し、抗生物質を推奨する。また、患者の体重によって供与量を調節できる。MYCINの名称は、抗生物質の多くが語尾に「-mycin」がつくため。

スタンフォード医学部の調査によると、MYCINの診断結果の正しさは65%だった。細菌感染の専門医の診断結果(80%)よりも悪かったが、専門でない医師よりはよい結果だった。

しかし、現場では使われなかった。コンピュータを医療に使って誤診をした場合に倫理や法律の面で問題があるためだ。また、人間の専門家からすると受け入れ難いものでもあった。

3.3. エキスパートシステムの限界🔝

専門家の知識を引き出して規則にするのは困難だった。特に経験的なものが多く暗黙的でもあった。知識獲得のためのインタビューシステムも研究された。

さらに、知識ベースを構築して得た何万もの知識に矛盾が生じないように保守維持するのが困難でもあった。そこでコンピュータで知識を共有したり再利用する方法が研究されるようになり、意味ネットワークやオントロジーが生まれた。

4. 意味ネットワーク🔝

意味ネットワークは人間が言葉の意味を記憶する構造を表すモデル。概念間の意味関係を表現するために使われる。

ネットワーク内のノードで概念を表現し、その関係を有向・無向のリンクで表現する。

  • is-a(〜である)
  • has-a(〜をもつ)
  • part-of(〜の一部である)

これによって関連知識の検索が可能になり、「タロウは哺乳類ですか?」や「太郎にはしっぽがありますか?」などの質問に答えることができる。

ただし、意味ネットワークでは概念間の関係を表現できても、記述の仕方・約束事は定まっていませんでした。よって記述する人によって語彙が異なるなどの問題が生じ知識の共有が難しい問題がありました。

5. オントロジー🔝

オントロジーは知識を体系化・組織化する構造的フレームワークです。エキスパートシステムで問題になった知識の共有や活用を矛盾なく行うのが目的です。つまり、知識(言葉・語彙、意味、関係性)を記述するための明確な仕様を定義します。

トム・グルーバーはオントロジーを「概念化の明示的な仕様」と定義した。2007年に彼はSiri Incの共同創業者になり、デジタル・アシスタントのソフトウェアを作った。2010年にアップルがSiri Incを買収しiOSに組み込んだ。

5.1. ヘビーウェイト(重量)・オントロジー🔝

コンピュータが扱えるようにしたデータを構造化データと呼ぶ。ヘビーウェイトオントロジーでは、人間が知識の記述の方法をしっかり考えてコンピュータで扱えるように構造化する方法。

代表的なものにCycプロジェクトがある。

5.2. Cycプロジェクト🔝

Cycプロジェクトは一般常識をデータベース化することで統計処理ではなく人間の常識に根ざした推論を可能にすることを目指している。名称は「encyclopedia」に由来する。

1984年にMCC社のダグラス・レナートが開始した。人手による入力作業が現在も続けられている。人間の常識がいかに膨大かが窺える。

;ビル・クリントンはアメリカの大統領です。
(#$isa #$BillClinton #$UnitedStatesPresident)

;すべての木は植物です。
(#$genls #$Tree-ThePlant #$Plant)

;パリはフランスの首都です。
(#$capitalCity #$France #$Paris)

5.3. ライトウェイト(軽量)・オントロジー🔝

AIが自動的に情報間の関係性を見つけるアプローチ。人間の関与は必要ない。つまり、AIが非構造データを構造化データに変換する。ウェッブマイニングやデータマイニングで利用されている。

セマンティックWebはウェブページの意味を扱うツールやスタンダードでウェブページの利便性を向上させるプロジェクト。ティム・バーナーズ=リーによって提唱された。XMLXML SchemaRDFRDF SchemaOWLなどから構成されている。コンピュータが自動でウェブサイトのもつ意味やサイト間の関連を理解し、お互いに処理を行えるようになる。

5.4. ワトソン🔝

ワトソンQuestion-Answering(質疑応答)のシステムで、2011年にアメリカのクイズ番組ジョパディーで人間チャンピオンに勝利した。Wikipediaの情報をもとにライトウェイト・オントロジーを生成し、クイズの回答に利用している。

ワトソンは質問の意味を理解しているわけではなく、質問に含まれるキーワードと関連しそうな答えを高速に検索している。

ワトソンは実用レベルになっており、医療診断、人材マッチング、コールセンターなどで活用されている。

5.5. 東ロボくん🔝

2011年から2016年まで続いたプロジェクト。ほとんどの私立大学に合格レベルになった。質問の意味を理解しているわけではなく、読解力に難があり、東大合格は無理との理由から開発が凍結された。



コメントを残す

メールアドレスは公開されません。