第2次AIブームで盛り上がりを見せた「知識表現」に関して:エキスパートシステムとは!?
この記事はこんな人にオススメです
  • G検定を控えている人
  • 人工知能について詳しく知りたい人
  • エキスパートシステムについて詳しく知りたい人

人工知能は2度の冬と3度のブームをくり化して発展しておりますが,今回は第2次ブームのきっかけになった「知識表現」についてまとめていきます.
第1次のAIブームを支えた「探索・推論」に関しては以下です


人工知能の年表を貼っておきます.

エキスパートシステムとは?

エキスパートシステムとは,膨大な専門知識の入ったソフトウェアで,専門家のように問題解決を行うことができるものです.簡単にまとめると以下のようになります.

エキスパートシステムまとめ
  • 1890年代より商用的に使われ始めた
  • 専門家(エキスパート)のような意思決定ができる
  • 特定の分野の問題を解くための,膨大な情報群から構成されるプログラム
  • 膨大な情報はシステムの利用者が提供する
  • ソフトウエアの内側(アーキテクチャ)は,推論エンジンが知識ベース(情報は可変)を使って稼働する
  • 対話型インターフェースも生まれた
ペンのすけ

膨大な情報を持っていると,知識がなくても知識があるっぽく振る舞えるんだね

エキスパートシステムの簡単なアーキテクチャーとしては以下のようになります.

上の絵のように「もし〜ならば,〜である」のような定式のような形で知識をストックしていきます.
このような知識はより専門性が高いところ(例えば医療の分野など)で扱うと,非常に効果的です.

エキスパートシステムの例

いくつかエキスパートシステムで活躍していた有名なものを紹介します.

マイシン(MYCIN):血液中のバクテリア診断支援

マイシンは,1970年代にスタンフォード大学で開発されたエキスパートシステムで,当時はかなり影響がありました.
以下のようなものです.

  • 血液中のバクテリア診断支援する
  • 500質問に答えると,感染した細菌を特定する
  • 抗生物質の処方をする
ペンのすけ

簡単にいうと病気を診断するAIだね!今だとかなり機械による診断には抵抗感があったようで,実際に医療現場では使われなかったらしいよ!

また,ディープラーニング G検定公式テキストによると,マイシンの成績はこのように説明されてます

マイシンは69%の確率で正しい処置をすることができた.
これは感染症の専門医が正しい処方をする確率80%よりも低い水準であるが,専門医ではない医師よりは良い結果だった

DENDRAL:未知の有機化学物を特定する

DENDRALは,1960年代のスタンフォード大学でエドワード・ファイゲンバウムらが開発した人工知能プロジェクトで以下のような特徴があります.

  • 世界初のエキスパートシステム
  • 質量分析法を用いて未知の有機化合物の分析を行う
  • 化学に関する知識ベースを使って,実験データに適合すると考えられる化学構造を絞り出す
ペンのすけ

これを皮切りに,実世界の問題に対する技術を重視した「知識工学」を提唱しているよ!

エキスパートシステムのボトルネック

エキスパートシステムにはたくさんのメリットがあって第2次AIブームを支えましたが,当時では解消できない欠点があり,冬の時代に突入していきます.

エキスパートシステムのボトルネック
  • 専門家やいろんな事例から知識を集めることが大変だった
  • 専門家の知識が定式化できない場合が多い
  • 定式化した専門知識が矛盾していたりする
  • データ数が多いので知識ベースを保守するのが困難
  • 膨大な知識から答えを推論するエンジンの能力が弱い

いろんな問題点がありますが,一番の問題点は,知識を集めることや,その知識をどのような言葉に置き換えるのか,ということが非常に難しいものでした.

ペンのすけ

お医者さんの知識って経験的ですし,暗黙的だもんね!


暗黙知と呼ばれるものですが,その対策として,如何にして上手に知識を聞き出すか,という研究が行われていたようです.

また,コンピュータで知識を扱うための方法論意味ネットワークオントロジー)が研究され出したりもします.

意味ネットワークとは,人間にとって直感的にわかりやすい形で知識を整理した表現方法の一種です.
モデルは,人間の記憶のメカニズムを模した模したものですね.
概念の関係をラベル(継承,属性)で紐づけてネットワークを構築したものです.

また,オントロジーというものは,元々は哲学用語で存在論という意味ですが,AIの世界では「概念化の明示的な仕様」と定義されることがありあます.
つまり,扱う知識や情報の意味や構造をしっかりと定義しましょう!ということです.

オントロジーの利点は,知識の共有可能の他にも以下の利点があります.

  • 単語検索の際に,似た意味の言葉を一緒に検索できる
  • 複数のコンピュータで自動的に情報交換ができる

こういった利点が根本になっていて,データマイニングが動いています.
実用では,例えばIBMが開発した「ワトソン」や,東大入試合格を目指す「東ロボくん」などが生まれました.
(東ロボくんは,2016年に開発がストップしてますが,知識のストックだけではなく,読解力をテクノロジーで扱えるようになると実用化が見えてくると思います)

人工知能の第2次ブーム「知識」に関してはこのくらいにして,次回は「機械学習編」に入っていくのでお楽しみに!

以下は人工知能の勉強の時にオススメの一冊です.

G検定対策ならこちら!