A.現在の人工知能は、音声を認識することができる
B.現在の人工知能は、データをその特徴にしたがって分類することができる
C.現在の人工知能は、タスクの目的自体を理解した上での自律的
な判断を行うことができる
D.現在の人工知能は、データをもとにした数値予測を行うことが
できる
P14
人工知能(AI: Artificial Intelligence)は、人間の知能が必要とされるタスクを実行できる機械(コンピュータや情報処理システムなど)を実現するコンピュータサイエンスの一分野です。AIは大量のデータを処理し、パターンや関係性を抽出します。
試験対策:
人工知能の定義と、現時点で可能なこと・不可能なことを整理しておく。
A. AI効果とは、AIが普及することで、AIではなく人間にしかできないようなことや、本来の人間らしさといった特性こそが重要であると感じる心理効果のことである
B. AI効果とは、AIが実現しているのは自動化などの単純な処理であり、知能によるものではないと考える心理効果のことである
C. AI効果とは、周囲からの期待や関心があることで、人工知能のパフォーマンスを高く評価してしまう心理効果のことである
D. AI効果とは、AIロボットの容姿や動き、音声などが人間に非常に近くなることで、違和感や恐怖などの感情が芽生える効果のことである
AI効果の意味を問う問題です。
人間は、AIで実現された技術に対し「AIが実現しているのは単純な処理であり、知能による処理ではない」と考える傾向があります。このような心理効果をAI効果と呼びます(B)。
「AI効果」 という語に、以下のような意味は含まれません。
- AIではなく人間にしかできないようなことや、本来の人間らしさといった特性こそ重要であると感じる心理効果(A)
- AIのパフォーマンスを高く評価してしまう心理効果(C)
- AIロボットの容姿や動き、音声などに違和感や恐怖などの感情を抱く心理効果(D)
「AI効果」という言葉からは意味が連想しにくいため、まずは心理効果であることを押さえ、次いでどのような心理効果であるかを理解しておきましょう。
A. 子供が学校で習うような簡単な代数の問題
B. チェスやオセロなどのようにルールや設定が決まっている問題
C. ハノイの塔など簡単な手続きで解くことができる問題
D . 特定の専門知識が必要な領域についての質問に回答する問題
第一次AIブームにおいて解くことができたトイ・プロブレム (Toyproblem: おもちゃの問題) に関する知識を問う問題です。
1956年のダートマス会議以降、探索・推論を行うアルゴリズムによってダスクを解く人工知能が台頭しました。この時期 (1950年代後半~1960年代) は、実際に迷路やチェスなどのゲームや 「ハノイの塔」に関する手数の推論、 簡単な代数の定理証明などが行われ、第一次AIブームと呼ばれています。ところが、第一次AIブームでAIと呼ばれたプログラムが解ける問題はかなり限定的であり、それらはトイ・プロブレムと呼ばれました。
子供が解くような代数や幾何の問題の一部は、当時のプログラムで解くことができました(A)。
また、当時のプログラムは、チェスやオセロ、迷路などのようにルールや設定が決まっている問題については、それほど手数を必要としない問題であれば扱うことができました(B)。
ハノイの塔は、大きさの違う円盤を、あるポールから別のポールに大小関係を保ったまま移動させるパズルです。ハノイの塔は簡単な再帰的アルゴリズムで解くことができ、当時のプログラムで扱うことができました(C)。
特定の専門領域に関する質問に答える問題は、第二次AIブームにおけるエキスパートシステムによって扱えるようになりました(D)。
第一次AIブームでどのような研究が行われたのかを整理し、トイ・ プロブレムの例を答えられるようにしておきましょう。
A. シンボルグラウンディング問題
B. 次元の呪い
C. 知識獲得のボトルネック
D. フレーム問題
フレーム問題についての理解を問う問題です。
AIが抱える本質的な課題に、フレーム問題があります。人間は何か問題を解決するときに、その問題に関連する考慮すべき事柄を、無意識に選択して抽出していきます。それは無限にある可能性からの探索であり、AIが同様のことを行うのは非常に困難です。このような問題をフレーム問題といいます (D)。フレーム問題は、人間と同様の知能を持つ汎用的なAIの実現を妨げる大きな要因です。
シンボルグラウンディング問題とは、1990年に認知科学者のスティーブン・ハルナッド (Stevan Harnad) によって提示された、記号(シンボル)とその対象を結び付けることが可能なのかを論じる問題です(A)。
また、次元の呪いは、次元の増加に伴って計算量などが指数的に増加する現象です(B)。
知識獲得のボトルネックとは、コンピュータが知識を獲得することの難しさを表した用語です(C)。
フレーム問題の内容について説明できるようにしておきましょう。
A. 強いAIは正確な将来予測ができるが、弱いAIは正確な将来予測ができない
B. 強いAIは深層学習モデルによって構築されるが、弱いAIは統計モデルによって構築される
C. 強いAIは人間のような自意識を持って総合的な判断ができるが、弱いAIは特定のタスクのみを処理することに特化している
D. 強いAIの例として敵対的生成ネットワークのような画像生成AIが、弱いAIの例としてGoogLeNetのような画像認識AIがあげられる
強いAIと弱いAIの違いについての理解を問う問題です。
「強いAI」 「弱いAI」は、もともとはアメリカの哲学者ジョン・サールによって用いられた用語です。ジョン・サール自身は、人間の意識や心の研究の文脈で、「人間の認知機能を正確に再現 (説明) したAI」を「強いAI」、そうでない、単なる道具としてのAIを「弱いAI」 と定義しました。現在では、これらの語は、AI研究の文脈の中で、以下のようにより広い意味で使用されています。
「強いAI」とは、人間と同様に心や自意識を備え、総合的な判断ができるAIです。一方、「弱いAI」とは、特定のタスクを処理することに特化したAIです。
弱いAIは、人間のような心や自意識は持っていませんが、特定の領域であれば、 人間と同じような問題解決ができます(C)。現時点では、世の中で稼動しているAIはすべて弱いAIに該当しており、強いAIはまだ実現されていません。
予測精度は、強いAI・弱いAIの議論とは無関係です(A)。
また、深層学習モデルや統計モデルなどの技術は、強いAI・弱いAIの議論とは無関係です (B)。
画像生成や画像認識【第6章 解答9を参照] などのタスク種別は、強いAI・ 弱いAIの議論とは無関係です(D)。
現在活用されているAIはすべて弱いAIで、強いAIはまだ実現していない点を理解しておきましょう。
機械翻訳とは、言語間の翻訳を自動化する技術である。1970年代後半は(ア) 機械翻訳が主流であったが、1990年代以降は (イ) 機械翻訳が主流となった。しかし、(イ) 機械翻訳では一般常識をうまく扱うことができず、このことは知識獲得の (ウ) と呼ばれた。近年では、深層学習によるニューラル機械翻訳が誕生し、機械翻訳の性能が大きく向上してきている。
A. (ア) ルールベース / (イ) コーパス / (ウ) レイテンシ
B. (ア) エキスパート / (イ) コーパス / (ウ) レイテンシ
C. (ア) エキスパート / (イ) 統計的 / (ウ) ボトルネック
D. (ア) ルールベース / (イ) 統計的 / (ウ) ボトルネック
機械翻訳技術の歴史と用語について問う問題です。
機械翻訳の主流となる技術は、ルールベース機械翻訳から統計的機械翻訳、 ニューラル機械翻訳へと変遷してきました(ア、イ)。
統計的機械翻訳の精度向上には、人間の一般常識に関する膨大な対訳データと、それらを知識として獲得できるコンピュータが必要です。しかし、これらを実現することは難しく、知識獲得のボトルネックと呼ばれています(ウ)。 ところが、近年登場したニューラル機械翻訳は、深層学習 (ディープラーニング) [第2章 解答14を参照]により翻訳精度を飛躍的に高めることができ、 知識獲得のボトルネックを超えつつあると注目されています。
以上のことから、(ア)にはルールベース、(イ)には統計的、(ウ)にはボトルネックが当てはまります (D)。
れぞれの機械翻訳について、登場した順番だけでなく、ペースとなっている技術の違いについても理解しておきましょう。
ニューラル機械翻訳では、ディープラーニングを用いて単語の生起確率を学習することによって訳文を生成します。グーグルが提供している「Google翻訳」 サービスでは、2016年からニューラル機械翻訳の技術が採用されています。これにより機械翻訳の質が大きく向上し、話題となりました。
A. 同じコンピュータをもう1つ用意し、コンピュータ同士での会話がどの程度成立するかを評価する
B. 人間の審査員に相手がコンピュータであることを伏せて対話させ、対話の相手が人間であると思わせることができるかを評価する
C. 人間とコンピュータに同じ問題を解かせて、正解率が同じくらいかどうかを評価する
D. コンピュータが作成した長い文章を人間の審査員に読んでもらい、その文章表現の人間らしさを評価する
チューリングテスト (Turing test) について問う問題です。
チューリングテストは、アラン・チューリング (Alan Turing) によって考案された、コンピュータが人工知能かどうかを判定するためのテストです。 1991年以降、チューリングテストによる評価を競う 「ロープナーコンテスト」 というイベントが毎年開催されています。
チューリングテストでは、知能の有無をそのコンピュータ内部のメカニズムから判定することは極めて難しいため、外から観察できる行動から判断するという立場をとります。具体的には、人間の審査員に相手がコンピュータであることを伏せて対話させ、どの程度の割合でそれを判定できるかを調べます。そして、審査員がコンピュータと人間を区別できなかった場合に、そのコンピュータはテストに合格したとみなされます(B)。
以下の記述は、チューリングテストの具体的な方法の説明としては不適切です。
- コンピュータを2つ用意して、コンピュータ同士での会話がどの程度成立するかを評価する (A)
- 人間とコンピュータに同じ問題を解かせて、正解率が同じくらいかどうかを評価する (C)
- コンピュータが作成した文章を人間の審査員に読んでもらい、その文章表現の人間らしさを評価する (D)
チューリングテストの発案者、目的、具体的な方法をセットで覚えておきましょう。