1.

以下の記述を読み、空欄に入る語句の組み合わせとして、最も適切なものを選べ。

Society 5.0 は、() の第5期科学技術基本計画 (2016〜2020年) のキャッチフレーズである。Society 5.0 は、現実空間と () を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立させる人間中心の社会を実現するための概念である。

A. (ア)米国  (イ)AI 技術
B. (ア)中国  (イ)AI 技術
C. (ア)ドイツ (イ)仮想空間
D. (ア)日本  (イ)仮想空間


校正レポート

変更点ログ

要確認リスト



1. D

データや AI を取り巻く近年の日本の政策動向に関する問題です。

Society 5.0は、内閣府によって策定された第5期科学技術基本計画(2016~2020年)のキャッチフレーズです。Society 5.0では、現実空間(フィジカル空間)仮想空間(サイバー空間)$^{\text{※}}$を高度に融合させたシステムにより、経済発展社会的課題の解決を両立する人間中心の社会を目指しています(D)。この Society 5.0は、狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く概念として提唱されました。
※ ここでは、インターネットなどのコンピュータやネットワークに支えられた空間を指す。

Society 5.0において、AI技術は基盤技術の1つに位置付けられています。内閣府は、仮想空間に集積された現実空間の膨大な情報(ビッグデータ)をAIによって解析し、それを現実空間にフィードバックすることで新たな価値を生み出すことができる社会をデータ駆動型社会と定義しています。

Society 5.0を実現するためには、現実空間と仮想空間の間で情報をやりとりする基盤としてのIoT技術が不可欠です。IoT(Internet of Things:モノのインターネット)は、家電や自動車、建築物、工場の生産設備といった、情報通信機器(PCやスマートフォンなど)以外の身の回りのモノがインターネットに接続されることによって、相互に情報を交換できるようになる仕組みです。IoTをコアとして現実空間と仮想空間が相互連関し、より高度な社会を実現していく仕組みをCPS(Cyber-Physical System)といいます。IoTによるモノのデジタル化/ネットワーク化によってCPSがさまざまな産業に適用され、付加価値を獲得したデータが現実世界を動かしていきます。

試験対策
Society 5.0において、AI技術がどのように関わっているのかを確認しておきましょう。また、Society 5.0によって実現される社会がどのようなものであるかも、併せて覚えておきましょう。


校正レポート

変更点ログ

要確認リスト



2.

構造化データ非構造化データに関する記述として、最も適切でないものを選べ。

A. Excelに代表される表計算ソフトでは、の概念によってデータを管理する。このようなデータは構造化データと呼ばれる
B. JSONXML のような形式で記述されたデータは行や列の概念をもたないため、非構造化データである
C. コンピュータに取り込まれた文章・画像・動画・音声のデータは、通常、非構造化データとして扱われる
D. 構造化データから情報を抽出することは、一般に、非構造化データから情報を抽出することよりも容易である


校正レポート

変更点ログ

要確認リスト



2. B

構造化データと非構造化データの違いに関する問題です。

構造化データは、行と列などのように何らかの構造が定義されているデータのことを指します。Excelや各種RDB(関係データベース)で扱われるデータは、構造化データです(A)。
JSONXMLといったデータフォーマットは、行と列の概念をもちませんが、データを管理する形式が定められています。したがって、データの形式を「構造化データ」と「非構造化データ」の2つに分ける場合、JSONやXMLは構造化データに分類されます(B)。ただし、文献によっては、行と列の概念をもったデータと区別するために、「半構造化データ」と呼ばれることもあります。
JSONとXMLの特徴を以下に示します。本試験では、これらのデータ形式の違いが問われる可能性があるので、違いを押さえておきましょう。

● JSON

JSON(JavaScript Object Notation)は、JavaScriptオブジェクトに似た構文によって構造化されたテキストフォーマットです。JavaScriptに限らず、さまざまなプログラミング言語において構造化データの記述に用いられます。JSON形式のデータは、主に、Webアプリケーションでデータを転送する際に用いられます。似た用途で用いられるデータフォーマットとして、後述するXMLがあります。JSONは、XMLと比べると、構造化されたデータをより簡潔に記述できるため、人間が記述および理解しやすいフォーマットといえます。

【例】 JSONの例
json { "foods": { "food": [ { "name": "イチゴ", "color": "赤" }, { "name": "ミカン", "color": "黄" } ] } }

● XML
XML(eXtensible Markup Language)は、文書の構造を定義するマークアップ言語によって記述されます。XMLは、JSONに比べて文書に付加できる情報量が多いため、やや表現力が高いデータフォーマットといわれています。しかし、XMLはタグで囲まれたデータフォーマットを用いるため、処理対象のデータの容量が大きくなるというデメリットがあります。

例 XMLの例

<?xml version="1.0" encoding="UTF-8" ?>
<foods>
  <food>
    <name>イチゴ</name>
    <color>赤</color>
  </food>

  <food>
    <name>ミカン</name>
    <color>黄</color>
  </food>
</foods>

非構造化データは、データ構造が定義されていないデータのことを指します。画像や音声、動画、文章などの実世界において直接得られるデータの多くは、通常、非構造化データとして扱われます(C)。非構造化データは、構造化データに比べ、情報を抽出することが難しいデータであるといえます(D)。例えば、街の風景写真の中から車の情報だけを取り出すといった作業について考えてみても、構造化されたデータから情報を抽出することに比べて遥かに困難であることがわかります。

試験対策
構造化データと非構造化データの違いと、JSONとXMLの違いを覚えておきましょう。

参考
JSONやXMLは、Web APIを用いてデータを受け渡す際のフォーマットとして広く利用されています。Web APIが利用され始めた当時は、XMLでデータの送受信を行うことが一般的でしたが、現在ではJSONが広く用いられています

10_127_2


校正レポート

変更点ログ

要確認リスト



3.

以下の記述を読み、空欄に入る語句の組み合わせとして、最も適切なものを選べ。

高度情報通信ネットワーク社会推進戦略本部は、無償で利用可能であり、機械判読に適した、( ア )なデータのことをオープンデータと定義した。
( イ )は、日本政府の各府省が公表する統計情報の閲覧・検索・利用が可能なWebサイトであり、独立行政法人統計センターによって運営されている。( イ )によって提供されているデータは、高度情報通信ネットワーク社会推進戦略本部が定義するオープンデータに該当する。

A. (ア)営利目的・非営利目的を問わず二次利用が可能
(イ)RESAS
B. (ア)営利目的・非営利目的を問わず二次利用が可能
(イ)e-Stat
C. (ア)非営利目的に限って二次利用が可能
(イ)RESAS
D. (ア)非営利目的に限って二次利用が可能
(イ)e-Stat


校正レポート

変更点ログ

要確認リスト



3. B

オープンデータの定義に関する問題です。

高度情報通信ネットワーク社会推進戦略本部は、次のいずれの項目にも該当するかたちで公開されたデータをオープンデータと定義しています。

  1. 営利目的、非営利目的を問わず二次利用が可能なルールが適用されたもの(A、B)
  2. 機械判読に適したもの
  3. 無償で利用できるもの

この定義はあくまでも1機関によるものであり、国際的に「オープンデータの定義」が厳密に取り決められているわけではありません。したがって、これらの条件を満たしているデータであっても、必ずしもオープンデータとはいえない場合があることに注意してください。

政府や地方自治体からは多数のオープンデータが公開されています。e-Stat(イースタット、https://www.e-stat.go.jp/)は、日本政府の各府省が公表するさまざまな統計情報の閲覧・検索・利用が可能なWebサイトであり、総務省所管の独立行政法人統計センターによって運営されています(B、D)。RESAS(リーサス、https://resas.go.jp/)は、産業構造や人口動態などに関するデータを地図上に可視化できるWebサイトで、内閣官房と経済産業省によって運営されています(A、C)。

以上より、組み合わせが適切な選択肢Bが正解です。

なお、官公庁以外の組織によって公開されているオープンデータも多数存在します。有名なものとしては、画像認識分野のベンチマークによく用いられる手書き数字データセットMNIST(エムニスト)が挙げられます。MNISTは、アメリカ商務省配下の国立標準技術研究所(National Institute of Standards and Technology)によって作成・公開されています。このほか、青空文庫というWebサイトで提供されているテキストデータもオープンデータです。青空文庫では、著作権が消滅した文芸作品などを公開しています。

● MNIST

MNIST(Mixed National Institute of Standards and Technology database)は、最もよく知られた手書き数字画像のオープンデータセットです。画像認識を目的とした機械学習のチュートリアルでよく用いられます。MNISTには、60,000枚の訓練用データと10,000枚のテスト用データからなる計70,000枚の画像データと、それらの画像に付加された正解ラベルが含まれています。

画像は $28 \times 28$ ピクセルからなる正方形で、各ピクセルには白(0)〜黒(255)までの色情報が記録されています。

【MNISTの画像例】

● 青空文庫 (https://www.aozora.gr.jp/)
青空文庫は、著作権が消滅した作品や、自由に配布することを権利者が許可した著作物を提供しているWebサイトです。青空文庫には、夏目漱石や森鴎外、芥川龍之介、宮沢賢治といった日本国内の作家の作品のほか、エドガー・アラン・ポーやアーサー・コナン・ドイルといった海外の作家の作品も収録されています。収録作品の多くは、上に挙げたような文学作品ですが、アルベルト・アインシュタインのような、自然科学分野で活動した人物の著作も収録されています。

参考
ここでは、高度情報通信ネットワーク社会推進戦略本部によるオープンデータの定義を紹介しましたが、オープンデータという用語の定義は組織や団体などによって異なります。この点に注意してください。


校正レポート

変更点ログ

要確認リスト



4.

以下の記述を読み、空欄に入る語句の組み合わせとして、最も適切なものを選べ。

)は、ドイツ政府によって打ち出された産業改革プロジェクトである。2016年3月に策定された( )において、( )は注力すべき目標として掲げられている。

A. (ア)テクノロジー 4.0
(イ)AI国家戦略
B. (ア)ブレイクスルー 4.0
(イ)AI国家戦略
C. (ア)イノベーション 4.0
(イ)デジタル戦略 2025
D. (ア)インダストリー 4.0
(イ)デジタル戦略 2025


校正レポート

変更点ログ

要確認リスト



4. D

データやAIを取り巻く近年のドイツの政策動向に関する問題です。

インダストリー4.0第4次産業革命の意)は、ドイツ連邦政府が打ち出した製造業のオートメーション化・データ化・コンピュータ化を目指す技術的コンセプトです。2016年3月に、ドイツの経済・エネルギー省は、ドイツがデジタル化を進めていくために2025年までに取り組むべき施策をまとめたデジタル戦略2025を発表しました。デジタル戦略2025において、インダストリー4.0は、注力すべき目標の1つとして掲げられています。インダストリー4.0の中で、AI技術は、ドイツのイノベーションを支える重要技術の1つとして位置付けられています。
以上より、組み合わせが適切な選択肢Dが正解です。

ドイツのスポーツ用品企業アディダスのスピードファクトリーは、インダストリー4.0のコンセプトに基づいてつくられた工場の代表的事例です。スピードファクトリーでは、自動化と生産設備のIoT化によって、短時間で多品種の物品を生産することを目的としていました。アディダスは、2020年にこれらの工場を閉鎖しました。

選択肢中のAI国家戦略は、2018年に同じくドイツによって公表されました。AIを社会に取り込み、ドイツの国際競争力を維持することなどを目標としています。

試験対策
インダストリー4.0において、AI技術がどのように関わっているのかを確認しておきましょう。


校正レポート

変更点ログ

要確認リスト



5.

以下の記述を読み、空欄アに入る語句として、最も適切なものを選べ。

画像データにおける写真の被写体を表すラベルやファイルの作成年月日など、データそのものを説明する付加的な情報を( ア )という。

A. 一次データ
B. メタデータ
C. 構造化データ
D. 二次データ

校正レポート

変更点ログ

要確認リスト



5. B

メタデータに関する問題です。

画像データにおける各ピクセルの色情報や、音声データにおける音声信号の情報といった「データそのもの」は、実体などと呼ばれます。これに対し、写真の被写体を表すラベルや、音声データに記録された楽曲のタイトルなど、データを説明する情報をメタデータといいます(B)。ファイル名や作成年月日、作成者といった、データの属性(データの状態や性質を説明する付属的な情報)もメタデータです。

【実体とメタデータの関係の例】

データの実体に対してさまざまな種類のメタデータを付加することには、次のような利点があります。

  1. 検索性が向上する
    実体に対してメタデータを付加することで、データの検索性が向上します。例えば、メタデータが付加されていない複数の動物の写真(画像データ)があるとします。この中から犬の写真を探し出す場合、個々の画像データを目で見て確認する必要があります。しかし、この画像データに対して、被写体の情報(テキストのメタデータ)が関連付けられていれば、メタデータに対して検索をかけることで、犬が写っている写真を簡単に探し出すことができます。

  2. さまざまな角度からデータの性質をとらえられる
    データに付加された更新日や利用頻度といったメタデータから、そのデータの重要度を推し量ることができます。このように、メタデータが付加されたデータからは、そのデータの実体だけでは入手できない情報や価値が得られます。

  1. セキュリティを担保できる
    変更履歴や更新日、変更した人物といったメタデータを付加しておくことで、そのデータに対して行われた変更の内容や、責任の所在を追跡することができます。これにより、データに対するセキュリティを向上させることができます。

選択肢Cの構造化データについては解答2、A、Dの一次データ、二次データについては解答6を参照してください。

試験対策
実体にメタデータを付加する利点を説明できるようにしておきましょう。


校正レポート

変更点ログ

要確認リスト



6.

一般に、「独自に収集したデータ」一次データ「公開/販売されているデータ」二次データと呼ばれる。一次データ、二次データに関する記述として、最も適切でないものを選べ。

A. Webクローリングによってインターネット上から得られたデータは、公開されている情報に基づくデータであるため、二次データである
B. e-Stat で公開されている日本政府の各府省が収集する統計情報は、ダウンロードして利用した場合、二次データである
C. 一次データは自分たちで独自に収集するデータであるため、調査目的に即した形で収集しやすい
D. 一般に、一次データを収集する場合にかかる時間や労力は、二次データを収集する場合に比べて大きい


校正レポート

変更点ログ

要確認リスト



6. A

データの入手方法に関する問題です。

データは、「独自に収集したデータ」と「公開/販売されているデータ」に大別されます。
独自に収集したデータを一次データといいます。一次データの利用に際しては、データを必要な形で収集できるため、データの内容や形式を調査目的と一致させやすいという利点があります(C)。しかし、一次データを収集するには、アンケート調査Webクローリング(インターネット上に公開されているテキスト・画像・動画などの情報をプログラムやツールを用いて自動で収集すること)などが必要となります。このため、一次データの収集にかかる労力は、二次データの場合に比べて大きくなる傾向があります(D)。

一次データに対し、「公開/販売されているような自ら収集したものではないデータ」を二次データといいます。二次データのメリットとして、収集に時間がかからないこと自分たちでは収集できない範囲の情報をカバーできることなどが挙げられます。しかし、二次データは他者が収集したデータであるため、自分たちの調査目的にデータが合致しているとは限りません

e-Statで公開されているデータは、日本政府の各府省が収集したものなので、二次データに該当します(B)。e-Statで公開されているデータはオープンデータ(解答3参照)の定義にも当てはまります。この定義から、オープンデータは二次データにあたります。

インターネット上からWebクローリングによって得られたデータは、インターネット上に点在しているデータを自分たちで収集したデータといえるため、一次データです (A)。

【一次データと二次データの特徴】

一次データ 二次データ
収集方法 独自に収集 他者が収集
調査の自由度 高い 低い
収集できる情報の範囲 狭い(組織規模や用意できる収集方法に依存) 広い(企業や単体の組織では収集できない範囲の情報を得られる)
競合他社 利用できない 利用できる
収集にかかる労力 大きい(独自に収集) 小さい(対価を支払えばすぐに使える)
調査目的との一致 一致する 必ずしも一致しない

試験対策
一次データと二次データそれぞれを利用する際のメリットとデメリットを理解しておきましょう。また、これらの概念、ならびにオープンデータとの使い分けについても覚えておきましょう。
また、こうしたデータの入手・生成元には、アンケートなどの調査で得たデータ(調査データ)や実験によって得られたデータ(実験データ)、人の行動ログ、機械の稼働ログなどさまざまな種類があることを覚えておきましょう。


校正レポート

変更点ログ

要確認リスト



7.

機械学習を適用するタスク案を以下に示す。2025年時点において、最も実現性が低いものを選べ。

A. ロボットによって人間の作業や活動を代替する
(例:倉庫内でのフォークリフトの運転を自動・無人で行う)

B. 実在しない人物の顔写真やキャラクターなどの画像データを新規に生成する
(例:実在しないアイドルの顔写真を自動生成する)

C. 人間が抱える課題を定義し、その課題を解決するための手段を提示する
(例:自ら提起した社会的な問題に対し、Web上から情報を収集して解決法を提示する)

D. 人間による計画や判断を、データに基づいて支援する
(例:Web広告の費用対効果が最大化するような各広告施策への予算配分を予測する)


校正レポート

変更点ログ

要確認リスト



7. C

機械学習の活用領域に関する問題です。

2025年時点において機械学習を適用しやすい活用領域を以下に示します。
下表における「活用領域」は、DS検定の出題範囲を構成する資料の1つである「数理・データサイエンス・AI(リテラシーレベル)モデルカリキュラム」内の「1-3. データ・AIの活用領域」において定義されています。下表はそれらの「活用領域」について簡単に説明し、社会における活用例を挙げたものです。

【データ・AIの活用領域】

活用領域 内容
仮説検証 仮説が正しいか否かについて、事実情報に基づいた実験・観察等を通じて確かめる 過去の購買実績データを用いて「ある商品$A$は30代男性によく使ってもらえるのではないか」という仮説を検証する
知識発見 データを分析することによってさまざまな知見を得る 市場や製品に関する予備知識が浅いなどの理由で仮説を立てることが困難な場合に、過去のデータの分布やデータ同士の関係性を可視化する
原因究明 「なぜそのようなデータが得られたのか?」という原因を探る あるスーパーマーケットの購買実績データを見たところ、ビールとおむつが一緒に購入されるケースが多かったとする。このデータを分析して原因究明を行ったところ、「母親が父親におむつを買うよう頼み、来店した父親はついでに缶ビールを購入している」という知見が得られた
計画策定/判断支援 データに基づいて計画や判断を行う 広告の CPA (Cost Per Acquisition顧客獲得単価)が最小になるような(費用対効果が最大になるような)各広告施策への予算配分を予測する (D)
活動代替 従来人間がやらなければならなかった作業を代替する 倉庫内でのフォークリフトの運転を自動・無人化し、物流の効率を上げる (A)
新規生成 実在しない人物の顔写真やキャラクターなどの画像データを新規に生成する 実在しない人物の顔写真やキャラクターなどの画像データを、機械学習を用いて新規に生成する (B)

<図17_131_1--->
図17_131_1
<--->

2025年時点での機械学習技術では、人間が抱える課題を自律的に定義し、さらにその課題を解決するための手段を提示するといったことは困難です (C)。

試験対策
現在、データやAIが世の中でどのように利用されているか、例とともに覚えておきましょう。

参考
データやAIにはさまざまな活用方法があり、研究開発、調達、製造、物流、販売、マーケティング、サービスなど、多種多様な分野で活用されています。各分野の代表的な活用事例を知っておくことで、実際のビジネスでどのように活用されているかイメージしやすくなります。
AIの活用方法の1つとして、近年、予測的データ分析に期待が寄せられています。予測的データ分析とは、データから得られる知見を用いて近い将来に何が起きるかを予測することです。
予測的データ分析の例として、機械の故障予測が挙げられます。工場の製造機械にIoTデバイスを取り付け、故障の履歴や経年劣化のデータを収集します。このようにして得られたデータに対して予測的データ分析を行うことで、機械が故障する予兆を検知し機械の故障を未然に防ぐことができます。
このほかに、シェアリングエコノミー(インターネットを介して個人間でモノや場所、技能などを貸し借りするサービス)の利用者同士のマッチングや、レコメンデーション(ECサイトなどにおいて顧客の好みを反映した商品を推薦すること)などにも AI が活用されています。


校正レポート

変更点ログ

要確認リスト



8.

近年起きているITに関わる社会の変化についての記述として、最も適切でないものを選べ。

A. ディープラーニングの登場をきっかけに、人工知能技術が社会的に広く認知されるようになったことが、第三次AIブームを後押しした
B. PCやスマートフォンといったデバイス以外にも、家電や自動車、建築物などのさまざまなモノ同士がインターネットによってつながるIoT (Internet of Things) が普及しつつある
C. インターネットに接続可能なデバイスの普及によりビッグデータが容易に収集可能となったことで、機械学習を用いたAIの開発が活発化した
D. サポートベクターマシンの登場により、人間には見つけにくいパターンをデータの中から発見できるようになったことが、第三次AIブームを後押しした

<図05_001_1--->
図05_001_1
<--->


校正レポート

変更点ログ

要確認リスト



8. D

AIビッグデータIoTを取り巻く社会の変化についての問題です。

AIビッグデータIoTなどの技術発展に伴い、社会に次のような変化が起こりました。

1. 計算資源の高性能化によるデータ処理の高速化

近年、GPGPU(General-Purpose computing on Graphics Processing Units)などの計算資源の高性能化に伴い、膨大な量のデータ(ビッグデータ)を短時間で処理することが可能になりました。また、ディープラーニングに関する技術が発達したことにより機械学習を用いたAIの学習にか

かる時間が短縮されたことも、第三次AIブームを後押ししました(A)。

2. IoTデバイスの普及による現実空間の情報の収集

IoT(Internet of Things:モノのインターネット)は、家電や自動車、建築物、工場の生産設備といった、情報通信機器(PCやスマートフォンなど)以外の身の回りのモノがインターネットに接続される仕組みのことです。こうした仕組みをもつ機器はIoTデバイスと呼ばれます。IoTデバイスの普及により、膨大な現実世界の情報収集・蓄積することが可能になりました(B)。

3. インターネットの普及によるデータ量の増加

PCやスマートフォンなどのインターネットに接続できるデバイスが普及したことで、2000年代後半ごろから、世界中に流通するデータ量が爆発的に増加しました。こうしたデータを集積することで、巨大で複雑なデータの集合であるビッグデータが形成されるようになりました。計算機の性能向上によって、ビッグデータを使ってAIを学習させることができるようになり、AIの性能も飛躍的に向上しました(C)。

人間には見つけにくいパターンをデータの中から発見するパターン認識は、1960年代ごろから長年研究されてきた技術です。2000年代以降再び注目されている機械学習技術も、パターン認識に関する研究から生まれました。第三次AIブームを後押ししているのは、サポートベクターマシンではなく深層学習(ディープラーニング)です(D)。

【試験対策】
AIビッグデータIoTという3つのトレンドの関係を覚えておきましょう。

【参考】
AIビッグデータIoTなどとともによく登場する用語として、ロボットが挙げられます。AIロボットという用語は、しばしば混同されて用いられます。
ロボットは、自動作業を行う機械全体を指す用語です。このため、ロボットの定義の中にはロボットの身体的な要素が含まれます。一方、AI知的な処理能力を機械にもたせる技術分野を指します。このため、AIの定義の中には身体的な要素は含まれません。
ロボットの頭脳(知的な処理を担う部分)はAIの分野で扱われます。しかし、AIではロボットの頭脳だけを扱う技術分野ではなく、機械によるその他の知的な処理能力全般を担います。


校正レポート

変更点ログ

要確認リスト



9.

以下の記述を読み、空欄ア〜ウに入る語句の組み合わせとして、最も適切なものを選べ。

(ア)は 2014年に提案された深層学習モデルである。(ア)では、ランダムなベクトルを入力として受け取りデータを生成する(イ)と、入力として受け取ったデータが真の学習データから入力された本物か、あるいは(イ)が作った偽物かを判別する(ウ)が、競い合うようにして学習が進む。

A. (ア)VAE
(イ)ディスクリミネータ
(ウ)ジェネレータ

B. (ア)VAE
(イ)ジェネレータ
(ウ)ディスクリミネータ

C. (ア)GAN
(イ)ジェネレータ
(ウ)ディスクリミネータ

D. (ア)GAN
(イ)ディスクリミネータ
(ウ)ジェネレータ


校正レポート

変更点ログ

要確認リスト



9. C

GANに関する問題です。

出力データの分布(出力データの生成規則)だけでなく、入力データの分布(入力データの生成規則)もモデル化したモデルを生成モデルといいます。生成モデルでは通常、推定された入力データの分布を用いて新しいデータを生成します。近年、生成モデルの性能は著しく向上し、本物のように自然な画像や文章を生成できるようになりました。

深層学習を利用して構築される生成モデルは、深層生成モデルと呼ばれます。深層生成モデルの例として、VAEGANが挙げられます。
VAE (Variational AutoEncoder) は、2013年に提案された生成モデルです。VAEは、オートエンコーダというネットワークを確率モデル化し、未知のデータを確率的に作成できるようにしたものです。オートエンコーダは、入力した情報を圧縮して出力するといった目的で利用されます。VAEは日本語では変分自己符号化器と呼ばれ、画像の生成などに利用されます。
GAN (Generative Adversarial Network) は、2014年に提案された生成モデルです。GANは、日本語では敵対的生成ネットワークと呼ばれます。GANでは、ランダムなベクトルを入力として受け取りデータを生成するジェネレータ(生成器)と、入力として受け取ったデータが本物か、あるいはジェネレータが作った偽物かを判別するディスクリミネータ(識別器)という2つのネットワークが、競い合うようにして学習が進みます。ジェネレータとディスクリミネータの競争的な関係の中で学習が進むため、「敵対的(adversarial)」という言葉が用いられています。GANが従来の生成モデルより自然な画像を生成できるようになったのは、この仕組みによるものです。

【GANによる学習の仕組み(概念図)】

2014 年に GAN が発表されてから、GAN を改良したさまざまなモデルが開発されました。例えば、2015 年に提案された DCGAN (Deep Convolutional GAN) では、ジェネレータとディスクリミネータに畳み込みニューラルネットワーク (CNN) を採用しており、オリジナルの GAN と比べると、より自然な画像の生成に成功しています。

以上より、組み合わせが適切な選択肢Cが正解です。


校正レポート

変更点ログ

要確認リスト



10.

以下の記述を読み、空欄ア〜ウに入る語句の組み合わせとして、最も適切なものを選べ。

強化学習は、「行動を学習する仕組み」を作り出す手法である。強化学習では、ある環境下における( ア )の総和を( イ )するような行動が学習の対象となる。強化学習において仮定される「遷移先の状態は、直前の状態とそこでの行動にのみ依存する」という性質は( ウ )と呼ばれる。

A. (ア)報酬
(イ)最大化
(ウ)マルコフ性

B. (ア)報酬
(イ)最小化
(ウ)エルゴード性

C. (ア)損失
(イ)最大化
(ウ)移動不変性

D. (ア)損失
(イ)最小化
(ウ)独立性


校正レポート

変更点ログ

要確認リスト



10. A

強化学習に関する問題です。

強化学習は、ある環境下で、報酬を最大化する方策を獲得することを目的とした手法です(空欄ア、イ)。機械が報酬を最大化するために自ら行動を変えていく(=学習していく)点が、教師あり学習教師なし学習といった他の機械学習手法と大きく異なる点です。ここでいう報酬とは、機械が選んだ選択肢に対する評価を指します。
強化学習はロボットの自動制御などに利用されます。

強化学習では行動の主体のことをエージェントと呼びます。エージェントの行動により何らかの影響を受けるものを環境と呼びます。エージェントが行動すると環境の状態が変化します。ある状態から別の状態に変化することを状態の遷移と呼びます。

強化学習では、遷移先の状態が、直前の状態とそこで行った行動にのみ依存するという性質が仮定されます。この性質をマルコフ性と呼びます(空欄ウ)。なお、このマルコフ性に従って状態が決定されることを、マルコフ決定過程MDP:Markov Decision Process)と呼びます。

なお、選択肢B(ウ)のエルゴード性とは、物理学における力学系の運動の長時間平均と位相空間における平均が一致する性質のことです。また、選択肢C(ウ)の移動不変性は、CNNにおいて局所領域からフィルタを通して検出する際、物体の位置のズレに頑健になる性質のことを指します。選択肢D(ウ)の独立性はより意味が広義な語句であり、今回の設問には合致しません。

以上より、組み合わせが適切な選択肢Aが正解です。


校正レポート

変更点ログ

要確認リスト



11.

2014年5月、欧州司法裁判所にて、過去の個人についての情報を削除してもらう権利が認められた。この権利の名称として、最も適切なものを選べ。

A. 認められる権利
B. 見られない権利
C. 忘れられる権利
D. 覚えられる権利


校正レポート

変更点ログ

要確認リスト



11. C

忘れられる権利(right to be forgotten)は、過去の個人についての情報を削除してもらう権利です(C)。この権利は、2014年に、欧州司法裁判所にて初めて認められました。

インターネットにアップロードされたデータは、アップロード後すぐに拡散されてしまいます。このため、インターネット上に存在する個人のデータを削除したいと思っても、それを個人レベルで実現することは非常に困難です。インターネット上に存在する個人のデータを完全に削除するには、事業者側の協力が不可欠です。忘れられる権利は、このような個人を救うための権利として登場しました。

2025年時点においては、EU一般データ保護規則(GDPR)17条において、この忘れられる権利が規定されています。

なお、選択肢A、B、Dのような名称は、一般には用いられません。

参考
EU一般データ保護規則(GDPR)の17条は、以下に掲載されています。
一度目を通しておくとよいでしょう。
https://gdpr.eu/article-17-right-to-be-forgotten/


校正レポート

変更点ログ

要確認リスト

← → キーで移動 / Ctrl+P でPDF保存