第6章 ディープラーニングの応用例

問題1

Google社によって開発された、Atrous convolutionを採用しているセマンティックセグメンテーションのモデルとして、最も適切なものを1つ選べ。

  1. ImageNet
  2. GoogLeNet
  3. DeepLabV3
  4. VGG16

📝 解答

3

🔍 解説

セマンティックセグメンテーションについての理解を問う問題です。DeepLabV3はセマンティックセグメンテーションのモデル、VGG16とGoogLeNetは物体認識のモデル、ImageNetはデータセットです。

問題2

Fast R-CNNの説明について、最も不適切なものを1つ選べ。

  1. 一枚の画像を分割してから、処理を行う。
  2. 画像に、畳み込み層と最大値プーリング層を適用することによって、特徴マップを作成する。
  3. 各物体の候補を、RoIプーリング層によって、特徴マップから固定長の特徴ベクトルに変換する。
  4. Fast R-CNNは、R-CNNよりも学習やテストにかかる処理が比較的高速で、さらに検出精度も高い。

📝 解答

1

🔍 解説

物体検出についての理解を問う問題です。Fast R-CNNは、R-CNNを高速化した手法です。両手法で利用されているSelective Searchの利用方法がどのように違うのかを理解しておきましょう。

問題3

畳み込みニューラルネットワーク (CNN) を用いた画像認識のモデルに関する説明として、最も不適切なものを1つ選べ。

  1. VGGNetでは層が深くなるごとに特徴マップの縦横の幅は小さくなり、特徴マップの数は多くなる。
  2. AlexNetは畳み込み層・プーリング層・全結合層を組み合わせたモデルである。
  3. GoogLeNetは、複数の畳み込み層やプーリング層から構成されるInceptionモジュールと呼ばれるネットワークを積み重ねた構造をしている。
  4. ResNetは、畳み込み層のみを積み重ねた構造をしている。

📝 解答

4

🔍 解説

CNNのモデルについての理解を問う問題です。ResNetは勾配消失問題を解消できるスキップ結合を導入していることを理解しておきましょう。

問題4

以下の文章を読み、空欄 (A) (B) に最もよく当てはまるものを1つ選べ。

(A)は画像検出タスクに用いられる1手法であり、(B) セグメンテーションに分類される。(A)は特徴マップを徐々に小さくしていくエンコーダと、逆に徐々に大きくしていくデコーダの間に、Pyramid Pooling Moduleと呼ばれるモジュールを有する。

  1. (A) PSPNet (B) セマンテック
  2. (A) PSPNet (B) インスタンス
  3. (A) SegNet (B) セマンテック
  4. (A) SegNet (B) インスタンス

📝 解答

1

🔍 解説

セグメンテーションタスクについての理解を問う問題です。セマンティックセグメンテーションとインスタンスセグメンテーションの違いについても理解しておきましょう。

問題5

以下の文章を読み、空欄に最もよく当てはまるものを1つ選べ。

LSTMで採用されている ( ) は誤差を内部にとどまらせることを目的としており、リカレントニューラルネットワーク (RNN) の課題である時間の経過とともに過去の勾配が消えてしまう問題に対応している。

  1. GRU
  2. BPTT
  3. CEC
  4. Attention

📝 解答

3

🔍 解説

LSTMについての理解を問う問題です。LSTMを構成するメモリセル (CEC)、各種ゲートの役割を理解しておきましょう。

問題6

A-D変換の説明として、不適切なものを1つ選べ。

  1. 空気の振動として波状に伝わる音声のアナログデータを、計算機で扱うためにデジタルデータに変換する。
  2. 入力信号は符号化、量子化、標本化の順に処理される。
  3. パルス符号変調 (PCM) という方法が用いられることが一般的である。
  4. 連続値を離散的な値で近似するため、変換の誤差が生じる。

📝 解答

2

🔍 解説

音声認識に用いる前処理についての理解を問う問題です。A-D変換は入力信号を標本化、量子化、符号化の順に処理します。

問題7

ディープラーニングは音声認識の逆過程である音声合成においても利用されている。2016年にDeepMind社により発表されたニューラルネットワークのアルゴリズムは従来に比べて圧倒的に高い質での音声合成に成功し、AIスピーカーが人間に近い自然な言語を話すことなどに大きく寄与している。このアルゴリズムの名称として、最も適切なものを1つ選べ。

  1. DQN
  2. AlexNet
  3. WaveNet
  4. ResNet

📝 解答

3

🔍 解説

音声合成に用いられるモデルについての理解を問う問題です。WaveNet は音声合成の代表的なモデルです。DQNは強化学習手法、AlexNetとResNet は畳み込みニューラルネットワークのモデルです。

問題8

以下の文章を読み、空欄 (A) (B) に最もよく当てはまるものを1つ選べ。

周波数スペクトルの形状を表すものを (A) といい、音色を表す。これによって発話者の声質や発音の特徴を示し、話者の識別などを可能にする。なお、(A)を求める一般的な方法は (B) を用いるものである。

  1. (A) フォルマント周波数 (B) メル周波数ケプストラム係数 (MFCC)
  2. (A) スペクトル包絡 (B) メル周波数ケプストラム係数 (MFCC)
  3. (A) フォルマント周波数 (B) 隠れマルコフモデル
  4. (A) フォルマント周波数 (B) スペクトル包絡

📝 解答

2

🔍 解説

音声認識に用いる前処理についての理解を問う問題です。フォルマント周波数は、音声の共振周波数です。
周波数のピークをフォルマントと呼びます。

問題9

キャプション生成の説明として、最も適切なものを1つ選べ。

  1. 入力画像を説明する自然言語文を出力する。
  2. 文書に書かれている手書き文字などを読み取る。
  3. 画像から対象物の位置を矩形領域で特定する。
  4. 画素単位でクラス識別を行う。

📝 解答

1

🔍 解説

キャプション生成についての理解を問う問題です。2はOCR、3は物体検出、4はセマンティックセグメンテーションです。

問題10

BERTについて、最も不適切なものを1つ選べ。

  1. ラベルが付与されていないデータを用いて事前学習を行う。
  2. 文章の冒頭から末尾までの一方の方向に対してTransfomerを適用している。
  3. Masked Langage Modelを利用している。
  4. Next Sentence Predicitonを利用している。

📝 解答

2

🔍 解説

BERTについての理解を問う問題です。BERTは文頭から文末までの順方向と文末から文頭までの逆方向の両方に対応した双方向の処理を行うことが特長です。

問題11

BoW (Bag-of-Words) に関する説明として、最も適切なものを1つ選べ。

  1. 単語の出現回数によって言語分析を行うモデルである。
  2. 語順を考慮した言語分析を行うモデルである。
  3. 自然言語処理において、意味のある特定の熟語群を示す用語である。
  4. 自然言語処理において、相槌など文意に大きな影響を与えない単語群を示す用語である。

📝 解答

1

🔍 解説

BoWについての理解を問う問題です。BoWは語順を考慮せずに単語の出現頻度を特長ベクトルとします。

問題12

以下の文章を読み、空欄 (A) (B) に最もよく当てはまるものを1つ選べ。

音声認識に用いられるアルゴリズムの1つに (A) がある。リカレントニューラルネットワーク (RNN) を音声認識に用いる際、音声データを入力し、それに対応する (B) を出力させることで音声認識が実現できる。(A)は、どの(B) にも対応しない空文字を挿入し、同一の (B) を縮約することを行うことで、入力と出力の数を一致させることができる。

  1. (A) CEC (B)音素
  2. (A) CEC (B)音韻
  3. (A) CTC (B)音素
  4. (A) CTC (B)音韻

📝 解答

3

🔍 解説

音声認識についての理解を問う問題です。CTCにより同じ音素が連続する場合でも1つの音素にすることができます。

問題13

CAMに関する説明として、最も不適切なものを1つ選べ。

  1. CAMは、2016年に発表された手法であり、画像認識の判断根拠を可視化する初めての手法として知られている。
  2. CAMは、グローバルアベレージプーリング (GAP) を有する画像認識モデルにおいてのみ適用可能である。
  3. Grad-CAMは、2017年に発表された手法であり、勾配情報を用いずに判断根拠を可視化する手法である。
  4. Grad-CAMは、グローバルアベレージプーリング (GAP) を有しない画像認識モデルでも利用可能であるため、幅広いタスクで用いる。

📝 解答

3

🔍 解説

CAMとGrad-CAMについての理解を問う問題です。CAMにより判断根拠を可視化できる層はGAPの手前だけです。Grad-CAMはGAPを有しないモデルにも適用でき、勾配情報に対してGAPを行います。

問題14

AIシステムのエッジ提供方式における留意点についての説明として、最も不適切なものを1つ選べ。

  1. 推論回数に応じてリソース利用料が増えるため、アクセス数やオートスケーリング設定に注意する必要がある。
  2. 必要に応じて各エッジのデータを収集して更新したモデルを配布するための、ネットワーク通信を用意する必要がある。
  3. 利用現場に配置した各エッジデバイスを、機器として長期間にわたり保守運用する必要がある。
  4. コストや推論処理の速度など様々な制約条件に合わせて、適切なデバイスのスペックを選定する必要がある。

📝 解答

1

🔍 解説

AIのエッジデバイスでの処理についての理解を問う問題です。エッジデバイスで処理することにより、クラウド側の負担がなくなります。一方で、エッジデバイスのスペックやモデルの更新方法、保守運用方法を考えておく必要があります。

問題15

ディープニューラルネットワーク (DNN) のパラメータを表現するビット数を削減することでモデルを圧縮する手法として、最も適切なものを1つ選べ。

  1. 蒸留
  2. プルーニング
  3. 量子化
  4. 正規化

📝 解答

3

🔍 解説

モデルの軽量化についての理解を問う問題です。1は大規模なモデルの知識を規模の小さなモデルに伝える技術、2はモデル内の不要なパラメータを削除する技術、4は特徴マップの値をスケーリングする技術です。

← → キーで移動 / Ctrl+P でPDF保存