Google社によって開発された、Atrous convolutionを採用しているセマンティックセグメンテーションのモデルとして、最も適切なものを1つ選べ。
3
セマンティックセグメンテーションについての理解を問う問題です。DeepLabV3はセマンティックセグメンテーションのモデル、VGG16とGoogLeNetは物体認識のモデル、ImageNetはデータセットです。
Fast R-CNNの説明について、最も不適切なものを1つ選べ。
1
物体検出についての理解を問う問題です。Fast R-CNNは、R-CNNを高速化した手法です。両手法で利用されているSelective Searchの利用方法がどのように違うのかを理解しておきましょう。
畳み込みニューラルネットワーク (CNN) を用いた画像認識のモデルに関する説明として、最も不適切なものを1つ選べ。
4
CNNのモデルについての理解を問う問題です。ResNetは勾配消失問題を解消できるスキップ結合を導入していることを理解しておきましょう。
以下の文章を読み、空欄 (A) (B) に最もよく当てはまるものを1つ選べ。
(A)は画像検出タスクに用いられる1手法であり、(B) セグメンテーションに分類される。(A)は特徴マップを徐々に小さくしていくエンコーダと、逆に徐々に大きくしていくデコーダの間に、Pyramid Pooling Moduleと呼ばれるモジュールを有する。
1
セグメンテーションタスクについての理解を問う問題です。セマンティックセグメンテーションとインスタンスセグメンテーションの違いについても理解しておきましょう。
以下の文章を読み、空欄に最もよく当てはまるものを1つ選べ。
LSTMで採用されている ( ) は誤差を内部にとどまらせることを目的としており、リカレントニューラルネットワーク (RNN) の課題である時間の経過とともに過去の勾配が消えてしまう問題に対応している。
3
LSTMについての理解を問う問題です。LSTMを構成するメモリセル (CEC)、各種ゲートの役割を理解しておきましょう。
A-D変換の説明として、不適切なものを1つ選べ。
2
音声認識に用いる前処理についての理解を問う問題です。A-D変換は入力信号を標本化、量子化、符号化の順に処理します。
ディープラーニングは音声認識の逆過程である音声合成においても利用されている。2016年にDeepMind社により発表されたニューラルネットワークのアルゴリズムは従来に比べて圧倒的に高い質での音声合成に成功し、AIスピーカーが人間に近い自然な言語を話すことなどに大きく寄与している。このアルゴリズムの名称として、最も適切なものを1つ選べ。
3
音声合成に用いられるモデルについての理解を問う問題です。WaveNet は音声合成の代表的なモデルです。DQNは強化学習手法、AlexNetとResNet は畳み込みニューラルネットワークのモデルです。
以下の文章を読み、空欄 (A) (B) に最もよく当てはまるものを1つ選べ。
周波数スペクトルの形状を表すものを (A) といい、音色を表す。これによって発話者の声質や発音の特徴を示し、話者の識別などを可能にする。なお、(A)を求める一般的な方法は (B) を用いるものである。
2
音声認識に用いる前処理についての理解を問う問題です。フォルマント周波数は、音声の共振周波数です。
周波数のピークをフォルマントと呼びます。
キャプション生成の説明として、最も適切なものを1つ選べ。
1
キャプション生成についての理解を問う問題です。2はOCR、3は物体検出、4はセマンティックセグメンテーションです。
BERTについて、最も不適切なものを1つ選べ。
2
BERTについての理解を問う問題です。BERTは文頭から文末までの順方向と文末から文頭までの逆方向の両方に対応した双方向の処理を行うことが特長です。
BoW (Bag-of-Words) に関する説明として、最も適切なものを1つ選べ。
1
BoWについての理解を問う問題です。BoWは語順を考慮せずに単語の出現頻度を特長ベクトルとします。
以下の文章を読み、空欄 (A) (B) に最もよく当てはまるものを1つ選べ。
音声認識に用いられるアルゴリズムの1つに (A) がある。リカレントニューラルネットワーク (RNN) を音声認識に用いる際、音声データを入力し、それに対応する (B) を出力させることで音声認識が実現できる。(A)は、どの(B) にも対応しない空文字を挿入し、同一の (B) を縮約することを行うことで、入力と出力の数を一致させることができる。
3
音声認識についての理解を問う問題です。CTCにより同じ音素が連続する場合でも1つの音素にすることができます。
CAMに関する説明として、最も不適切なものを1つ選べ。
3
CAMとGrad-CAMについての理解を問う問題です。CAMにより判断根拠を可視化できる層はGAPの手前だけです。Grad-CAMはGAPを有しないモデルにも適用でき、勾配情報に対してGAPを行います。
AIシステムのエッジ提供方式における留意点についての説明として、最も不適切なものを1つ選べ。
1
AIのエッジデバイスでの処理についての理解を問う問題です。エッジデバイスで処理することにより、クラウド側の負担がなくなります。一方で、エッジデバイスのスペックやモデルの更新方法、保守運用方法を考えておく必要があります。
ディープニューラルネットワーク (DNN) のパラメータを表現するビット数を削減することでモデルを圧縮する手法として、最も適切なものを1つ選べ。
3
モデルの軽量化についての理解を問う問題です。1は大規模なモデルの知識を規模の小さなモデルに伝える技術、2はモデル内の不要なパラメータを削除する技術、4は特徴マップの値をスケーリングする技術です。