第3章 機械学習の具体的手法 問題

問題1

以下の文章を読み、空欄に最もよく当てはまるものを1つ選べ。

ブースティングは複数の弱分類器を組み合わせて1つの分類器を構築する()の手法の1つである。

  1. バギング
  2. アンサンブル学習
  3. ボルツマンマシン
  4. サポートベクターマシン (SVM)

📝 解答

2

🔍 解説

機械学習の手法の位置付けを問う問題です。バギングもアンサンブル学習の手法の1つです。

問題2

以下の文章を読み、空欄 (A) (B) に最もよく当てはまるものを1つ選べ。

サポートベクターマシン (SVM) において、データを (A) 空間に写像することで、写像後の空間で線形分類を行えるようにするという方法が取られる。その際に用いられる関数のことを (B) 関数という。

  1. (A) 高次元 (B) カーネル
  2. (A)高次元 (B) フーリエ
  3. (A)低次元 (B) カーネル
  4. (A)低次元 (B) フーリエ

📝 解答

1

🔍 解説

機械学習手法の1つであるSVMの理解を問う問題です。カーネル関数を用いてデータを高次元空間に写像するのが非線形のSVMの特徴です。

問題3

バギングに関する説明として、最も適切なものを1つ選べ。

  1. 複数のモデルの中からランダムにモデルを選び、その中で最も識別性能の高かったモデルを採用する手法のこと。
  2. 複数のモデルをそれぞれ別に学習させ、各モデルの出力を平均もしくは多数決することで決める手法のこと。
  3. 複数のモデルを学習させ、最も性能の低いモデルを不採用とすることを繰り返し、最も汎化性能の高いものを採用する手法のこと。
  4. はじめに1つモデルを学習して作成し、それを何度も改善することを通じて性能を高めていく手法のこと。

📝 解答

2

🔍 解説

機械学習手法の1つであるバギングの理解を問う問題です。バギングはアンサンブル学習に位置付けられるので、複数のモデルの出力を利用するのが特長です。

問題4

複数の決定木を用意し、訓練データをランダムに振り分けて、アンサンブル学習を行う学習手法として、最も適切なものを1つ選べ。

  1. B本
  2. ドメインランダマイゼーション
  3. ランダムフォレスト
  4. 勾配ブースティング決定木

📝 解答

3

🔍 解説

機械学習手法の1つであるランダムフォレストの理解を問う問題です。ランダムフォレストもアンサンブル学習に位置付けられます。

問題5

回帰問題や分類問題に関する説明として、最も適切なものを1つ選べ。

  1. 多クラス分類には、ソフトマックス関数が用いられる。
  2. 回帰問題には、ロジスティック回帰が用いられる。
  3. 多クラス分類には、線形回帰が用いられる。
  4. 多クラス分類には、リッジ回帰が用いられる。

📝 解答

1

🔍 解説

多クラス分類にはソフトマックス関数を用います。2個分類の場合にロジスティック回帰、回帰問題の場合に線形回帰またはリッジ回帰を用います。

問題6

自己回帰モデル(AR) による分析対象例として、最も適切なものを1つ選べ。

  1. 株価予測
  2. 迷惑メールの分類
  3. 検査画像を用いたがん細胞の検出
  4. 顔認証

📝 解答

1

🔍 解説

自己回帰モデルについての理解を問う問題です。ARは過去のデータを用いて現在にデータを回帰する時系列データの予測に用いることができます。

問題7

教師なし学習の手法の中で、入力データの構造や特徴をつかむためにクラスタごとに重心を求め、各データを最も近いクラスタに紐付ける作業を繰り返しあらかじめ決められた数のクラスタにデータを分類する手法の名称として、最も適切なものを1つ選べ。

  1. 線形回帰
  2. ブースティング
  3. k-means法
  4. 主成分分析(PCA)

📝 解答

3

🔍 解説

クラスタリング手法についての理解を問う問題です。あらかじめ決めたk個のクラスタを作るために重心を求めて紐づけるのがk-means法の特長です。

問題8

サンプル同士の類似度をもとに、それらを複数のグループに分割する手法がある。この手法の特徴は、正解ラベルが付与されていないデータでも利用することができ、ビジネスにおける顧客のセグメンテーションなど、データマイニングの領域で広く利用される。サンプル同士の類似度をもとに、それらを複数のグループに分割する手法の名称として、最も適切なものを1つ選べ。

  1. 決定木
  2. 主成分分析(PCA)
  3. クラスタリング
  4. 交差検証

📝 解答

3

🔍 解説

クラスタリングについての理解を問う問題です。クラスタリングがどのような処理であるか理解しましょう。

問題9

階層的クラスタリングにおいて、クラスタが形成されていく様子を木構造で表現した図の名称として、最も適切なものを1つ選べ。

  1. デンドログラム
  2. ヒストグラム
  3. バレート図
  4. 決定木

📝 解答

1

🔍 解説

クラスタリング手法についての理解を問う問題です。木構造で表現した樹形図のようなクラスタを形成するのがデンドログラムの特徴です。

問題10

レコメンデーションに関する以下の文章を読み、空欄(A) ~ (C) に最もよく当てはまるものを1つ選べ。

(A)は、ECサイト等でユーザーの購買履歴をもとに好みを分析し、興味がありそうな商品をおすすめする手法である。
(A)は、事前にある程度の参考になるデータがない場合に推薦を行うことができない。これを (B) と言う。(C)は、ユーザーではなく、商品側に何かしらの特徴量を付与し、特徴が似ている商品を推奨する。(C)は、対象ユーザーのデータさえあれば推薦を行うことができるので、(B)を回避することができる。

  1. (A) コンテンツベーズフィルタリング (B) コールドスタート問題 (C) 協調フィルタリング
  2. (A) 協調フィルタリング (B) コールドスタート問題 (C) コンテンツベースフィルタリング
  3. (A) コンテンツベースフィルタリング (B) ホットスタート問題 (C) 協調フィルタリング
  4. (A) 協調フィルタリング (B) ホットスタート問題 (C) コンテンツベースフィルタリング

📝 解答

2

🔍 解説

協フィルタリングについての理解を問う問題です。コールドスタート問題は重要な問題なので、どのように回避するかを含めて理解しましょう。

問題11

Q学習について述べたものとして、最も適切なものを1つ選べ。

  1. 行動価値関数を最適化するよう学習を進める手法である。
  2. 方策勾配法ペースの手法である。
  3. 行動器と評価器を用いる手法である。
  4. 方策オン型(オンボリシー)に分類される手法である。

📝 解答

1

🔍 解説

Q学習の理解を問う問題です。Q学習は価値反復法ペースの手法であり、方策オフ型の学習手法です。

問題12

強化学習は、マルコフ決定過程として定式化される。この場合のマルコフ性とは、どのような意味で用いられるか。過去、現在、未来の各状態の関係を記述した選択肢の中から、マルコフ決定過程を適切に記述していると考えられる最も適切なものを1つ選べ。

  1. 未来の状態は、現在の状態にのみ依存し、過去には依存しない。
  2. 未来の状態は、過去の状態と現在の状態とに依存する。
  3. 未来の状態は、過去の状態に依存し、現在の状態には依存しない。
  4. 未来の状態は、過去の状態にも、現在の状態にも依存しない。

📝 解答

1

🔍 解説

マルコフ決定過程の理解を問う問題です。特にマルコフ性は重要となるので理解しましょう。

問題13

機械学習における検証手法の1つであるk-分割交差検証は、どのようなときに用いると効果的か。最も適切なものを1つ選べ。

  1. 学習に時間がかかるとき。
  2. 分類問題におけるクラスの数が少ないとき。
  3. 入力データの次元が大きいとき。
  4. データセットに含まれるデータの件数が少ないとき。

📝 解答

4

🔍 解説

機械学習モデルを検証する方法を理解する問題です。k・分割交差検証は、データセットに含まれるデータ件数が少ないときに効果的です。

← → キーで移動 / Ctrl+P でPDF保存