1.

データサイエンティストであるあなたは、ある小売業を行うA社のデータ活用について依頼を受けた。以下の文章のうち、データサイエンティストがとるべき行動として、最も適切でないものを選べ。

A. データ分析を行う前に、解決しなければならない課題の定義検証の必要がある仮説の立案を行う
B. 分析結果をまとめた報告書を作成する
C. データサイエンティストの役割はデータ分析のみであり、課題定義などは依頼主が行うべきものである
D. データに対する分析は再現性が保たれるように実施する


校正レポート

変更点ログ

要確認リスト



1. C

データサイエンティストの役割とは、データ分析の結果得られた知見をビジネスに活用することです。つまり、データサイエンティストの仕事は、データを分析することだけではないということです。データサイエンティストには、現場における意思決定をサポートしてビジネスに貢献することが求められます。

データ分析プロジェクトは、まず、課題の定義仮説の立案を行うことから始めます。次に仮説の検証を行い、最後に検証結果の評価と報告を行います。
課題の定義・仮説立案フェーズでは、ビジネス上の課題を洗い出し、分析の目的を明確にします。具体的には、一次情報の入手課題の明確化ゴールの設定KPI(解答5参照)の設定、仮説の立案などを行います(A)。
仮説検証フェーズでは検証結果の評価を行います。
立案した仮説を検証するために、収集したデータの分析を行います。
そして最終的な結果をまとめ、検証結果の報告を行います(B)。
データ分析を実施する際は、同じデータに対して同じ分析を行った場合や、同種の新しいデータに対して同じ分析を行った場合に、同様の結果が得られるようにしておく(再現性を担保しておく)必要があります(D)。

このように、データサイエンティストには、データ分析だけでなく、課題設定や結果の報告資料の作成までを行うことが、近年求められています。
以上より、選択肢Cが正解です。

参考
担当するタスクの遅延や障害などを発見した場合、迅速かつ適切に報告ができるように、プロジェクト全体の流れや関係者を把握しておくようにしましょう。プロジェクトにおけるステークホルダー(利害関係者)や役割分担、プロジェクト管理・進行に関するツール・方法を理解しておくことは、プロジェクト推進の基本です。


校正レポート

変更点ログ

要確認リスト



2.

データ分析において、必要なデータ収集を行う際、データサイエンティストがとるべき行動として、最も適切でないものを選べ。

A. 仮説検証に必要なデータ量があるかどうかを確認する
B. データの内容にかかわらず、顧客から提供された生データのまま分析を進める
C. データに個人情報が含まれるかどうかを確認する
D. データに選択バイアスが含まれていないかどうかを検討する


校正レポート

変更点ログ

要確認リスト



2. B

データ分析では、仮説の検証に必要なデータを入手しなければなりません。その際に留意すべきことを以下に示します。

選択バイアスは、実験やデータ収集の対象を決める際にデータに起こりやすい偏り(バイアス)です。例として、インターネットによる公募によって対象者を選定した、高齢者の健康状態に関するデータについて考えてみます。このような経緯で収集されたデータの場合、データの収集範囲が「インターネットが利用でき、なおかつ健康に高い関心がある」高齢者に偏っている可能性があります。このため、データを収集する際は、データに選択バイアスが含まれていないかを検討する必要があります(D)

また、分析に使用するデータは前処理が必要な場合があるため、常に顧客から提供された生データのまま分析を行うのは望ましくありません。データの中身を確認し、前処理が必要かどうかを判断するようにしましょう。

以上より、選択肢Bが正解です。

参考
担当する事業領域について、市場規模主要なプレーヤー支配的なビジネスモデル課題と機会について、全体像を説明できるようにしておきましょう。


校正レポート

変更点ログ

要確認リスト



3.

自社ビジネスの現状を把握するためのフレームワークとして、5フォース分析がある。5フォース分析の特徴を述べたものとして、最も適切なものを選べ。

A. 購入までのプロセスを認知、関心、欲求、記憶、行動の5つに分類し、消費者の行動を細分化する
B. ビジネスにおけるステークホルダーをすべて列挙し、製品、金銭、情報の流れを明確にする
C. Recency・Frequency・Monetary の3つの指標に基づいて顧客をグループ分けし、自社の顧客への理解を深める
D. 自社の経営に影響を及ぼす、競合他社新規参入企業の存在などの要因を5つに分類し、自社の競争優位性を探る


校正レポート

変更点ログ

要確認リスト



3. D

5フォース分析とは、業界内の競争を想定する以下の5つの力(競争要因)から、自社が置かれている競争環境などを分析するフレームワークです。

・業界への新規参入企業の存在
・代替製品の存在
・売り手の交渉力
・買い手の交渉力
・競合他社の存在

この分析により、分析対象の業界の競争環境などを知ることができます。したがって、選択肢Dが正解です。

07_114_1

AはAIDMA(アイドマ)に関する記述です。AIDMAは、サミュエル・ローランド・ホールが1924年に著書「Retail Advertising and Selling」の中で提唱した顧客購買モデルです。Attention、Interest、Desire、Memory、Actionの頭文字をとったもので、主に店舗の経営改善に用いられます。消費者が購入決定に至るまでのプロセスを、認知(Attention)関心(Interest)欲求(Desire)記憶(Memory)行動(Action)の5つに分類し、消費者の購入のモチベーションがどこにあるのかを探ります。

BはCVCA(Customer Value Chain Analysis:顧客価値連鎖分析)に関する記述です。このフレームワークでは、ビジネスを行う際のステークホルダー(利害関係者)をすべて挙げ、各ステークホルダー間の金銭、商品、情報の流れを図で可視化します。

【CVCAのイメージ】

CはRFM分析に関する記述です。顧客を、Recency(最終購入日)Frequency(購入頻度)Monetary(購入金額)のセグメントで区切る方法で、自社の顧客の特徴を深く理解するために用いられます。

【参考】
自分の担当事業領域に対して、5フォース分析やRFM分析を使用して課題の洗い出しなどを行ってみましょう。


校正レポート

変更点ログ

要確認リスト



4.

物事の構成要素を考える際、列挙する要素に漏れや重複が発生しないようにするフレームワークの名称として、最も適切なものを選べ。

A. AIDMA
B. MECE
C. MACA
D. AISAS


校正レポート

変更点ログ

要確認リスト



4. B

物事の構成要素を考える際、列挙する要素に漏れや重複が発生しないようにするフレームワークをMECE(ミーシー)といいます。MECEは「Mutually Exclusive, Collectively Exhaustive」の略であり、「漏れなく、重複なく」という意味をもちます(B)。

AIDMAは、消費者が購入決定に至るまでのプロセスを、認知、関心、欲求、記憶、行動の5つに分類する顧客購買モデルです (A) (解答3参照)。

MACAという名称のフレームワークは存在しません (C)。

AISAS (アイサス) は、電通が提唱し、2005年に同社が商標登録した顧客購買モデルです。AIDMAのモデルにインターネット上での購買行動を追加した考え方となっています。これは、消費者が購入決定に至るまでのプロセスを、認知 (Attention)関心 (Interest)検索 (Search)行動 (Action)共有 (Share) の5つに分類するものです (D)。


校正レポート

変更点ログ

要確認リスト



5.

ビジネスの現場では、経営目標を達成するために中間的な数値目標を定めることが多い。この数値目標は、日本語では「重要業績評価指標」と呼ばれる。この数値目標を意味する単語として、最も適切なものを選べ。

A. OKR
B. CFS
C. KGI
D. KPI


校正レポート

変更点ログ

要確認リスト



5. D

日本語で重要業績評価指標といわれる用語はKPIです。「Key Performance Indicator」の略で、KGI (後述) で定めた目標を達成するために設定される中間目標のことです (D)。

OKRは「Objectives and Key Results」の略で、「目標と主な結果」という意味をもつ、目標管理の指標です (A)。四半期ごと、または月ごとに設定されることが多く、SMARTの考え方に基づいて設計されます。SMARTとは、「Specific (具体的に)Measurable (測定可能な)Achievable (達成可能な)Related (経営目標に関連した)Time-bound (期限がある)」の略で、目標を達成するための指標を表したものです。「組織全体の大きな目標として設定する」、「レビュー頻度が多く評価スパンが短い」、「達成度は $100\,\%$ を求めない」などがOKRの大きな特徴です。

CSFは「Critical Success Factor」の略で、「主要な成功要因」という意味をもちます (B)。最終目標のKGIを達成するために最も大きな影響を及ぼす要因を指します。CSFは事業の核になっている場合が多く、ここに経営資源を投入することで、KGIやKPIの達成が可能となります。
一般に、CSFはSWOT分析に基づいて設定されます。SWOTは「Strengths (強み)Weaknesses (弱み)Opportunities (機会)Threats (脅威)」の略です。SWOT分析は、これら4つの観点から企業の状況について分析を行うフレームワークです。

KGIは「Key Goal Indicator」の略で、日本語で重要目標達成指標といわれます (C)。組織のビジョンや大きな目標を定量的に示すために用いられ、組織全体の目標やプロジェクトの最終目標の達成度を測る基準として利用します。


校正レポート

変更点ログ

要確認リスト



6.

データ分析において、入手したデータを理解するために行うこととして、最も適切でないものを選べ。

A. データの全体像を把握するために、生データの中身を直接確認する
B. データに外れ値欠損値がないか確認する
C. データをグラフ化して、全体的な特徴を掴む
D. 期待する分析結果を見据えて、そのとおりの分析結果となるようにデータの加工を行う


校正レポート

変更点ログ

要確認リスト



6. D

入手したデータを理解するためにデータサイエンティストが行う分析の例を以下に示します。

このように、与えられた分析課題に対する初動として、さまざまな情報を収集し、大まかな構造を把握することは非常に重要です。

自分の望む結論を後押ししてくれるような分析結果を求め、そういった分析結果となるように意図的に分析の方針を決定することは望ましい分析方法とはいえません(D)。

参考
入手したデータを分析したうえでレポートを作成する際には、データの出自や情報の引用元に対する信頼性を適切に判断し、分析結果の意味合いを正しく言語化できるようにしましょう。また、レポートを作成するには、BI(Business Intelligence)ツールのレポート編集機能を用いて作成を行うと、分析結果を手軽にまとめることができます。

試験対策
ビジネスにおいて、「論理とデータの重要性」を認識し、分析的でデータドリブンな考え方に基づいて行動できることが、データサイエンティストに求められる素質であると考えられます。なお、データドリブンとは、過去の経験や勘のみに頼るのではなく、データ分析結果を元にビジネス上の意思決定を行うことです。


校正レポート

変更点ログ

要確認リスト



7.

民法第632条および第643条において定められている請負契約準委任契約についての違いを次のようにまとめた。

項目 請負契約 準委任契約
目的 仕事の完成 一定の事務処理
責任 契約不適合責任 善管注意義務のみ
仕事内容等が不十分だった場合の責任追及 契約不適合責任、民法の一般原則に従った債務不履行責任の追及 民法の一般原則に従った債務不履行責任の追及
報酬の受け取り時期 仕事が完成していなければ報酬は受け取れない 仕事が完成していなくても報酬は受け取れる
報告義務 ( ア ) ( イ )
成果物 原則あり 原則なし

空欄ア、イに当てはまる語句の組み合わせとして、最も適切なものを選べ。

A. (ア)あり (イ)あり
B. (ア)なし (イ)あり
C. (ア)なし (イ)なし
D. (ア)あり (イ)なし


校正レポート

変更点ログ

要確認リスト



7. B

請負契約とは、受託側が仕事の完成を約束する契約です。準委任契約とは、仕事の完成ではなく、一定の業務を行うことを約束する契約です。

通常、データ分析プロジェクトの一部を外部に委託する場合は、委託先と契約を結びます。その場合、締結する契約としては、民法での定めに従って、請負契約準委任契約のいずれかが用いられます。これらの契約の違いは次の表のとおりです。

【請負契約と準委任契約の違い】

請負契約 準委任契約
目的 仕事の完成 一定の事務処理
責任 契約不適合責任 善管注意義務のみ
仕事内容等が不十分だった場合の責任追及 契約不適合責任、民法の一般原則に従った債務不履行責任の追及 民法の一般原則に従った債務不履行責任の追及
報酬の受け取り時期 仕事が完成していなければ報酬は受け取れない 仕事が完成していなくても報酬は受け取れる
報告義務 なし あり
成果物 原則あり 原則なし

出典:「データサイエンティスト検定(リテラシーレベル)公式リファレンスブック」(技術評論社)

設問で問われている報告義務とは、受任者(仕事を委託された者)が委任者(仕事を委託した者)に進捗状況を必要に応じて報告する義務です。
データ分析プロジェクトにおいて、請負契約と準委任契約のどちらにするかの判断は、民法に則りつつも、プロジェクトの性質や会社の方針などで変化します。例えば、従来のソフトウェア開発は請負契約が主流でしたが、AI技術を利用する場合、事前の性能保証が困難なこと、探索的なアプローチが望ましいことなどから、準委任契約とするケースがあります。また、PoC(Proof of Concept:概念実証)プロジェクトを行う場合は、システム開発に近い作業でも準委任契約にするケースもあります。

以上より、選択肢Bが正解です。


校正レポート

変更点ログ

要確認リスト



8.

データサイエンス関連の情報収集と知識習得手段に関する次の記述を読み、空欄ア〜ウに入る語句の組み合わせとして、最も適切なものを選べ。

何らかの機械学習モデルを構築したい際は、学習済みモデルの公開サイトにアクセスし、目的に沿うモデルがあるかを検索するとよい。モデルの公開サイトとしては、TensorFlow Hubや( ア )が有名である。モデルが見つからない場合は自分で構築することになる。Papers With Codeのサイトではコードが公開されている論文のリストが掲載されており、目的に合った論文が見つかれば( イ )などでコードを入手できる。コードが公開されていない場合は、( ウ )で公開されている論文のプレプリントを直接参照する。論文の内容を理解する方法としては、生成AIに要約してもらったり、コミュニティや勉強会へ参加したりして内容を議論することも有用である。

A. (ア)OpenAI
(イ)Stack Overflow
(ウ)J-STAGE

B. (ア)Hugging Face
(イ)GitHub
(ウ)arXiv

C. (ア)OpenAI
(イ)GitHub
(ウ)J-STAGE

D. (ア)Hugging Face
(イ)Stack Overflow
(ウ)arXiv


校正レポート

変更点ログ

要確認リスト



8. B

深層学習をはじめ、データサイエンスに関連する技術の進展は日進月歩であり、日本語で関連書籍が発行されるころには、それよりも新しい技術が発表されているということがよくあります。このため、最新情報を入手したい場合は、インターネットを利用したり、講演会や勉強会などに参加するとよいでしょう。

データサイエンスの分野では、機械学習のモデル・コード・論文などの多くは、情報がオープンになっており、商用利用が可能です。本問では、それらを入手できる主要なサイトを問うています。

Hugging Faceは、機械学習モデルの公開サイトです。画像分類モデルのように汎用的に利用できるものから、日本語対応の自然言語処理モデルまで、様々なモデルが公開されています(空欄ア)。
GitHubは、バージョン管理システムのGitをベースとしたクラウドサービスであり、多くのオープンソースプロジェクトのソースコード管理で利用されています。慣例として、GitHubでは個別トピックにawesomeを付加した名称のリポジトリがあり、それらは関連トピックの優れたリポジトリや論文、ツール情報などがまとめられた場所となっています(空欄イ)。例えば、大規模言語モデル(LLM)であれば、awesome llmといったワードを使用します。ソースコードやツールを探す場合は、このようなキーワードを使い人気順や最終更新日の新しい順で検索することで、効率的に情報を収集できます。
機械学習分野では、査読前の論文(プレプリント)がarXivのウェブサイトで公開されることがあります(空欄ウ)。論文を効率的に理解するための方法として、AIによる要約が考えられます。

以上より、組み合わせが適切な選択肢Bが正解です。

参考
Stack Overflowは、質問回答のプラットフォームです。このプラットフォーム、ソフトウェアエンジニアリングに関する質問が多数投稿されております。
バグの情報やエラー回避方法を知りたいときに役立ちます。
J-STAGEは、国立研究開発法人科学技術振興機構(JST)が運営する電子ジャーナルプラットフォームです。ここには、日本の研究機関から発表された論文が掲載されています。


校正レポート

変更点ログ

要確認リスト

← → キーで移動 / Ctrl+P でPDF保存