問題1
教師あり学習の定義
教師あり学習について最も適切な説明はどれですか?
正解: B
教師あり学習(Supervised Learning)は、入力データと正解ラベル(目的変数)のペアを使用してモデルを学習させる手法です。回帰問題や分類問題がこれに該当します。
問題2
教師なし学習の特徴
教師なし学習について正しい記述はどれですか?
正解: B
教師なし学習(Unsupervised Learning)は、正解ラベルのない入力データのみを使用して、データの隠れた構造やパターンを発見する手法です。クラスタリングや次元削減がこれに該当します。
問題3
強化学習の基本概念
強化学習において、エージェントが環境と相互作用する際の基本的な要素で正しい組み合わせはどれですか?
正解: B
強化学習(Reinforcement Learning)では、エージェントが環境の状態(State)を観測し、行動(Action)を選択し、その結果として報酬(Reward)を受け取るという相互作用を繰り返します。
問題4
線形回帰の特徴
線形回帰について正しい記述はどれですか?
正解: B
線形回帰(Linear Regression)は回帰問題の基本的な手法で、入力変数と出力変数の間の線形関係をモデル化し、連続値の予測を行います。
問題5
ロジスティック回帰の用途
ロジスティック回帰が主に使用される問題の種類はどれですか?
正解: B
ロジスティック回帰(Logistic Regression)は分類問題に使用される手法で、シグモイド関数を用いて確率を出力し、特に二値分類でよく使用されます。
問題6
決定木の特徴
決定木(Decision Tree)の利点として正しいものはどれですか?
正解: C
決定木の大きな利点は、ルールベースの分岐構造により予測過程が視覚的に理解しやすく、解釈が容易であることです。ただし、過学習しやすいという欠点もあります。
問題7
ランダムフォレストの仕組み
ランダムフォレスト(Random Forest)について正しい記述はどれですか?
正解: B
ランダムフォレストは、複数の決定木を構築し、それらの予測結果を組み合わせる(アンサンブルする)ことで、単一の決定木よりも高い精度と安定性を実現する手法です。
問題8
サポートベクターマシン(SVM)
SVMの基本的な考え方として正しいものはどれですか?
正解: B
SVM(Support Vector Machine)は、クラス間の境界面(超平面)を決定する際に、マージン(データ点と境界面の間の距離)を最大化することで、汎化性能の高い分類器を構築します。
問題9
k-means法の特徴
k-means法について正しい記述はどれですか?
正解: B
k-means法は、データをk個のクラスタに分割する非階層クラスタリング手法です。事前にクラスタ数kを指定し、各データ点をクラスタ重心に最も近いクラスタに割り当てます。
問題10
階層クラスタリングの特徴
階層クラスタリングについて正しい記述はどれですか?
正解: B
階層クラスタリングは、データ間の類似度に基づいて階層的にクラスタを形成する手法で、結果をデンドログラム(樹形図)で可視化できます。事前にクラスタ数を決める必要がありません。
問題11
主成分分析(PCA)の目的
主成分分析(PCA)の主な目的はどれですか?
正解: B
主成分分析(Principal Component Analysis, PCA)は、高次元データを低次元空間に射影する次元削減手法です。データの分散を最大化する方向(主成分)を見つけて次元を削減します。
問題12
アプリオリアルゴリズム
アプリオリアルゴリズムが主に使用される分野はどれですか?
正解: B
アプリオリアルゴリズムは、頻出アイテム集合を発見するアルゴリズムで、マーケットバスケット分析(購買データの分析)やアソシエーション分析で広く使用されます。
問題13
Q学習の基本概念
Q学習において「Q値」が表すものはどれですか?
正解: B
Q学習のQ値(Q-value)は、特定の状態で特定の行動を取った場合の将来の累積報酬の期待値を表します。状態と行動のペア(s, a)に対する価値関数です。
問題14
方策勾配法の特徴
方策勾配法(Policy Gradient)について正しい記述はどれですか?
正解: B
方策勾配法は、価値関数を介さずに方策(行動選択の確率分布)を直接最適化する強化学習手法です。連続的な行動空間にも対応できる利点があります。
問題15
バギング(Bagging)の特徴
バギング(Bootstrap Aggregating)について正しい記述はどれですか?
正解: B
バギングは、ブートストラップサンプリングによって複数の学習用データセットを作成し、それぞれに対して並列的に学習器を構築するアンサンブル学習手法です。
問題16
ブースティング(Boosting)の仕組み
ブースティングについて正しい記述はどれですか?
正解: B
ブースティングは、弱学習器を逐次的に構築し、前の学習器が誤分類したデータに重点を置いて次の学習器を学習させることで、全体の性能を向上させるアンサンブル学習手法です。
問題17
交差検証(Cross Validation)の目的
k分割交差検証の主な目的はどれですか?
正解: B
k分割交差検証は、データをk個に分割し、そのうち1つをテストデータ、残りを学習データとして使用することをk回繰り返すことで、モデルの汎化性能をより信頼性高く評価する手法です。
問題18
正則化の効果
機械学習における正則化の主な効果はどれですか?
正解: B
正則化(Regularization)は、モデルの複雑さにペナルティを課すことで過学習を抑制し、汎化性能を向上させる手法です。L1正則化やL2正則化などがあります。
問題19
バイアス・バリアンストレードオフ
バイアス・バリアンストレードオフについて正しい記述はどれですか?
正解: B
バイアス・バリアンストレードオフとは、モデルの複雑さを上げて偏り(バイアス)を下げると、予測のばらつき(バリアンス)が上がるという関係のことです。両者のバランスを取ることが重要です。
問題20
特徴選択の目的
特徴選択(Feature Selection)を行う主な理由はどれですか?
正解: B
特徴選択は、予測に関係の薄い特徴量やノイズとなる特徴量を除去することで、モデルの性能向上、計算コストの削減、解釈性の向上を図る手法です。
問題21
次元削減の利点
次元削減を行う利点として最も適切でないものはどれですか?
正解: C
次元削減は、高次元データを低次元に変換する際に、多少の情報損失が生じるのが一般的です。情報量の完全な保持は通常不可能で、重要でない情報を捨てることで効率化を図ります。
問題22
アンサンブル学習の基本概念
アンサンブル学習について正しい記述はどれですか?
正解: B
アンサンブル学習は、複数の学習器(弱学習器)の予測結果を組み合わせることで、単一のモデルよりも高い性能を実現する手法です。バギング、ブースティング、投票などの手法があります。
問題23
精度と再現率
分類問題における「再現率(Recall)」の定義として正しいものはどれですか?
正解: B
再現率(Recall, Sensitivity)は、実際にPositiveなサンプルのうち、正しくPositiveと予測された割合を表します。TP(True Positive)を、TP + FN(False Negative)で割った値です。
問題24
ROC曲線とAUC
ROC曲線について正しい記述はどれですか?
正解: B
ROC曲線(Receiver Operating Characteristic curve)は、横軸に偽陽性率(FPR = FP/(FP+TN))、縦軸に真陽性率(TPR = TP/(TP+FN))をプロットした曲線で、分類器の性能を評価します。
問題25
混同行列(Confusion Matrix)
混同行列から直接読み取ることができる情報はどれですか?
正解: B
混同行列(Confusion Matrix)は、分類問題において、実際のクラスと予測されたクラスの組み合わせを表にしたもので、True Positive、False Positive、True Negative、False Negativeの数を確認できます。
お疲れ様でした!
第4章「機械学習の具体的手法」の全25問を完了しました。
最終正答率: 0%