Ceeds Academy教材アプリ教材・症状語・タグで検索
索引グラフ試す
機械学習▸機械学習の基礎

機械学習: モデル評価(訓練/検証/テスト・過学習・適合率/再現率)

knowledge所要 25分最新草稿
前提: 機械学習: 教師あり学習(分類と回帰・特徴量とラベル)→次: 機械学習: ワークフロー(scikit-learn で学習→評価)
意味グラフ(この教材と内容的に近い教材・1ネスト)
例え(Analogies)
評価=模試と本番

見たことのある問題(訓練)で高得点でも実力とは限らない。初見(テスト)で測る。模試(検証)で対策を調整し、本番(テスト)は一度きり。正答率だけでなく取りこぼし(再現率)も見る。

概要

📍 機械学習 ▸ 機械学習の基礎 ▸ モデル評価 | 種別: knowledge | facts_as_of 2026-06

公式ドキュメント — knowledge

🎞 スライド

評価=「未知データでの性能」

訓練で良いだけでは意味がない

データ3分割(テキスト図)

[全データ]
├─ 訓練(train) … 学習する
├─ 検証(val) … 調整・選択する
└─ テスト(test) … 最後に1回だけ測る(触らない)

過学習に注意

訓練だけ高得点・検証で落ちる=過学習
指標は正解率だけでなく precision/recall も見る

—
出典(sources)

scikit-learn (model evaluation) ; 2026-06確認

確認問題(Review-Questions)
不均衡データで正解率以外に見るべき指標は?択一
応用公式
解答・解説▾ 開く

適合率(precision)・再現率(recall)・F1。

過学習とは?記述
基礎公式
解答・解説▾ 開く

訓練データに適合しすぎて未知データで性能が落ちること。

目次
例え概要公式ドキュメント出典確認問題
鮮度
最新
更新: 2026-06-15
次回棚卸し: 2028-06-15
周期: 24か月
版: 機械学習一般
train/val/test分割と過学習
train/val/test分割と過学習

概要

モデルの良さは**「未知データでの性能」。データを訓練/検証/テストに分け、過学習(訓練だけ良い)を避ける。指標は正解率だけでなく適合率/再現率**も見る。

公式ドキュメント準拠

  • train/validation/test 分割。過学習/未学習。交差検証で安定評価。
  • 指標:accuracy(正解率)/precision(適合率)/recall(再現率)/F1。
  • 不均衡データでは正解率が誤解を招く(precision/recall を見る)。

出典: scikit-learn: Model evaluation(facts_as_of 2026-06)

🧭 誤解訂正集

よくある誤解 正しい理解
正解率が高ければ良い 不均衡だと誤解(precision/recall を見る)
テストデータで調整 リークになる(検証データで調整)
訓練の点が高い=良いモデル 過学習かもしれない(未知データで測る)

📖 用語

  • 訓練/検証/テスト … 学習用 / 調整・選択用 / 最終評価用に分けたデータ。
  • 過学習(overfitting) … 訓練データに合わせすぎ、未知データで性能が落ちる状態。
  • 交差検証 … データを入れ替えて複数回評価し、安定した推定を得る方法。
  • 適合率(precision) … 「陽性と予測したうち本当に陽性」の割合。
  • 再現率(recall) … 「本当の陽性のうち拾えた」割合。
  • F1 … 適合率と再現率のバランス指標。
  • 不均衡データ … クラスの件数が大きく偏ったデータ。

✅ 確認の目安(can-do)

なぜ訓練/検証/テストを分けるかを説明し、**「この結果は過学習か・どの指標を見るべきか(不均衡なら precision/recall)」**を判断できる。