タイタニック号生存者予測のための特徴エンジニアリングとモデル構築
データマイニングの概要
データマイニングの基本的なフローは以下の通りです。
データ読み込みとデータ探索(統計的分析)
データの読み込みと概観
単変量分析:個々の変数がラベルに及ぼす影響
多変量分析:複数の変数がラベルに及ぼす影響
統計的なプロット
相関性分析(特徴量相関性ヒートマップ)
データクリーニングと前処理
欠損値処理
標準化、正規化
特徴エンジ ...
5月31日 20:41 投稿
奇想天外なアイデアがコードで現実になる場所
5月31日 20:41 投稿