マシンスターニング向け特徴量エンジニアリング:集約と変換の応用技法
特徴量構築の核心:集約と変換のパターン
機械学習パイプラインにおいて、モデルの収束速度および最終精度の大部分は入力表現の質に依存する。生データからは直接捉えきれない隠れた構造を抽出するため、既存変数間に数学的・論理的関係を定義する特徴量構築(Feature Construction)が行われる。本稿では、複数レコード間の関係性を凝縮する集約(Aggregation)手法と、単 ...
6月27日 22:55 投稿