特徴量前処理における統計変換とカテゴリエンコーディング
統計変換手法
1. 対数変換
対数変換はデータの分布を正規分布に近づける効果があり、特に右裾が長い分布に有効です。
# Python実装例
import numpy as np
df['log_income'] = np.log1p(df['income'])
2. Box-Cox変換
正規分布に近づけるためのパラメトリックな変換手法です。
# Python実装例
from scipy import stats
transformed, lambda_val = stats.boxcox(df['val ...
6月2日 18:48 投稿