特徴量前処理における統計変換とカテゴリエンコーディング

統計変換手法 1. 対数変換 対数変換はデータの分布を正規分布に近づける効果があり、特に右裾が長い分布に有効です。 # Python実装例 import numpy as np df['log_income'] = np.log1p(df['income']) 2. Box-Cox変換 正規分布に近づけるためのパラメトリックな変換手法です。 # Python実装例 from scipy import stats transformed, lambda_val = stats.boxcox(df['val ...

6月2日 18:48 投稿