データ可視化の実装手法
基本プロット作成
Matplotlibを用いた基本的なプロット作成手順:
import numpy as np
import matplotlib.pyplot as plt
x_values = np.linspace(0, 2*np.pi, 100)
sine_wave = np.sin(x_values)
cosine_wave = np.cos(x_values)
plt.title("三角関数の比較")
plt.plot(x_values, sine_wave)
plt.plot(x_values, cosine_wave)
plt.show()
棒グラフの作成
縦型・横型棒 ...
6月3日 23:21 投稿
タイタニック号生存者予測のための特徴エンジニアリングとモデル構築
データマイニングの概要
データマイニングの基本的なフローは以下の通りです。
データ読み込みとデータ探索(統計的分析)
データの読み込みと概観
単変量分析:個々の変数がラベルに及ぼす影響
多変量分析:複数の変数がラベルに及ぼす影響
統計的なプロット
相関性分析(特徴量相関性ヒートマップ)
データクリーニングと前処理
欠損値処理
標準化、正規化
特徴エンジ ...
5月31日 20:41 投稿