KDD Cup 2015 コース離脱予測モデルの開発
KDD Cup 2015の二値分類問題、コースからの離脱予測に関する実装を整理します。
データ前処理:NumPyとPandasライブラリを用いた特徴量の数値化処理
#!/usr/bin/env python
# coding=utf-8
import pickle
import pandas as pd
import numpy as np
# 辞書型で値をマッピング
source_mapping={'server':0,'browser':1}
event_mapping = {"problem":5,"vid ...
6月28日 16:31 投稿