KDD Cup 2015 コース離脱予測モデルの開発

KDD Cup 2015の二値分類問題、コースからの離脱予測に関する実装を整理します。 データ前処理:NumPyとPandasライブラリを用いた特徴量の数値化処理 #!/usr/bin/env python # coding=utf-8 import pickle import pandas as pd import numpy as np # 辞書型で値をマッピング source_mapping={'server':0,'browser':1} event_mapping = {"problem":5,"vid ...

6月28日 16:31 投稿