SparkによるK-Meansクラスタリングの実装
K-Meansアルゴリズムは距離ベースのクラスタリング手法であり、反復処理を用いてK個のクラスタ中心を計算し、データポイントをK個のクラスに分類します。
MLlibにおけるK-Meansアルゴリズムの実装原理は、複数のK-Means実行(各実行をrunと呼びます)を行い、最も優れたクラスタリング結果を中心として返します。初期のクラスタ中心はランダムに設定されるか、KMean++アル ...
5月25日 02:57 投稿
奇想天外なアイデアがコードで現実になる場所
5月25日 02:57 投稿