クラスタリング - 異端開発室 | 奇想天外なアイデアがコードで現実になる場所

クラスタリング

K-MeansとDBSCANクラスタリングアルゴリズムの徹底解説

クラスタリングアルゴリズムの概要 K-MeansとDBSCANは、データマイニングや機械学習の分野で広く利用される教師なし学習アルゴリズムです。これらのアルゴリズムは、ラベル付けされていないデータから自然なグループ（クラスター）を発見するために使用されます。 K-Meansアルゴリズムの詳細 K-Meansは分割ベースのクラスタリング手法であり、データ空間内のk個の中心点 ...

6月14日 00:02 投稿

RNA-seq解析：尤度比検証による遺伝子発現変動の特定

学習内容尤度比検証（LRT）を仮説検定に応用する方法 LRTで生成された結果をWald検証の結果と比較する LRTの有意な遺伝子リストから共通の発現パターンを特定する尤度比検証 2つ以上のレベルにおける発現変化を評価する際、DESeq2はWald検証に代わる方法として尤度比検証（LRT）を提供します。重要と判定される遺伝子は、因子レベル間でいずれの方向にも発現が変化する ...

6月11日 19:55 投稿

主従モード Redisの主従モードは、主サーバーと従サーバーの関係を構築するシンプルな方法です。一対一の主従関係や一対多の主従関係を設定可能です。主従モードの設定は非常に簡単です。従サーバーの設定ファイルに以下を追加します。 slaveof <master-ip> <master-port> # 例えば # slaveof 192.168.1.197 6379 メリット：設定が簡単で、柔軟性がありま ...

5月27日 03:23 投稿

SparkによるK-Meansクラスタリングの実装

K-Meansアルゴリズムは距離ベースのクラスタリング手法であり、反復処理を用いてK個のクラスタ中心を計算し、データポイントをK個のクラスに分類します。 MLlibにおけるK-Meansアルゴリズムの実装原理は、複数のK-Means実行（各実行をrunと呼びます）を行い、最も優れたクラスタリング結果を中心として返します。初期のクラスタ中心はランダムに設定されるか、KMean++アル ...

5月24日 17:57 投稿

Pythonによる非教師学習：K平均法（K-Means）の実装と可視化

K平均法（K-Means）の基本概念 K平均法は、教師なし学習における代表的な分割型クラスタリングアルゴリズムです。与えられたデータ集合をユーザーが指定した数（K個）のグループに分類し、各データポイントが自身に割り当てられたクラスタの重心（平均ベクトル）とユークリッド距離的に最も近くなるよう反復的に最適化を行います。この手法は「類似した特徴を共有するデー ...

5月21日 18:48 投稿

Dockerを使用したMongoDBレプリカセットの構築手順

0 Dockerイメージの取得 docker pull mongo:5.0.9 1 マスターとスレーブサーバーのディレクトリ作成 mkdir -p /data/mongo/primary mkdir -p /data/mongo/secondary mkdir -p /data/mongo/config mkdir -p /data/mongo/logs 2 セキュリティキーの生成 openssl rand -base64 756 > /data/mongo/config/mongo_security.key chmod 600 /data/mongo/config/mongo_securi ...

5月20日 18:24 投稿

クラスタリング分析の実践ノート

1. 必要なライブラリのインポートとデータの読み込み import pandas as pd import numpy as np from scipy import stats from sklearn.cluster import KMeans from scipy.spatial.distance import cdist from sklearn.preprocessing import StandardScaler import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns file_path = '1999年全国31个省 ...

5月12日 16:51 投稿

異端開発室