K-MeansとDBSCANクラスタリングアルゴリズムの徹底解説
クラスタリングアルゴリズムの概要
K-MeansとDBSCANは、データマイニングや機械学習の分野で広く利用される教師なし学習アルゴリズムです。これらのアルゴリズムは、ラベル付けされていないデータから自然なグループ(クラスター)を発見するために使用されます。
K-Meansアルゴリズムの詳細
K-Meansは分割ベースのクラスタリング手法であり、データ空間内のk個の中心点 ...
6月14日 00:02 投稿
RNA-seq解析:尤度比検証による遺伝子発現変動の特定
学習内容
尤度比検証(LRT)を仮説検定に応用する方法
LRTで生成された結果をWald検証の結果と比較する
LRTの有意な遺伝子リストから共通の発現パターンを特定する
尤度比検証
2つ以上のレベルにおける発現変化を評価する際、DESeq2はWald検証に代わる方法として尤度比検証(LRT)を提供します。重要と判定される遺伝子は、因子レベル間でいずれの方向にも発現が変化する ...
6月11日 19:55 投稿
Redisの4つのモード
主従モード
Redisの主従モードは、主サーバーと従サーバーの関係を構築するシンプルな方法です。一対一の主従関係や一対多の主従関係を設定可能です。
主従モードの設定は非常に簡単です。従サーバーの設定ファイルに以下を追加します。
slaveof <master-ip> <master-port>
# 例えば
# slaveof 192.168.1.197 6379
メリット:
設定が簡単で、柔軟性がありま ...
5月27日 03:23 投稿
SparkによるK-Meansクラスタリングの実装
K-Meansアルゴリズムは距離ベースのクラスタリング手法であり、反復処理を用いてK個のクラスタ中心を計算し、データポイントをK個のクラスに分類します。
MLlibにおけるK-Meansアルゴリズムの実装原理は、複数のK-Means実行(各実行をrunと呼びます)を行い、最も優れたクラスタリング結果を中心として返します。初期のクラスタ中心はランダムに設定されるか、KMean++アル ...
5月24日 17:57 投稿
Pythonによる非教師学習:K平均法(K-Means)の実装と可視化
K平均法(K-Means)の基本概念
K平均法は、教師なし学習における代表的な分割型クラスタリングアルゴリズムです。与えられたデータ集合をユーザーが指定した数(K個)のグループに分類し、各データポイントが自身に割り当てられたクラスタの重心(平均ベクトル)とユークリッド距離的に最も近くなるよう反復的に最適化を行います。この手法は「類似した特徴を共有するデー ...
5月21日 18:48 投稿
Dockerを使用したMongoDBレプリカセットの構築手順
0 Dockerイメージの取得
docker pull mongo:5.0.9
1 マスターとスレーブサーバーのディレクトリ作成
mkdir -p /data/mongo/primary
mkdir -p /data/mongo/secondary
mkdir -p /data/mongo/config
mkdir -p /data/mongo/logs
2 セキュリティキーの生成
openssl rand -base64 756 > /data/mongo/config/mongo_security.key
chmod 600 /data/mongo/config/mongo_securi ...
5月20日 18:24 投稿
クラスタリング分析の実践ノート
1. 必要なライブラリのインポートとデータの読み込み
import pandas as pd
import numpy as np
from scipy import stats
from sklearn.cluster import KMeans
from scipy.spatial.distance import cdist
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
file_path = '1999年全国31个省 ...
5月12日 16:51 投稿