WGCNA解析による遺伝子共発ネットワークの構築
データの読み込みとクラスタリング
library(WGCNA)
# ディレクトリ名の確認
dir()
# データの読み込み
load('DEG_TB_LTBI_step13.Rdata')
# 行がサンプル名、列が遺伝子名
################################ サンプルクラスタリング ####################
datExpr = t(dataset_TB_LTBI_DEG)
# 初期クラスタリング
sampleTree = hclust(dist(datExpr), method = "av ...
6月4日 22:01 投稿
R言語による自然言語処理:テキスト分類の実装
本記事では、R言語を使用した自然言語処理の実践的な手法として、TF-IDFと類似度行列を用いた文書分類について解説します。この手法は、任意のテキストが既存のどの文書カテゴリに最も類似しているかを判断するために使用できます。
1. データ準備
まず、分析対象のデータを読み込みます。ここではCSVファイルからデータをインポートし、必要な前処理を行います。
libr ...
5月21日 02:23 投稿
TF-IDFを使ったR言語でのキーワード抽出
自然言語処理において、文書から重要な情報を効率的に抽出する技術は非常に重要です。この記事では、R言語を使用してテキストデータからキーワードを自動的に抽出する方法について説明します。特に、TF-IDF(Term Frequency-Inverse Document Frequency)というアルゴリズムに焦点を当て、その実装例を紹介します。
TF-IDFの基本概念
TF-IDFは、単語の重要度を評価するため ...
5月19日 22:02 投稿