機械学習 - 異端開発室 | 奇想天外なアイデアがコードで現実になる場所

機械学習

ニューラルネットワークにおける活性化関数

活性化関数はニューラルネットワークにおいて不可欠な要素であり、ニューロンの出力値を決定する非線形変換を実装します。この関数により、ネットワークは複雑な非線形パターンを学習可能になります。 1. 活性化関数の必要性活性化関数が存在しない場合、ニューラルネットワークの各層は線形変換（重み付き和）のみを実行します。複数層を重ねても全体は単一の線形モデ ...

7月4日 21:14 投稿

KDD Cup 2015 コース離脱予測モデルの開発

KDD Cup 2015の二値分類問題、コースからの離脱予測に関する実装を整理します。データ前処理：NumPyとPandasライブラリを用いた特徴量の数値化処理 #!/usr/bin/env python # coding=utf-8 import pickle import pandas as pd import numpy as np # 辞書型で値をマッピング source_mapping={'server':0,'browser':1} event_mapping = {"problem":5,"vid ...

6月28日 16:31 投稿

Javaベースの統合機械学習フレームワーク：SMILEによるJVMエコシステムとのシームレスな連携

SMILEエンジンの概要と利用価値 SMILE（Statistical Machine Intelligence & Learning Engine）は、JavaおよびJVMエコシステムで活躍する開発者にとって非常に強力なツールです。このエンジンは、データ前処理からモデル訓練、視覚化、そしてプロダクション環境への展開までをカバーします。特に既存のJavaバックエンドサービスやビッグデータパイプライン（例えばSpar ...

6月27日 17:50 投稿

画像分類におけるMLPとCNNの性能比較：猫犬識別プロジェクトを通じた実践的検証

画像認識タスクにおいて、畳み込みニューラルネットワーク（CNN）は空間的特徴を効率的に抽出できるため、多層パーセプトロン（MLP）よりも優れた性能を発揮することが知られています。本稿では、猫と犬の二値分類というシンプルな課題を通じて、両者の構造的差異と学習挙動を実コードで比較・分析します。環境設定とデータ準備 Google Colab上でTensorFlow 2.xを使用し ...

6月25日 21:40 投稿

分類器の選択と評価：多クラス分類におけるロジスティック回帰の実装

はじめに前回の記事では、料理データセットの前処理（クリーニングとバランシング）を完了しました。今回は、複数の分類アルゴリズムを用いてモデルを構築し、特定の材料の組み合わせから料理の国籍を予測するタスクに取り組みます。この過程で、異なる分類アルゴリズムの評価と比較を行い、タスクに最適なモデルを選択する方法を学びます。分類アルゴリズムの選択 Sci ...

6月20日 19:36 投稿

K-MeansとDBSCANクラスタリングアルゴリズムの徹底解説

クラスタリングアルゴリズムの概要 K-MeansとDBSCANは、データマイニングや機械学習の分野で広く利用される教師なし学習アルゴリズムです。これらのアルゴリズムは、ラベル付けされていないデータから自然なグループ（クラスター）を発見するために使用されます。 K-Meansアルゴリズムの詳細 K-Meansは分割ベースのクラスタリング手法であり、データ空間内のk個の中心点 ...

6月14日 00:02 投稿

Spark機械学習：協調フィルタリングアルゴリズム

協調フィルタリング（Collaborative Filtering、CF）アルゴリズムは一般的に使用される推薦システムの手法であり、その核心思想は類似のユーザーまたはアイテムを特定し、ユーザーに類似のアイテムを推薦するか、アイテムを類似のユーザーに推奨することです。ユーザーが商品に対して好みを持つかどうかを評価する方法は多様であり、例えば評価点、購入履歴、ページ滞在時 ...

6月12日 23:29 投稿

pyenvによる機械学習環境の迅速構築：TensorFlow/PyTorch間でのスムーズな切り替え方法

pyenvによる機械学習環境の迅速構築：TensorFlow/PyTorch間でのスムーズな切り替え方法【無料ダウンロードリンク】pyenv Simple Python version management リポジトリ: https://gitcode.com/GitHub_Trending/py/pyenv pyenvは軽量なPythonバージョン管理ツールであり、複数のPythonバージョンを一度に管理し、プロジェクトごとに独立した環境を構築することが可能です。 ...

6月8日 22:24 投稿

分類アルゴリズムの基礎：不均衡データへのSMOTE適用

分類アルゴリズムの概要分類アルゴリズムは、教師あり学習における主要な手法の一つです。その目的は、入力されたデータをあらかじめ定義された複数のクラス（カテゴリ）に割り当てることです。例えば、受信したメールを「迷惑メール」と「通常メール」に分類するのは典型的な二値分類のタスクであり、一方で、料理の材料情報からその料理がどの国の料理であるかを予測す ...

6月8日 00:13 投稿

caretパッケージを用いたR言語での機械学習：前処理からモデル評価までの体系的アプローチ

Rにおけるcaretパッケージの役割と基本構造 R言語は統計解析および機械学習タスクにおいて広く利用されており、caret（Classification And Regression Training）パッケージはその中核をなすツールの一つです。このパッケージは多様な機械学習アルゴリズムに対して一貫したインターフェースを提供することで、モデルの実装コストを大幅に削減します。 200以上の学習ア ...

6月7日 17:03 投稿

1
2
3
›