DenseNetにSEモジュールを統合した猴痘ウイルス画像分類モデルの実装
データ準備と前処理
必要なライブラリをインポートし、画像データをロードする。
import torch
import torch.nn as nn
import torchvision.transforms as T
from torchvision.datasets import ImageFolder
from pathlib import Path
from PIL import Image
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
データディレクトリからク ...
5月18日 21:27 投稿
PyTorch Memonger プロジェクトのよくある質問と解決策
PyTorch Memonger プロジェクトのよくある質問と解決策
1. プロジェクトの概要と主な技術スタック
PyTorch Memonger は、PyTorch モデルのメモリ使用量を最適化するためのオープンソースプロジェクトです。このプロジェクトでは、勾配チェックポイント(gradient checkpointing)という手法を活用し、計算量とメモリ使用量のバランスを取ることで、より大きなモデルやバッ ...
5月18日 19:25 投稿
VGGネットワーク:モジュラー設計による画像認識モデル
深層ニューラルネットワークの設計において、モジュラー構造を導入した代表的なアーキテクチャがVGGネットワークである。VGGは畳み込み層の繰り返しブロックを基本単位とし、画像認識タスクにおける高い精度を実現した。
VGGブロックの構成
VGGブロックは複数の畳み込み層とプーリング層で構成される。各畳み込み層の特徴は:
カーネルサイズ:3×3
パディング:1( ...
5月18日 08:45 投稿
AIモデルのフォーマット変換プロセス
機械学習フレームワークを使用する際、学習環境と推論環境が異なる場合があります。たとえば、画像認識モデルをCaffeで学習したものの、本番環境ではTensorFlowで推論を行うといったケースです。
このような状況に対応するために、異なる学習フレームワークで作成されたモデル間の相互変換が求められます。モデル変換には主に「直接変換」と「規格化変換」の2つのアプロー ...
5月17日 21:13 投稿
高齢者向け薬剤パッケージ認識システムの構築
視覚支援技術による高齢者の服薬ミス防止
日本の高齢化が進む中、視力の低下や記憶力の衰えに伴い、誤った薬の服用や飲み忘れ、重複投与といった問題が深刻化しています。厚生労働省の調査によると、65歳以上の高齢者の約35%が過去に何らかの服薬エラーを経験しており、その主な要因の一つが薬の包装容器の見分けにくさです。こうした課題に対し、AIを活用した画 ...
5月17日 15:19 投稿
意図認識とスロットフィルインの統合モデルにおけるCNN自己注意の改良
1.概要
本モデルは、Convolutional Sequence to Sequence Learningのエンコーダ部を改良したものです。もともとは機械翻訳に使用されていたモデルを、質問応答におけるスロットフィルインと意図認識の統合モデリングに再利用しています。
主な改良点は以下の通りです:
1. 複数のサイズを持つ畳み込みカーネルを使用して多様な特徴抽出を行う。
2. 多頭注意機構を追加し、 ...
5月16日 18:09 投稿
PyTorch自動微分のリバースモード実装
基礎理論
演算子オーバーロード(OO)とリバースモード自動微分の概念を組み合わせた実装手法について解説する。Pythonを用いてPyTorchのコアメカニズムを再現する。
演算子オーバーロード手法
現代プログラミング言語の多態性を利用し、基本演算子の微分規則をカプセル化する。演算子の再定義により計算グラフを構築し、連鎖律で微分結果を合成する。
利点
実装 ...
5月16日 09:26 投稿
DiT (Diffusion Transformer) のアーキテクチャと潜在拡散推論パイプライン実装解析
DiTの基本概念と潜在拡散の枠組み
DiT(Diffusion Transformer)は、従来の拡散モデルにおいてU-Netバックボーンを純粋なTransformer構造へ置換したモデルアーキテクチャである。テキスト生成や動画生成で採用されている大規模トランスフォーマーと画像生成パイプラインの構造を統一することで、スケーラビリティと最適化効率を向上させることを目的としている。潜在拡散モ ...
5月14日 17:02 投稿