PyTorchを用いたMask R-CNNの分散学習環境構築と高速化テクニック

PyTorchを利用したMask R-CNNの分散学習環境構築と高速化テクニック Mask R-CNNは、物体検出およびインスタンスセグメンテーション分野において高い性能を誇るアルゴリズムです。しかし、高解像度画像の処理や大規模データセットのトレーニングにおいては、単一のGPUリソースだけではメモリ不足や長い収束時間に直面するケースが頻繁に発生します。本記事では、ハードウェ ...

6月28日 21:20 投稿

SAM-Med3D: 高効率なプロンプト対応3D医用画像セグメンテーションモデルのインストールと使用ガイド

プロジェクト概要 SAM(Segment Anything Model)は2D自然画像のセグメンテーションにおいて優れた性能を発揮しますが、3Dボリューム医用画像に対しては性能が限界に達し、予測が不安定で、満足のいく結果を得るために大量のプロンプトポイントが必要となるという問題があります。これらの問題は、SAMを医療データで微調整するだけでは解決できません。なぜなら、その元の2 ...

6月26日 00:06 投稿

MMDetectionにおけるFaster R-CNNの実装構造

MMDetectionのFaster R-CNNモデルは、設定ファイル(例: faster_rcnn_r50_fpn.py)内でtype='FasterRCNN'と指定され、対応する実装はmmdet/models/detectors/faster_rcnn.pyに存在する。 from ..builder import DETECTORS from .two_stage import TwoStageDetector @DETECTORS.register_module() class FasterRCNN(TwoStageDetector): """Faster R-CNNの実装 (論文: ...

6月25日 21:09 投稿

Eコマース画像審査の自動化:Aliの中国語認識モデルを統合した実践例

Eコマース画像審査の自動化:Aliの中国語認識モデルを統合した実践例 Eコマースプラットフォームの運用において、商品画像のコンプライアンス審査は頻度が高く、コストのかかる作業です。従来の人的審査は効率が悪く、疲労や主観的な判断により漏れや誤判定が発生するリスクがあります。AIビジョン技術の進化により、**画像内容の自動認識と審査**がプラットフォームの ...

6月25日 16:46 投稿

PyTorchを用いた自動車ナンバープレート認識システムの実装

環境設定 import torch import torchvision from torchvision import transforms, datasets import torch.nn as nn import torch.nn.functional as F from torch.utils.data import DataLoader, Dataset import os import PIL import pathlib import numpy as np import pandas as pd import matplotlib.pyplot as plt # デバイス設定 device = torch.device("cuda" if to ...

6月24日 16:48 投稿

モデルのトレーニングプロセス

データセットの準備 import torchvision training_dataset = torchvision.datasets.CIFAR10("./cifar10_data", train=True, download=True, transform=torchvision.transforms.ToTensor()) validation_dataset = torchvision.datasets.CIFAR10("./cifar10_data", train=False, download=True, ...

6月23日 16:56 投稿

ディープラーニングの入門ガイド

ディープラーニングの入門ガイド 1. はじめに この記事は、私がディープラーニングを始める際に経験したプロセスをまとめたものです。2020年の集創賽で神経ネットワークアルゴリズムの開発を担当した際の経験も含んでいます。 2020年初頭、私はディープラーニングの応用を試みるためのプロジェクトを立ち上げました。その課題はハンドジェスチャーセンシングシステムの実現 ...

6月21日 20:30 投稿

XTunerを用いたQLoRAによるパーソナルアシスタントLLMの知識注入手法

XTunerフレームワークを活用し、軽量大言語モデル(InternLM2-Chat-1.8B)をパーソナルアシスタントとしてカスタマイズするプロセスを解説します。QLoRA方式を採用することで、限定的なGPUメモリ環境でも効率的なパラメータ微調整が可能であり、モデルの自己認識や特定役割への適応を確実に実現できます。 環境構築と依存関係の準備 微調整作業を開始する前に、専用仮想環 ...

6月21日 01:09 投稿

YOLOベースのリアルタイムマスク検出システムの構築とWebインタフェース実装

パンデミック期における公共衛生管理の一環として、マスク着用状況の自動検出は重要な課題です。本稿では、YOLOアーキテクチャを活用したリアルタイムマスク検出システムの設計・実装プロセスを体系的に解説します。特に、YOLOv8を基盤とし、PyTorchによるカスタム学習、OpenCVを用いた推論パイプライン、およびFlaskによる軽量Webフロントエンドの統合に焦点を当てます。 ...

6月20日 22:14 投稿

ResNet18 を活用した 102 種類の花画像分類モデルの構築

102 分類花画像データセットの準備と拡張 本プロジェクトでは、102 種類の異なる花の画像を識別する分類モデルを構築します。データセット内の各クラスに含まれる画像枚数が不均一であるため、学習の安定化を図るためにデータ拡張を行い、各クラスあたり少なくとも 100 枚の画像を確保する前処理を行います。 以下のスクリプトは、既存の画像リストを読み込み、不足してい ...

6月20日 18:35 投稿