畳み込みニューラルネットワークの基礎と主要アーキテクチャ

はじめに 従来の画像処理では、画像データを平坦化して入力としていました。しかし、この手法では隣接するピクセル間の空間的相関関係を無視してしまうという本質的な問題がありました。 本章で解説する畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)は、画像データの処理に特化した強力なニューラルネットワークアーキテクチャです。現在、计算 ...

6月30日 19:50 投稿

画像分類におけるMLPとCNNの性能比較:猫犬識別プロジェクトを通じた実践的検証

画像認識タスクにおいて、畳み込みニューラルネットワーク(CNN)は空間的特徴を効率的に抽出できるため、多層パーセプトロン(MLP)よりも優れた性能を発揮することが知られています。本稿では、猫と犬の二値分類というシンプルな課題を通じて、両者の構造的差異と学習挙動を実コードで比較・分析します。 環境設定とデータ準備 Google Colab上でTensorFlow 2.xを使用し ...

6月25日 21:40 投稿

PyTorchを用いた自動車ナンバープレート認識システムの実装

環境設定 import torch import torchvision from torchvision import transforms, datasets import torch.nn as nn import torch.nn.functional as F from torch.utils.data import DataLoader, Dataset import os import PIL import pathlib import numpy as np import pandas as pd import matplotlib.pyplot as plt # デバイス設定 device = torch.device("cuda" if to ...

6月24日 16:48 投稿

ディープラーニングの入門ガイド

ディープラーニングの入門ガイド 1. はじめに この記事は、私がディープラーニングを始める際に経験したプロセスをまとめたものです。2020年の集創賽で神経ネットワークアルゴリズムの開発を担当した際の経験も含んでいます。 2020年初頭、私はディープラーニングの応用を試みるためのプロジェクトを立ち上げました。その課題はハンドジェスチャーセンシングシステムの実現 ...

6月21日 20:30 投稿

PyTorchでMNISTの手書き数字認識モデルを構築する

開発環境設定 WSL2(Ubuntu 22.04) + PyTorch 2.1.2 + Python 3.9.18環境構築 ハードウェアアクセラレーション設定 import torch # CUDA互換GPUの利用設定 device = torch.device("cuda" if torch.cuda.is_available() else "cpu") print(f"使用デバイス: {device}") データ処理パイプライン構築 データセット準備 from torchvision import datasets, transforms # ...

6月20日 16:09 投稿

CIFAR-10データセットでのCNNモデルの構築と訓練

CIFAR-10データセットを使用して卷積ニューラルネットワーク(CNN)モデルを構築し、訓練するプロセスについて説明します。ここでは、データ拡張、バッチ正規化、および学習率スケジューラーなどの技術も紹介します。 データ拡張 データ拡張は、モデルの汎化性能を向上させるために訓練データを増幅するテクニックです。 import torch import torchvision.transforms as T f ...

6月10日 18:48 投稿

中国語情報抽出のためのCNNベースツール

CNN4IE プロジェクトURL: https://github.com/jiangnanboy/CNN4IE 本プロジェクトは、CNNの様々なバリエーションを用いて中国語情報抽出を実装するものです。今後、異なるモデルが継続的に追加されていきます。 CNN4IEは、CNNの各種改良版に基づき、異なるモデルブロックを融合させ、中国語情報抽出タスクに適用しています。 概要 現在の主な機能は中国語エンティティ抽出 ...

5月31日 06:45 投稿

VGGネットワーク:モジュラー設計による画像認識モデル

深層ニューラルネットワークの設計において、モジュラー構造を導入した代表的なアーキテクチャがVGGネットワークである。VGGは畳み込み層の繰り返しブロックを基本単位とし、画像認識タスクにおける高い精度を実現した。 VGGブロックの構成 VGGブロックは複数の畳み込み層とプーリング層で構成される。各畳み込み層の特徴は: カーネルサイズ:3×3 パディング:1( ...

5月18日 08:45 投稿