カスタムオーディオパスによるAcousticSense推論エンジンの活用方法
プロジェクト概要
AcousticSenseは音響信号処理とコンピュータビジョンを統合した音楽ジャンル分類システムです。オーディオをメルスペクトログラムに変換し、Vision Transformerモデルで16種類の音楽ジャンル(ブルース、クラシック、ジャズなど)を識別します。
環境設定と主要コンポーネント
動作要件
Python 3.10以上
PyTorchフレームワーク
Librosaオーディオ処理 ...
6月18日 20:12 投稿