4GB以下の軽量モデルで実現する、スマートフォーム自動入力システム構築
非構造化テキストから構造データを抽出するAIワークフロー
日常の業務には、メールやチャットログ、PDF文書などに散在する情報を手作業でExcelやフォームに入力する作業が多く含まれます。このプロセスは時間と労力を消費し、ヒューマンエラーのリスクも高まります。本稿では、qwen2.5:4b-instruct-2507 という小型ながら高性能な言語モデルを活用し、自然言語からの情報抽 ...
6月21日 00:52 投稿
Qwen Omni多模态モデルとUnityの統合実装
Qwen Omni多模态モデルの概要
Alibabaが公開したQwen Omniは多模态AIモデルで、テキスト/音声/画像/動画を入力として処理し、テキストと音声を同時出力します。ローカル実行には70GB以上のVRAMが必要ですが、API経由で効率的に利用可能です。
APIインターフェース仕様
基本リクエストはOpenAI形式と互換性があり、modalitiesパラメータで出力形式を制御します。
curl -X ...
6月8日 20:54 投稿
Qwen3-32B-MLX-8bit:単一モデルにおけるデュアルモード推論の実現
大規模言語モデルの効率革新
Qwen3-32B-MLX-8bitは328億パラメータを有するアーキテクチャにおいて、複雑な推論タスクと高効率な対話処理を単一モデルで動的に切り替える技術を実装。企業向けAIアプリケーションのデプロイコストを60%削減するブレークスルーを達成。
業界の課題:効率性と性能のトレードオフ
大規模言語モデルはパラメータ規模の拡大に伴いデプロイコスト ...
6月1日 16:21 投稿
金倉データを用いたLoRAファインチューニングとSpring AIによるカスタムQwenモデル構築
LoRA技術の概要
大規模言語モデルのファインチューニングには、高い計算リソースと専門知識が必要とされます。LoRA(Low-Rank Adaptation)技術は、モデル全体を再トレーニングすることなく、特定タスクに特化した効率的な調整を可能にします。この手法により、既存の事前学習済みモデルを基盤として、企業固有のデータでカスタマイズすることが現実的になります。
環境構 ...
5月11日 13:06 投稿