多模态AI - 異端開発室 | 奇想天外なアイデアがコードで現実になる場所

多模态AI

28億パラメータが企業AI変革を牽引：DeepSeek-VL2-smallが多模态の民主化時代を開始

28億パラメータが企業AI変革を牽引：DeepSeek-VL2-smallが多模态の民主化時代を開始 DeepSeek-VL2-smallは、視覚と言語を融合させた革新的な多模态モデルです。MoE（Mixture of Experts）技術を採用し、パラメータ効率に優れ、卓越した性能を発揮します。視覚質問応答などの多様なタスクを軽快に処理し、スマートな多模态理解の新時代を切り拓きます。導入わずか28億 ...

6月15日 23:22 投稿

Qwen Omni多模态モデルとUnityの統合実装

Qwen Omni多模态モデルの概要 Alibabaが公開したQwen Omniは多模态AIモデルで、テキスト/音声/画像/動画を入力として処理し、テキストと音声を同時出力します。ローカル実行には70GB以上のVRAMが必要ですが、API経由で効率的に利用可能です。 APIインターフェース仕様基本リクエストはOpenAI形式と互換性があり、modalitiesパラメータで出力形式を制御します。 curl -X ...

6月8日 20:54 投稿

異端開発室

28億パラメータが企業AI変革を牽引：DeepSeek-VL2-smallが多模态の民主化時代を開始

Qwen Omni多模态モデルとUnityの統合実装

ホットタグ