Transformer - 異端開発室 | 奇想天外なアイデアがコードで現実になる場所

Transformer

3D医学画像セグメンテーションにおけるモデル比較と改善戦略

プロジェクト概要本プロジェクトは、多臓器CTデータセットを対象とした3D医学画像セグメンテーションを目的としています。アルゴリズム部分は主に二つのタスクから構成されています。提供されたベースライン（nnU-Net）を基に、データ拡張、ハイパーパラメータチューニング、および粗分割から細分割へ（Coarse-to-Fine）の戦略を適用し、10分割交差検証による平均Dice係 ...

6月27日 17:21 投稿

GPT-2がもたらしたNLPのパラダイムシフトと実用化への道筋

Transformerアーキテクチャの進化が可能にした自然言語処理の飛躍自然言語処理（NLP）における文脈理解の限界や、リソース消費量によるデプロイ障壁に直面している開発者にとって、GPT-2は重要な転換点を示したモデルです。1.24億のパラメータを持つこのモデルは、純粋なデコーダ型Transformerを用いながら、ゼロショット学習において従来モデルを上回る性能を発揮しまし ...

6月2日 22:21 投稿

Qwen3-32B-MLX-8bit：単一モデルにおけるデュアルモード推論の実現

大規模言語モデルの効率革新 Qwen3-32B-MLX-8bitは328億パラメータを有するアーキテクチャにおいて、複雑な推論タスクと高効率な対話処理を単一モデルで動的に切り替える技術を実装。企業向けAIアプリケーションのデプロイコストを60%削減するブレークスルーを達成。業界の課題：効率性と性能のトレードオフ大規模言語モデルはパラメータ規模の拡大に伴いデプロイコスト ...

6月1日 16:21 投稿

Hunyuan-MT-7Bを用いた仏教梵語経典の現代的な翻訳試み

仏教梵語経典の現代的な翻訳にHunyuan-MT-7Bを使用する可能性近年、デジタル人文学の進展とともに、千年以上にわたって保存されてきた宗教典籍を現代的に活用する方法が注目されています。特に、高度に凝縮された言葉と複雑な文法構造を持つ仏教梵語経典は、専門的な知識を持つ少数の学者に依存してきました。この過程は時間がかかり、また解釈の違いにより異なるバージョ ...

5月29日 08:47 投稿

大規模言語モデル（LLM）は、自然言語を理解・生成する能力を持つAIシステムであり、その動作原理は主に三つの段階から成り立っている：事前学習（Pretraining）、微調整（Fine-tuning）、および人間からのフィードバックに基づく強化学習（RLHF）。文書補完モデル vs 対話型モデル基本的なLLMは「文書補完器」として機能する。例えば、入力が「A banana is」であれば、 ...

5月28日 07:43 投稿

MindSpore NLPで実行するオープンソース音楽生成：MusicGenの活用ガイド

AIによる音楽生成は、近年特に注目を集める分野です。Suno AIのV3が話題を呼ぶ一方で、商用利用も可能な完全オープンなソリューションとして、Metaが開発したMusicGenがMindSpore NLPを通じて利用可能になりました。 MusicGenは、テキストプロンプトや既存のオーディオを条件として、高品質な音楽波形を直接生成できる単一Transformerベースのモデルです。MindSpore NLPで ...

5月17日 22:14 投稿

BERTを活用した大規模テキスト処理の実践的手法

はじめに自然言語処理（NLP）分野において、Transformerベースの大規模言語モデルは革命的な進展をもたらしている。特にBERT（Bidirectional Encoder Representations from Transformers）は、その革新的な双方向アーキテクチャにより、質問応答から感情分析まで幅広いタスクで最先端の性能を達成している。本稿では、BERTの基本概念を体系的に解説するとともに、大規模テ ...

5月13日 21:24 投稿

異端開発室