大規模言語モデル - 異端開発室 | 奇想天外なアイデアがコードで現実になる場所

大規模言語モデル

Qwen-7BおよびQwen-7B-Chatのオープンソース公開と商用利用ライセンス

モデル概要と公開リポジトリアリババクラウドは、約70億パラメータを備える大規模言語モデル「Qwen-7B」および対話最適化版「Qwen-7B-Chat」をオープンソース化し、無料での商用利用を正式に提供した。モデルウェイト、推論スクリプト、および関連ドキュメントは以下のプラットフォームで公開されている。 GitHub: https://github.com/QwenLM/Qwen-7B Hugging Face: http ...

6月24日 17:51 投稿

LLMをより賢くするためのプロンプト設計入門

現在の社会では、AIGCの普及に伴い、効果的なプロンプトの使い方を知ることは重要です。本記事では、iFlytekの星火大モデルを例に、プロンプト設計の基本と実践的なテクニックを解説します。星火大モデルは、中国のiFlytekが開発した大規模言語モデルです。強力な中国語創作能力を持ち、複雑な文脈での論理的推論を処理し、様々なタスクを実行できます。星火大モデル ...

6月18日 16:28 投稿

Qwen3-ASR-1.7Bを活用した教育現場向けスマート教室音声文字起こしシステム

素晴らしい授業を聞き終わった後、メモを整理しようとしたら、多くの重要なポイントが思い出せないという経験はありませんか？あるいは、教師として自分の授業を振り返りたいのに、完全な記録が見つからない、ということも。従来の録音デバイスは音声しか記録できず、後で文字に起こすのは時間と労力がかかり、しかもアクセント、専門用語、環境ノイズのために、文字起こ ...

6月16日 22:40 投稿

ms-swiftを活用した世論調査データ分析システム

ms-swiftを活用した世論調査データ分析システム現代のソーシャルメディアでは毎分数百万件のフィードバックが生成されており、大量で断片的かつ感情的なテキストから真の民意を迅速に抽出することは、政府の意思決定、世論監視、市場調査における重要な課題となっています。従来のアンケート符号化は人間による読解と分類に依存しており、時間と労力を要するだけでなく、 ...

6月13日 16:07 投稿

大規模言語モデルのトレーニングプロセス：事前学習から強化学習までの完全ガイド

ChatGPTがなぜ「次の単語を予測するだけの言語モデル」から「質問に答える知能エージェント」へ進化したのか、ご存知ですか？本記事ではその秘密を解き明かします。一、序論：大規模言語モデルの「成長過程」子供を優秀な作家に育てるには、どのように教えますか？読書と文字の習得：まず大量の書籍を読ませ、言語の基本規則と知識を習得させる文章作成の練習：例え ...

6月1日 08:30 投稿

AI技術学習ノートシリーズ001：FastLanguageModel.get_peft_model関数の各パラメータ詳細解説

以下に、コード内のFastLanguageModel.get_peft_model関数の各パラメータに関する詳細な解説と、実際の企業環境でのファインチューニングにおける選択基準を示します：パラメータの詳細とファインチューニングへの影響 1. r=32（ランク）役割：LoRAアダプターの低ランク行列の次元を制御し、訓練可能なパラメータ数に直接影響します。影響： rが大きい場合：アダプター ...

5月25日 07:07 投稿

大規模モデルトレーニング完全ガイド：監督学習からデータ前処理まで

モデルトレーニング手法監督学習監督学習：AIモデルはラベル付きのデータサンプルを使用して学習し、サンプルの実際の値と予測値から損失（Loss）値を計算します。監督学習ではデータサンプルにラベル付けが必要なため、データ量が少ないシナリオにのみ適用されます。 MPモデルの論理ゲートが最も基本的な監督学習のトレーニング例です。非監督学習非監督学習：AIモデ ...

5月19日 07:11 投稿

大規模言語モデルを用いたテキスト分類の基礎と応用

前章では、埋め込み表現を核とする類似度マッチングの基本と、その技術が実現するタスクやアプリケーションについて解説しました。埋め込み表現は、テキストを意味的に効率的に表現することに焦点を当て、通常はコサイン類似度で関連性を評価します。テキストだけでなく、あらゆるオブジェクトが埋め込み表現可能であり、この技術が深層学習アルゴリズムの多岐にわたる分野 ...

5月13日 09:09 投稿

ホットタグ