diff --git a/pages/models/_meta.jp.json b/pages/models/_meta.jp.json index 253eb2d45..c847c221b 100644 --- a/pages/models/_meta.jp.json +++ b/pages/models/_meta.jp.json @@ -1,6 +1,7 @@ { "flan": "Flan", "chatgpt": "ChatGPT", + "claude-3": "Claude 3", "llama": "LLaMA", "gpt-4": "GPT-4", "mistral-7b": "Mistral 7B", diff --git a/pages/models/claude-3.jp.mdx b/pages/models/claude-3.jp.mdx new file mode 100644 index 000000000..14f397b3f --- /dev/null +++ b/pages/models/claude-3.jp.mdx @@ -0,0 +1,26 @@ +# Claude 3 + +AnthropicはClaude 3 Haiku、Claude 3 Sonnet、Claude 3 Opusを含む新しいモデル群、Claude 3を発表しました。 + +Claude 3 Opus(最も強力なモデル)はMMLUやHumanEvalのような一般的なベンチマークにおいて、GPT-4や他のすべてのモデルを凌駕することが報告されています。 + +## Results and Capabilities + +Claude 3は高度な推論や数学的能力だけでなく、データ分析、予測、コンテンツ作成、コード生成といった幅広いタスクをこなすことができます。さらに、スペイン語、日本語、フランス語など、複数の言語に対応しているのも特徴です。以下の表は複数のベンチマークにおいてClaude 3が他のモデルを凌駕していることを示しています。特にClaude 3 Opusは、比較対象となった全てのモデルにおいて最高のパフォーマンスを発揮しました。 + +!["Claude 3 Benchmarks"](../../img/claude/claude-benchmark.png) + +Claude 3 Haikuはシリーズの中で最も速く最もコスト効率が高いモデルです。Claude 3 Sonnetは、以前のClaudeよりも2倍速く、OpusはClaude 2.1と同じ速さでより優れた性能を持っています。 + +Claude 3モデルは、最大20万トークンのコンテキストウィンドウをサポートし、特定の顧客に対しては100万トークンまで拡張可能な柔軟性を備えています。Claude 3 Opusは、Needle In A Haystack(NIAH)評価において、膨大な量のテキストデータから特定の情報を探し出す能力が非常に高いことが実証されました。これはモデルが長いコンテキストのプロンプトを理解し、関連性の高い情報を正確に抽出できることを示しています。 + +また、これらのモデルは、写真、チャート、グラフなどのの画像を理解し、処理する能力を高度に備えています。 + +!["Claude 3 Vision Capabilities"](../../img/claude/claude-vision.png) + +Anthropicはこれらのモデルが微妙なニュアンスをより深く理解し、応答しないことが減少したと述べています。Opusは答えが一つに定まらないようなオープンクエスチョンに対しても、正確な事実を基にした回答を生成し、誤った回答やハルシネーションを発生させることが減りました。さらに、Claude 3モデルは、JSON形式のような構造化データを生成する能力において前世代のClaude 2モデルを凌駕しています。 + +## References + +- [Claude 3 Haiku, Claude 3 Sonnet, and Claude 3 Opus](https://www.anthropic.com/news/claude-3-family) +- [The Claude 3 Model Family: Opus, Sonnet, Haiku](https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf) \ No newline at end of file