Gemini 2.5 Pro:コード生成における新たな王者?

2025-03-31
Gemini 2.5 Pro:コード生成における新たな王者?

3月26日にリリースされたGoogleのGemini 2.5 Proは、コーディング、推論、全体的な性能において最高であると主張しています。この記事では、Gemini 2.5 Proともう一つの強力なコーディングモデルであるClaude 3.7 Sonnetを比較します。4つのコーディング課題を通して、Gemini 2.5 Proは精度と効率において顕著な優位性を示しました。特に、100万トークンのコンテキストウィンドウにより、複雑なタスクの処理が可能になっています。Claude 3.7 Sonnetも良好なパフォーマンスを示しましたが、Gemini 2.5 Proとの直接比較ではその優位性は薄れています。Gemini 2.5 Proの無料利用も魅力の一つです。

続きを読む
AI

Deepseek v3:6070億パラメーターのオープンソースLLM、GPT-4を低コストで凌駕?

2025-01-02
Deepseek v3:6070億パラメーターのオープンソースLLM、GPT-4を低コストで凌駕?

Deepseekは、フラッグシップモデルであるv3を発表しました。これは、6070億パラメーターのMixture-of-Expertsモデルで、370億パラメーターがアクティブです。ベンチマークテストでは、OpenAIのGPT-4oやClaude 3.5 Sonnetと互角、場合によってはそれらを上回る性能を示し、Llama 3.1 403b、Qwen、Mistralを凌駕する現在の最上位オープンソースモデルとなっています。驚くべきことに、Deepseek v3はこの性能をわずか約600万ドルで実現しました。これは、MoEアーキテクチャ、FP8混合精度トレーニング、カスタムHAI-LLMフレームワークといった画期的なエンジニアリング技術によるものです。推論と数学においては、GPT-4やClaude 3.5 Sonnetを上回る性能を示していますが、ライティングやコーディングではやや劣ります。コストパフォーマンスが非常に高く、クライアント向けのAIアプリケーションを構築する開発者にとって魅力的な選択肢となります。

続きを読む