Category: AI

OpenAIがRedditのr/ChangeMyViewを使ってAIの説得力をベンチマーク

2025-02-02
OpenAIがRedditのr/ChangeMyViewを使ってAIの説得力をベンチマーク

OpenAIは、新しい推論モデルo3-miniの説得力を評価するために、Redditのr/ChangeMyViewサブRedditを利用しました。ユーザーが意見を投稿し議論するこのサブRedditは、AIが生成した回答が意見を変える能力を評価するためのユニークなデータセットを提供しました。o3-miniはo1やGPT-4oなどの以前のモデルを大幅に上回ることはありませんでしたが、すべて強力な説得力のある能力を示し、人間のトップ80〜90パーセンタイルにランクインしました。OpenAIは、目標が非常に説得力のあるAIを作成することではなく、過度に説得力のあるモデルに関連するリスクを軽減することであると強調しています。このベンチマークは、AIモデル開発のための高品質なデータセットを確保することの継続的な課題を浮き彫りにしています。

DeepSeek-R1:中国のAI台頭とオープンソースの勝利

2025-02-02
DeepSeek-R1:中国のAI台頭とオープンソースの勝利

中国の企業DeepSeekが、OpenAIのモデルに匹敵する性能を持つ大規模言語モデルDeepSeek-R1を、オープンウェイトのMITライセンスで公開しました。これにより、米国テクノロジー企業の株価が急落する市場売却が引き起こされ、いくつかの重要なトレンドが浮き彫りになりました。中国が生成AIで米国に急速に追いついていること、オープンウェイトモデルによって基盤モデル層がコモディティ化され、アプリケーション開発者に機会が生まれること、そしてスケーリングがAIの発展の唯一の道ではなく、アルゴリズムの革新によってトレーニングコストが急速に低下していることです。DeepSeek-R1は、AI業界の変革を示唆しており、AIアプリケーション開発に新たな機会をもたらします。

AI

LLMの限界:アインシュタインのなぞなぞが明らかにするTransformerベースAIの制約

2025-02-02
LLMの限界:アインシュタインのなぞなぞが明らかにするTransformerベースAIの制約

研究者たちは、現在のTransformerベースの大規模言語モデル(LLM)が、複合的な推論タスクを解く能力に根本的な限界があることを発見しました。アインシュタインの論理パズルや多桁の乗算に関する実験では、大規模なファインチューニング後でも著しい欠陥が明らかになりました。これらの知見は、Transformerアーキテクチャが普遍的な学習に適しているかどうかという疑問を提起し、LLMの推論能力を高めるための代替アプローチ(改良されたトレーニングデータや思考連鎖プロンプトなど)の研究を促しています。

OpenAI AMA:遅れを認め、オープンソースを受け入れる?

2025-02-01
OpenAI AMA:遅れを認め、オープンソースを受け入れる?

Redditで行われた大規模なAMAで、OpenAIのCEOであるSam Altmanは、DeepSeekなどの競合他社によってOpenAIのAIにおける優位性が縮小していることを認めました。彼は、古いモデルをリリースするなど、よりオープンソース戦略への転換を示唆しました。OpenAIは、ワシントンからの圧力、大規模な資金調達ラウンド、そして大規模なデータセンターインフラストラクチャの構築の必要性にも対処しています。競争力を維持するために、同社はモデルの透明性を高め、出力の背後にある推論プロセスを明らかにする計画です。AltmanはAIの急速な進歩の可能性について楽観的な見方を示しましたが、特に兵器開発における誤用のリスクも認めました。

AI

ベアメタル環境でのDeepseek AI推論リグ構築ガイド

2025-02-01

このガイドは、ベアメタル環境でDeepseek AI推論環境を構築する方法を詳細に説明しています。AMD EPYC Romeシステムと512GBのRAMを使用して、4.25~3.5 TPSの推論速度を実現します。ハードウェアの選択、OSのインストール(Ubuntu 24.04)、OllamaとOpenWebUIの設定、BIOS設定、コマンドライン手順などを網羅しています。複雑な手順ですが、技術愛好家にとってやりがいのあるプロジェクトです。

スパースで解釈可能なオーディオコーデック:より直感的なオーディオ表現に向けて

2025-02-01

本論文では、オーディオをスパースなイベント集合とその発生時刻として符号化することを目指した、概念実証的なオーディオエンコーダを紹介しています。楽器と部屋の両方のアタックと物理的な共鳴をモデル化するために、基本的な物理に基づいた仮定を利用し、スパースで、簡潔で、解釈しやすい表現を促進することを期待しています。このモデルは、入力スペクトログラムからエネルギーを反復的に除去することで機能し、イベントベクトルと発生時刻を表すone-hotベクトルを生成します。デコーダはこれらのベクトルを使用してオーディオを再構成します。実験結果は、このモデルがオーディオを分解できることを示していますが、再構成品質の向上や冗長なイベントの削減など、改善の余地があります。

DeepSeek R1がCopilot+ PCにエッジAIをもたらす

2025-02-01
DeepSeek R1がCopilot+ PCにエッジAIをもたらす

Microsoftは、Qualcomm SnapdragonとIntel Core Ultraプロセッサを搭載したCopilot+ PC向けに最適化されたDeepSeek R1により、エッジAIの力を提供します。ニューラルプロセッシングユニット(NPU)を活用することで、DeepSeek R1はデバイス上で効率的に動作し、応答時間の短縮と消費電力の削減を実現します。開発者はAIツールキットを使用してモデルを簡単に統合し、ネイティブなAIアプリケーションを構築できます。DeepSeek R1-Distill-Qwen-1.5Bの最初のリリースと、近日公開予定の7Bおよび14Bバリアントは、効率的な推論と継続的に実行されるサービスにおけるエッジAIの可能性を示しています。

AIによる200ドルタスク制覇:進捗報告

2025-02-01
AIによる200ドルタスク制覇:進捗報告

著者は2013年に200ドルでマスコットのデザインを依頼したことを振り返り、現在AIで実現可能なタスクの種類を示しています。AIは、ロゴデザイン、文字起こし、翻訳など、明確に定義された成果を持つトランザクション型のタスクに優れています。これらは以前は専門的なスキルが必要でした。しかし、景観デザインなど、微妙な専門知識と判断力が必要なより複雑なタスクは、現在のAIの能力を超えています。AIの進歩は素晴らしいですが、有料タスク解決における経済的影響はまだ初期段階にあります。

OpenAIのo3-mini:コストパフォーマンスに優れた高性能LLM

2025-02-01

OpenAIは新しい言語モデルo3-miniを発表しました。Codeforcesプログラミングコンテストのベンチマークで、GPT-4oやo1を大きく上回る性能を示しました。全ての指標で優れているわけではありませんが、低価格(入力トークン100万あたり1.10ドル、出力トークン100万あたり4.40ドル)と非常に高いトークン出力制限(10万トークン)が大きな魅力です。OpenAIはこれをChatGPTのウェブ検索と要約機能に統合する計画で、LLM 0.21で既にサポートされていますが、現時点ではTier 3以上のユーザー(APIで100ドル以上利用)に限定されています。o3-miniは、開発者にとって強力で費用対効果の高いLLMオプションとなります。

AI

AIによる音楽生成:利便性対創造性

2025-01-31
AIによる音楽生成:利便性対創造性

AI音楽企業Sunoの成功は、AIが芸術創造において果たす役割について、再考を促します。スタンフォード大学の教授である著者は、Sunoが「AIは音楽制作における退屈な部分を簡単に解決できる」という主張に疑問を呈し、創造のプロセスにおける課題や困難こそが芸術の意味と価値を構成すると主張します。自身の経験や教育実践を例に、創造のプロセスの重要性を示し、AI時代においても人間の能動的な創造性を維持し、純粋に消費主義的な文化に陥ることを避けるよう訴えています。

AI

テンソルダイアグラムによるテンソル操作の簡素化:Tensorgradライブラリの紹介

2025-01-31

高次元テンソルの操作は複雑になりがちです。「The Tensor Cookbook」という新しい本は、テンソルダイアグラムを使ってこのプロセスを簡素化します。テンソルダイアグラムは従来のインデックス表記(einsum)よりも直感的で、パターンや対称性を容易に発見し、ベクトル化やクロネッカー積の手間を省き、行列計算を簡素化し、関数やブロードキャストを簡単に表現できます。付属のPythonライブラリTensorgradは、テンソルダイアグラムを使用して記号テンソル操作と微分を行い、複雑な計算を理解しやすくします。

OpenAI、より安価で高速な推論モデルo3-miniを発表

2025-01-31
OpenAI、より安価で高速な推論モデルo3-miniを発表

OpenAIは、「o」ファミリーの新しいAI推論モデルであるo3-miniを発表しました。o1ファミリーと同等の機能を持ちながら、より高速で低コストです。STEM問題、特にプログラミング、数学、科学に最適化されており、ChatGPTで利用可能です。「推論の努力」設定を調整することで、速度と精度をバランスさせることができます。有料ユーザーは無制限にアクセスできますが、無料ユーザーはクエリ数に制限があります。一部の開発者向けにOpenAIのAPI経由でも利用可能です。DeepSeekのR1モデルをすべてのベンチマークで上回るわけではありませんが、競争力のある価格と向上した安全性を提供します。

AI

DeepSeek:中国発AIのダークホースが台頭

2025-01-31
DeepSeek:中国発AIのダークホースが台頭

中国のヘッジファンドHigh-Flyerが設立したAI企業DeepSeekは、その高効率モデルDeepSeek V3とR1で世界を席巻しました。DeepSeek V3は、低いトレーニングコスト(公表されている600万ドルをはるかに上回る)と高いパフォーマンス、そして革新的なMulti-head Latent Attention技術により、推論コストにおいて大きな優位性を獲得しています。DeepSeekの成功は、大量のGPU投資(約5万枚のHopper GPU)と人材育成への注力によるところが大きい一方、低価格戦略はコストの持続可能性に関する疑問を投げかけています。Google Gemini Flash 2.0 ThinkingもDeepSeekのトップの地位に挑戦しています。DeepSeekの台頭は、中国のAI技術力の向上を示すと同時に、国際的な技術競争と輸出管理について考えるきっかけを与えています。

わずか2時間で独自のAI画像モデルをトレーニング

2025-01-31
わずか2時間で独自のAI画像モデルをトレーニング

著者はわずか2時間足らずでカスタムAI画像モデルをトレーニングし、スーパーマン風など様々なスタイルの自分の画像を生成することに成功しました。これはFluxモデルとLoRAトレーニングテクニックを使用し、Replicateの使いやすいGPUクラウドサービスとプリビルドツールを活用することで実現しました。数枚の自分の写真とHugging Faceによるモデル保存だけで、驚くほど簡単にプロセスが完了しました。結果はまちまちでしたが、十分に楽しく、低コスト(10ドル未満)でした。

AI

RamaLama:AIモデルをDockerのように簡単に実行

2025-01-31
RamaLama:AIモデルをDockerのように簡単に実行

RamaLamaは、AIモデルのローカル実行と管理を簡素化するために設計されたコマンドラインツールです。OCIコンテナ技術を活用し、GPUサポートを自動検出し、Hugging FaceやOllamaなどのモデルレジストリからモデルをプルします。複雑なシステム設定は不要で、簡単なコマンドでチャットボットやREST APIサービスを実行できます。RamaLamaはPodmanとDockerをサポートし、便利なモデルエイリアス機能を提供することで、使いやすさを向上させています。

DeepSeek R1:複雑な推論タスクでOpenAIに挑むオープンソースモデル

2025-01-31
DeepSeek R1:複雑な推論タスクでOpenAIに挑むオープンソースモデル

DeepSeek R1は、複雑な推論タスクにおいてOpenAIのモデルに挑戦するオープンソースモデルです。グループ相対方策最適化(GRPO)と強化学習に焦点を当てた多段階トレーニングアプローチを用いており、モデルだけでなく、その開発の詳細を説明した研究論文も公開されました。論文では、トレーニング中にモデルが人間のフィードバックなしに、初期アプローチを再評価することで問題に多くの思考時間を割り当てることを学んだ「ひらめき」の瞬間について説明しています。このブログ記事では、GRPOとカウントダウンゲームを使用してこの「ひらめき」の瞬間を再現し、自己検証と検索能力を学ぶオープンモデルをトレーニングします。GRPOとTRLの学習を容易にするため、インタラクティブなJupyter Notebookコード、マルチGPUノードまたはSLURMクラスタでの分散トレーニングのためのスクリプトと手順を提供しています。

AI

全米作家協会、AI生成書籍に対抗する「人間による創作」認証を開始

2025-01-31
全米作家協会、AI生成書籍に対抗する「人間による創作」認証を開始

アマゾンなどのプラットフォームでAI生成書籍が増加していることを受け、全米作家協会は「人間による創作」認証を開始しました。この取り組みは、読者に作者の明確性を提供し、人間が書いた書籍とAI生成コンテンツを区別することを目指しています。現在、協会会員と単著の書籍に限定されていますが、将来的には非会員や共著の書籍にも拡大されます。文法チェックなどのAIによる軽微な支援は許容されますが、認証は主要な文学表現が人間起源であることを強調しています。協会はこれを反テクノロジーの姿勢ではなく、透明性と物語における独自の人的要素の認識を促すものとして位置付けています。

AI
1 2 33 34 35 36 37 38 39 41 Next →