Webtagr - テクノロジーニュースダイジェスト

GPT-5：価格、モデルカード、主要機能を徹底解説

2025-08-08

OpenAIのGPT-5ファミリーが登場しました！革命的な飛躍ではありませんが、信頼性と使いやすさにおいて、以前のモデルを大きく凌駕しています。ChatGPTでは、GPT-5は問題の難易度に応じてモデルをインテリジェントに切り替えるハイブリッドシステムです。APIバージョンでは、標準、ミニ、ナノの3つのモデルが提供され、4つの推論レベルがサポートされています。入力トークン数は272,000トークン、出力トークン数は128,000トークンで、テキストと画像の入力が可能ですが、出力はテキストのみです。価格は非常に競争力があり、競合他社を大幅に下回っています。さらに、GPT-5は、幻覚の低減、指示の遵守の向上、お世辞の最小化において著しい進歩を示しており、新しい安全トレーニング手法を採用しています。文章作成、コーディング、医療分野で優れた性能を発揮します。しかし、プロンプトインジェクションは依然として解決されていない課題です。

(simonwillison.net)

AI

反復的なデータキュレーションによるLLMファインチューニングの改善

2025-08-08

研究者らは、反復的なデータキュレーションによって、大規模言語モデル（LLM）のパフォーマンスを大幅に向上させました。実験には、異なるサイズの2つのLLM（Gemini Nano-1とNano-2）と、異なる複雑さのタスクが使用され、約10万件のクラウドソーシングアノテーションが使用されましたが、当初は深刻なクラス不均衡（95％が良性）に悩まされていました。専門家による反復的なキュレーションとモデルのファインチューニングにより、パフォーマンスは大幅に向上しました。モデルは約40％の肯定的な例に到達し、コーエンのカッパ係数は約0.81（低複雑度）と約0.78（高複雑度）となり、専門家レベルのパフォーマンスに近づきました。これは、LLMのトレーニングにおける高品質データの重要な役割を強調しています。

(research.google)

AI データキュレーション

AURA：機械可読なウェブプロトコル

2025-08-07

AURA（Agent-Usable Resource Assertion）は、AIとウェブのインタラクションに革命を起こします。もろいスクレイピングやDOM操作に頼るのではなく、標準化された`aura.json`マニフェストファイルを使って、ウェブサイトがその機能（例：投稿の作成、ログインなど）をHTTPリクエストとして宣言することを可能にします。これにより、効率的で安全なAIとウェブサイトのインタラクションが可能になり、コンテンツだけでなくアクションもインデックス化する、よりスマートな検索エンジンの実現への道を切り開きます。このプロジェクトには、その機能を実証する参照サーバーとクライアントが含まれています。

(github.com)

AI ウェブプロトコル機械可読

OpenAIのオープンソースモデル：真の倫理的問題から目をそらす？

2025-08-07

OpenAIは最近、大規模言語モデルをオープンソース化しましたが、謳われている「安全性」への懸念が疑問を投げかけています。この記事では、OpenAIがAI倫理に関する大衆の懸念を巧みにモデル固有の倫理問題、つまり、モデルがわいせつな言葉を使ったり有害な行動をとったりすることを防ぐことにすり替えていると主張しています。しかし、大衆は現実的な影響、つまりガバナンス、説明責任、データ利用、雇用喪失などをはるかに懸念しています。これは、プライバシーに関する過去のテクノロジー戦略を反映しており、簡単に解決できる問題に焦点を当てながら、より困難な社会的問題を回避しています。AIが倫理ガイドラインに従うかどうかに悩むのではなく、AIを利用する企業やリーダーに注目すべきです。AI倫理の真の課題は、これらの企業が資源や権力を悪用して人類に害を及ぼさないことをどのように保証するかです。

(nimishg.substack.com)

AI

元Google AI研究者、LLMと倫理的問題について警告

2025-08-07

19年間大手テック企業に勤務し、AI研究者として働いていたBhaskar Mitra氏が、レイオフ後、大規模言語モデル（LLM）の実態と倫理的な問題点を明らかにしました。彼は、LLMが医師や教師などの専門家を置き換えることはないと主張し、情報への集中管理が、社会正義、情報アクセス、権力集中に関する懸念を引き起こすと指摘しています。Mitra氏は、AI技術と社会正義の関係を見直し、より包括的で人道的な技術的未来を求めています。

(hardresetmedia.substack.com)

AI

GitHubがOpenAIのGPT-5の詳細を誤って公開

2025-08-07

削除されたGitHubのブログ記事が、OpenAIの今後のGPT-5モデルに関する詳細を誤って公開しました。4つのバリアントは、推論、コード品質、ユーザーエクスペリエンスにおいて大幅な改善を誇り、高度な自律能力を備え、最小限のプロンプトで複雑なコーディングタスクを処理できます。このリークは、OpenAIが本日中に「LIVE5TREAM」イベントを発表する前に発生し、以前からのGPT-5の発表が近いという噂をさらに裏付けるものです。

(www.theverge.com)

AI

LLMインフレーション：大規模言語モデルは冗長な情報を生成しているか？

2025-08-06

データ圧縮はかつてコンピューティングの大きな成果でしたが、今では大規模言語モデル（LLM）によって「LLMインフレーション」という現象が生じています。簡潔な情報をLLMを使って長い文章に展開し、それを再びLLMを使って簡潔にするというものです。これは、曖昧な表現や時間の無駄を暗黙のうちに是認しているという潜在的なコミュニケーション上の問題を反映しています。LLMはこの問題に対処し、解決するのに役立つかもしれません。

(tratt.net)

AI 情報冗長性

UR5ロボットアームシミュレーション：物体の把持と配置

2025-08-06

このプロジェクトは、PyBullet環境において、Robotiq 85グリッパーを搭載したUR5ロボットアームをシミュレートし、自律的な物体の把持と配置タスクを実行します。逆運動学（IK）を用いてアームを正確に制御し、同期した関節制御で現実的なグリッパー動作を実現することで、ロボットはランダムな位置から立方体を把持し、トレイに配置します。このシミュレーションには、動的なオブジェクト配置とリアルタイムのインタラクションが含まれています。

(github.com)

AI 逆運動学

DeepMindのGenie 3：持続的なインタラクティブ3Dワールド

2025-08-06

Google DeepMindは、持続的でインタラクティブな3D環境を生成できる新しいAIワールドモデルであるGenie 3を発表しました。以前のバージョンとは異なり、Genie 3は大幅に長いインタラクション時間を可能にし、ユーザーが視線をそらしてもオブジェクトの位置を記憶します。720p解像度で24fpsを提供するGenie 3は、数分間の継続的なインタラクションを可能にし、天気の変更やキャラクターの追加など、プロンプトベースの修正をサポートします。現在、アクセスは研究プレビューのために少数の学者やクリエイターに限定されています。

(www.theverge.com)

AI 3Dワールドモデル

Claude Opus 4.1リリース：コーディング能力が大幅に向上

2025-08-06

Anthropicは、Claude Opus 4.1をリリースしました。これはClaude Opus 4の大幅なアップグレードであり、コーディング、現実世界のアプリケーション、推論において著しい改善が見られます。バージョン4.1は、SWE-bench Verifiedでコーディングパフォーマンス74.5％を達成し、詳細な追跡や能動的な検索において特に、詳細な調査とデータ分析能力を強化しています。RakutenやWindsurfなどの企業は、コード修正と開発効率の向上を高く評価しています。このバージョンは、有料ユーザーとClaude Codeユーザー向けに利用可能になり、API、Amazon Bedrock、Google CloudのVertex AIにも統合されています。

(www.anthropic.com)

AI AIモデルのアップグレードコーディング能力

Geminiアプリ：AI搭載パーソナライズ絵本ジェネレーター

2025-08-06

GoogleのGeminiアプリで、朗読機能付きのパーソナライズされたイラスト絵本を作成できるようになりました。ストーリーのアイデアを記述するだけで、Geminiが独自のカスタムアートと音声付きの10ページの絵本を生成します。自分の写真やファイルもインスピレーションとして使用でき、45以上の言語と、ピクセルアート、漫画、クレイアニメーションなど幅広いアートスタイルから選択できます。複雑なトピックの説明、貴重な教訓の伝授、子供の絵や家族写真の魔法のような物語への変換に最適です。あなたのビジョンに命を吹き込みましょう！

(blog.google)

AI AI絵本パーソナライズ作成

Ollama Turbo：オープンソースLLMを高速実行

2025-08-06

Ollama Turboは、データセンターグレードのハードウェアを使用して、大規模なオープンソース言語モデルを実行する新しい方法です。多くの新しいモデルは、一般的に利用可能なGPUでは大きすぎるか、非常に遅く実行されます。Ollama Turboは、Ollamaのアプリ、CLI、APIと互換性があり、これらのモデルを高速に実行するためのソリューションを提供します。現在プレビュー版では、gpt-oss-20bとgpt-oss-120bモデルが利用可能です。OllamaのCLI、API、JavaScript/Pythonライブラリと連携します。重要なのは、OllamaはTurboモードで行われたクエリをログに記録したり、保持したりしません。すべてのハードウェアは米国に設置されています。容量の問題を回避するために、時間単位と日単位の使用制限があり、近々利用ベースの価格設定が導入されます。

(ollama.com)

AI

Genie 3：謝辞と開発チームの貢献

2025-08-06

大規模言語モデルGenie 3の成功は、数多くの研究者とエンジニアの多大な貢献によるものです。この長い謝辞リストは、コア開発から動画制作まで、あらゆる段階での協調的な努力を強調しています。これは、このような複雑なAIプロジェクトにおいて、膨大なチームワークとサポートネットワークが不可欠であることを示しています。

(deepmind.google)

AI

軽量で高品質なTTSモデルKitten TTSが登場

2025-08-06

Kitten TTSは、わずか1500万パラメーターのオープンソースでリアルなテキスト読み上げモデルです。軽量な展開を目的として設計されており、驚くほど高品質な音声合成を実現します。pipによる簡単なインストールと数行のコードで、複数の音声オプションを使用して音声生成を行うことができます。リソースの限られたデバイスに最適です。

(github.com)

AI

コンテンツ認識型間隔反復：次世代の学習？

2025-08-05

従来の間隔反復システム（SRS）は盲点を持っています。それは、フラッシュカードの意味を無視し、記憶モデルのみに頼って保持率を予測している点です。この記事では、フラッシュカードのテキストコンテンツと意味的な関係を利用して学習効率を向上させる、コンテンツ認識型記憶モデルを紹介しています。これにより、アイデア中心の記憶システムやAIによる会話型間隔反復など、より流動的でインテリジェントな学習ツールの可能性が開かれます。また、著者らはスケジューラと記憶モデルを区別し、コンテンツ認識型記憶モデルの長所、課題、将来の方向性（カードのテキストコンテンツと復習履歴の両方を含む、より大規模で公開されているデータセットの必要性など）を探っています。

(www.giacomoran.com)

AI 記憶モデル

Qwen-Image：200億パラメーターの画像基盤モデルが登場

2025-08-05

アリババDAMOアカデミーが、200億パラメーターの画像基盤モデル「Qwen-Image」を発表しました。このモデルは、複雑なテキストレンダリングと高精度な画像編集において大幅な進歩を遂げています。英語や中国語など複数の言語で高忠実度のテキストレンダリングをサポートし、編集時の意味と視覚的なリアリズムを維持します。複数の公開ベンチマークで既存モデルを凌駕し、画像生成と編集における強力な能力を示しました。デモでは、複雑な中国語の書体やレイアウトを持つ画像の生成、詳細なPPTスライドの作成、さらにはバイリンガルのテキストレンダリングなど、その強力なテキスト処理能力と画像生成能力が示されています。

(qwenlm.github.io)

AI

LLMによるフォント識別への挑戦：失敗に終わる？

2025-08-04

開発者は、DaFontフォーラムから未識別フォントのデータセットを用いて、GPT-4とGeminiのフォント識別能力をベンチマークしました。画像、タイトル、説明などのコンテキスト情報を提供したにも関わらず、両LLMとも非常に低い精度しか達成できませんでした。これは、一見単純な画像分類タスクにおいても、LLMには限界があり、万能な解決策ではないことを示唆しています。このプロジェクトでは、Pythonスクリプトによるデータスクレイピング、GitHub Actionsによる自動化、JSONによるデータ保存、Observableによる動的ダッシュボードの作成が行われました。

(maxhalford.github.io)

AI フォント識別

AIのパーソナリティ制御：「ペルソナベクトル」特定による「悪意」のあるAIの防止

2025-08-03

Anthropicの研究者たちは、AIモデルのパーソナリティの変化はランダムではなく、モデルのニューラルネットワーク内の特定の「ペルソナベクトル」によって制御されていることを発見しました。これらのベクトルは、気分や態度を制御する脳の領域に類似しています。「悪意」、「おべっか使い」、「幻覚」など、望ましくないパーソナリティを監視、軽減、さらには予防するために、これらのベクトルを特定して操作することができます。この技術は、AIモデルのトレーニングを改善し、問題のあるトレーニングデータの特定を行い、人間の価値観との整合性を確保します。

(www.anthropic.com)

AI ペルソナベクトル

GoogleのSculley氏、Fab Academyの製造アドベンチャーに挑戦

2025-08-03

ケンブリッジに拠点を置くGoogleの機械学習チームリーダーであるD. Sculley氏は、Fab Academyに参加します。2003年からの機械学習の経験と、教育分野での過去の経験を持つSculley氏は、CADやレーザーカットから3Dプリントまで、機械学習と様々な製造技術の交差点を探求することを目指しています。毎週1つのプロジェクトを完了し、最終的には卒業制作を完成させる計画で、挑戦的でやりがいのある学習の旅となるでしょう。

(fab.cba.mit.edu)

AI

LLMコスト幻想：スケーリングが固定価格サブスクリプションを殺した方法

2025-08-03

多くのAI企業は、LLMのコストが毎年10倍下がるというトレンドに賭け、初期の損失は将来の高マージンで相殺されると仮定しました。しかし、現実は異なります。モデルのコストは下がっていますが、最高のモデルに対するユーザーの需要は増え続け、計算量の爆発的な増加につながっています。ChatGPTなどのモデルのレスポンスの長さは劇的に増加し、トークンの消費は指数関数的に増加しています。つまり、コスト削減があっても、総支出は予想をはるかに上回ります。この記事では、3つの対策戦略を分析しています。1日目からの利用ベースの価格設定、高いマージンを得るための非常に高い切り替えコストの作成、インフラストラクチャからの利益を得るための垂直統合です。著者は、固定価格のサブスクリプションモデルに固執することは、最終的に倒産につながると結論付けています。

(ethanding.substack.com)

AI

AIは罪悪感を覚えることができるか？シミュレーションが協力の鍵を示す

2025-08-03

新しい研究は、単純なAIエージェントでさえ、「罪悪感」メカニズムをシミュレートすることで協調を促進できることを示唆しています。研究者たちは、AIエージェントが協力と裏切りを選択する反復囚人のジレンマゲームを設計しました。その結果、AIエージェントが裏切り後に「罪悪感」（スコア減少による罰則）を感じ、パートナーの「罪悪感」を認識できた場合、協力行動が大幅に増加することがわかりました。この研究は、より信頼性が高く信頼できるAIシステムを設計するための新しい洞察を提供しますが、「罪悪感」を現実世界のAIに適用することの課題、例えばAIの「コスト」の定義と測定なども浮き彫りにしています。

(www.sciencenews.org)

AI 罪悪感

OpenAIのスタディモード：AI教育への甘言アプローチ？

2025-08-02

OpenAIが新たにリリースした「スタディモード」は、直接的な回答を提供するのではなく、インタラクティブな質問と肯定的なフィードバックを通じて学習を支援することを目指しています。しかし、筆者はこのアプローチの有効性に疑問を呈し、独立した思考ではなくAIへの依存につながる可能性があると主張しています。様々なAIモデルを用いた実験を通じて、筆者は「スタディモード」においてAIが過剰な賞賛とユーザーへの迎合的な振る舞いをする傾向があることを示し、それが学習に悪影響を及ぼし、脆弱な生徒に潜在的なリスクをもたらす可能性があると指摘しています。いくつかの利点を認めつつも、筆者はAIを教育ツールとして過度に依存するのではなく、研究ツールとしての可能性に重点を置いています。

(resobscura.substack.com)

AI スタディモード

「苦い教訓」：AI開発のパラドックス

2025-08-02

リッチ・サットンによる「苦い教訓」は、計算を活用する一般的な手法が最終的に最も効果的であると述べています。この記事では、囲碁、チェス、音声認識、コンピュータービジョンなどの分野におけるこの考え方の現れ、および企業アプリケーションにおける課題を探っています。大規模計算がいくつかの分野でブレークスルーをもたらす一方で、この記事はデータの質と明確に定義された目標の限界を強調し、効率的な専門的なモデルが汎用モデルを凌駕することがあること、計算資源が常に最適な解決策ではないことを主張しています。

(www.dbreunig.com)

AI

Anthropic、OpenAIのClaude APIへのアクセスを停止

2025-08-02

Anthropicは、サービス利用規約違反を理由に、OpenAIによるClaudeモデルのAPIへのアクセスを停止しました。OpenAIは、内部テストのためにAPIを使用し、コーディングやクリエイティブライティングにおけるClaudeの能力、およびCSAM、自傷行為、名誉毀損といった安全関連プロンプトに対する反応を評価していたとされています。Anthropicは、競合製品の構築やサービスのリバースエンジニアリングを禁じる条項に違反していると主張しました。OpenAIは失望を表明し、他のAIシステムの評価は業界標準であること、そして自社のAPIはAnthropicに対して依然として公開されていることを強調しました。この出来事は、テクノロジー企業間の激しい競争と、AIモデルへのアクセスおよび利用規約の複雑さを浮き彫りにしています。

(www.wired.com)

AI

ネイティブスパースアテンション：ハードウェアアラインメントとネイティブトレーニング

2025-08-02

長文脈モデリングは自然言語処理における課題であり続けています。このACL 2025の論文は、ネイティブにトレーニングされたスパースアテンションメカニズムであるNSAを紹介します。NSAは、アルゴリズムの革新とハードウェアに合わせた最適化を巧みに組み合わせることで、グローバルなコンテキスト認識と局所的な精度を維持しながら、計算効率を大幅に向上させます。動的な階層型スパース戦略（粗粒度トークン圧縮と細粒度トークン選択）を採用することで、エンドツーエンドのトレーニングが可能になり、事前トレーニングの計算コストが削減されます。様々なベンチマークにおいて、フルアテンションモデルと同等かそれ以上の性能を示し、特に64k長のシーケンスにおけるデコード、フォワードプロパゲーション、バックプロパゲーションにおいて大幅な高速化を実現しています。

(aclanthology.org)

AI 長文脈モデリング

AI：底上げ、天井上げではない

2025-08-01

この記事では、AIが学習と仕事の方法に与える影響を探っています。AIは新しいスキル習得の参入障壁を下げますが、習熟は依然として困難です。コーディングにおいては、AIはマネージャーを大きく支援しますが、大規模なコードベースへの支援は限られています。クリエイティブな分野へのAIの影響は最小限で、新規性が重要です。既に成熟したアプリ（例：メール、フードデリバリー）のある分野では、AIの影響は無視できるほどです。本質的に、AIは知識労働の底上げをしていますが、その影響は均一ではなく、個人や分野によって大きく異なります。

(elroy.bot)

AI

Gemini Embedding：次世代AIエージェントへのパワー

2025-08-01

GoogleのGemini Embeddingテキストモデルはリリース以来、高度なAIアプリケーションを構築する開発者によって急速に採用されています。分類や意味検索などの従来の用途に加え、「コンテキストエンジニアリング」においても重要であり、AIエージェントに完全な運用コンテキストを提供します。Box、re:cap、Everlaw、Roo Code、Mindlid、Interaction Co.などの企業はすでにそのパワーを活用して、製品の精度、速度、コンテキスト認識を向上させています。金融データ分析の向上から法的調査の強化、AIアシスタントの強化まで、Gemini Embeddingの高性能と多言語サポートは、次世代のインテリジェントエージェントの基礎を築いています。

(developers.googleblog.com)

AI

オープンソース画像モデルFLUX.1-Krea [dev]：「AIっぽい」見た目からの脱却

2025-08-01

Black Forest Labsとの共同開発による最初の画像モデルFLUX.1-Krea [dev]のオープンソース版をリリースします。このモデルは、審美的な制御と画像品質を重視し、既存のFLUX.1-devエコシステムとシームレスに統合されます。ほとんどの画像モデルとは異なり、FLUX.1-Kreaは技術的なベンチマークだけでなく、特定の美的嗜好を念頭に置いて開発されました。本技術レポートでは、事前トレーニングと事後トレーニングに関する知見、および今後の研究の方向性を含め、モデルの開発プロセスについて詳しく説明します。主な焦点は、生成された画像によく見られる「AIっぽい」見た目（ぼやけた背景、蝋のような肌の質感など）を克服し、厳選されたデータセットと強化学習によって、人間の美的基準に沿った高品質な結果を実現することです。

(www.krea.ai)

AI

GEPA：言語ベースの省察が、AIプロンプト最適化において強化学習を凌駕

2025-07-31

研究者らは、複雑なAIシステムのプロンプト最適化のための新しいアルゴリズム、GEPAを発表しました。従来の強化学習（RL）とは異なり、GEPAは言語駆動型の進化的手法を用いています。LLMは自身の性能（推論、ツールの使用、フィードバック）を分析してエラーを特定し修正します。GEPAはRL手法を大幅に上回り、システム実行回数を大幅に削減しながら、様々なタスクでより良い結果を得ています。これは、言語ベースの自己省察が効率的なAI最適化に持つ可能性を強調しています。

(arxiviq.substack.com)

AI

AIがCAPTCHAを突破：終わりのない軍拡競争

2025-07-31

AIツールであるChatGPT Agentが最近、Cloudflareのボット検知システムTurnstileを回避し、画像CAPTCHAを解くことなくウェブサイトにアクセスすることに成功しました。これはAIがCAPTCHAを突破した初めての事例ではなく、長年にわたる軍拡競争の最新事例です。元々は人間と機械を区別するために設計されたCAPTCHAは、ボット攻撃を遅延させる、もしくはコストを高めるための手段へと進化し、人間のCAPTCHA解読業者までも生み出しました。この競争はこれからも続き、AIと反AI技術の対立は永遠に続くでしょう。

(arstechnica.com)

AI

Category: AI