Webtagr - テクノロジーニュースダイジェスト

反復的なデータキュレーションによるLLMファインチューニングの改善

2025-08-08

研究者らは、反復的なデータキュレーションによって、大規模言語モデル（LLM）のパフォーマンスを大幅に向上させました。実験には、異なるサイズの2つのLLM（Gemini Nano-1とNano-2）と、異なる複雑さのタスクが使用され、約10万件のクラウドソーシングアノテーションが使用されましたが、当初は深刻なクラス不均衡（95％が良性）に悩まされていました。専門家による反復的なキュレーションとモデルのファインチューニングにより、パフォーマンスは大幅に向上しました。モデルは約40％の肯定的な例に到達し、コーエンのカッパ係数は約0.81（低複雑度）と約0.78（高複雑度）となり、専門家レベルのパフォーマンスに近づきました。これは、LLMのトレーニングにおける高品質データの重要な役割を強調しています。

(research.google)

AI データキュレーション

地震早期警戒システム：マグニチュード推定における速度と精度のトレードオフ

2025-07-23

地震早期警戒システム（EEW）における大きな課題の一つは、地震のマグニチュードをリアルタイムで推定することです。マグニチュードは揺れの規模を決定し、誰が警告を必要とするかを決定します。過小評価は警告の欠落につながり、過大評価は誤警報と国民の信頼の低下につながります。重要な課題は、速度と精度のバランスにあります。初期データは限られていますが、警告を遅らせることは警告時間を短くします。過去3年間、マグニチュード推定を大幅に改善し、中央絶対誤差を0.50から0.25に削減しました。私たちの精度は、現在、確立された地震観測網に匹敵し、場合によってはそれを上回っています。

(research.google)

テクノロジー地震早期警戒システムマグニチュード推定リアルタイムモニタリング

MUVERA：効率的なマルチベクトル検索

2025-06-26

現代の情報検索はニューラル埋め込みモデルに依存していますが、マルチベクトルモデルは精度が高い一方で、計算コストが高く非効率です。研究者らは、固定次元エンコーディング（FDE）を構築することで、複雑なマルチベクトル検索を単純な単一ベクトル最大内積検索（MIPS）に変換するMUVERAという新しいアルゴリズムを発表しました。これにより、精度を犠牲にすることなく効率性が大幅に向上します。オープンソース実装はGitHubで公開されています。

(research.google)

AI マルチベクトル検索

Veo 第3世代：動画生成の汎化

2025-05-16

Googleの動画生成における最新のブレークスルーであるVeoは、様々なタスクに一般化できる第3世代になりました。数百万の高品質な3D合成アセットでトレーニングされたVeoは、新規ビュー合成に優れ、製品画像を整合性の高い360°ビデオに変換します。重要なのは、このアプローチが家具、アパレル、電子機器など、様々な製品カテゴリに効果的に一般化され、複雑な照明と素材の相互作用を正確に捉える点です。これは、以前の世代と比べて大幅な改善です。

(research.google)

AI

Google、ハイブリッドセマンティックMLコード補完で開発者生産性を向上

2025-05-15

Googleの研究者たちは、Transformerベースの新しいハイブリッドセマンティック機械学習コード補完システムを開発しました。このシステムは、機械学習（ML）とルールベースのセマンティックエンジン（SE）を組み合わせることで、開発者の生産性を大幅に向上させます。このシステムは、MLとSEを3つの方法で統合します。1）MLを使用してSEの単一トークンの候補を再ランキングする。2）MLを使用して単一行と複数行の補完を適用し、SEで正確性を確認する。3）MLを使用して単一トークンのセマンティック候補を単一行と複数行で続ける。3ヶ月間にわたる1万人以上のGoogle内部開発者を対象とした研究では、単一行のML補完によってコーディングの反復時間が6％減少しました。現在、新しいコードの3％以上がML補完候補の採用によって生成されています。このシステムは8つのプログラミング言語をサポートし、セマンティックチェックを組み込むことでコードの正確性を確保し、開発者の信頼性と効率性を大幅に向上させます。

(research.google)

開発

Whisperの埋め込みが、驚くほど人間の脳活動と一致

2025-03-26

研究により、OpenAIのWhisper音声認識モデルと、自然な会話中の人の脳の神経活動との間に驚くべき一致が見つかりました。Whisperの埋め込みと、下前頭回（IFG）や上側頭回（STG）などの脳の領域における脳活動を比較することで、研究者たちは、発話中は言語の埋め込みが音声の埋め込みよりも先にピークに達し、理解中は逆になることを発見しました。これは、脳のメカニズムを考慮せずに開発されたWhisperが、言語処理の重要な側面を捉えていることを示唆しています。また、この発見は、脳の言語処理における「ソフト階層」についても明らかにしています。IFGのような高次領域は、意味や構文情報に優先順位を付けますが、低レベルの聴覚特徴も処理します。一方、STGのような低次領域は、音響的および音声的な処理を優先しますが、単語レベルの情報も捉えます。

(research.google)

AI

画期的な研究：成功の陰の強力なチーム

2025-03-03

この論文は、Asaf Aharoni、Avinatan Hassidim、Danny Vainsteinとの緊密な協力の成果です。さらに、Google Research、Google DeepMind、Google SearchのチームからYaGuang Li、Blake Hechtmanなど数十名のメンバーに、レビュー、有益な議論、貴重なフィードバック、サポートへの感謝を表します。彼らの貢献はこの研究の完成に不可欠でした。

(research.google)

AI

Google AIのブレークスルー：謝辞から明らかになった巨大なチームの努力

2025-02-19

この論文の謝辞は、Google Research、Google DeepMind、Google Cloud AIの多くの研究者と、フレミング・イニシアチブ、インペリアル・カレッジ・ロンドン、ヒューストン・メソジスト病院、Sequome、スタンフォード大学からの協力者を含む、大規模な共同作業を明らかにしています。広範なリストは、研究の共同作業の性質を強調し、技術的および専門的なフィードバックを提供した多くの科学者、そして製品、エンジニアリング、マネジメント全般にわたってサポートを提供した多くのGoogle内部チームに感謝しています。謝辞の長さ自体が、大規模なAIプロジェクトを支える巨大なチームワークを強調しています。

(research.google)

AI

衝撃！ほぼすべての二分探索とマージソートが壊れている

2025-01-11

Googleのソフトウェアエンジニア、Joshua Bloch氏が、JDKとJon Bentleyの『プログラミング珠玉』の両方に見つかった、ほぼ20年間にわたって潜んでいた二分探索アルゴリズムのバグを明らかにしました！このバグは、`int mid = (low + high) / 2;`という行に起因し、lowとhighの合計が最大の正の整数値を超えると整数オーバーフローが発生し、配列の範囲外例外が発生します。このバグは、大規模なデータセットでのみ発生するため、今日のビッグデータ時代において特に危険です。この記事では、いくつかの修正方法を検討し、厳格なテストと証明を行った場合でもバグが残る可能性があることを強調し、プログラマーに注意深く謙虚であるよう促しています。

(research.google)

開発アルゴリズムのバグ二分探索マージソート

Google、衛星画像と機械学習を用いて世界の太陽光発電ポテンシャル評価を拡大

2024-12-19

Googleの研究者たちは、機械学習モデルを衛星画像に適用することで、高解像度のデジタル表面モデルと屋根セグメンテーションマップを作成し、Googleマッププラットフォームの太陽光APIのグローバルサウスにおけるカバレッジを拡大しました。このイノベーションは、従来のデータ取得と処理方法の限界を克服し、世界中の12.5億棟の建物に対して太陽光発電ポテンシャル評価データを提供し、世界的な再生可能エネルギーの採用を加速させます。このプロジェクトは、衛星データを利用してデータ更新頻度を高め、コストを削減しており、特にデータの少ない地域にとって有益です。

(research.google)

テクノロジー太陽光発電衛星画像