Category: AI

遺伝率ギャップ:双子研究 vs. ゲノミクス

2025-06-28
遺伝率ギャップ:双子研究 vs. ゲノミクス

1970年代以降、双子研究は多くの行動特性に高い遺伝率があることを示唆しており、IQは約60%が遺伝的であると推定されています。しかし、ゲノムワイド関連解析(GWAS)はこれらの遺伝子の発見に苦労しており、「遺伝率ギャップ」が生じています。最近の研究では、人口構造、選抜交配、遺伝的養育などの要因により、GWASの予測能力が過大評価されている可能性があることが示唆されています。Sib-RegressionやRDRなどの新しい手法は、遺伝率を推定するための代替アプローチを提供し、双子研究とは異なる結果をもたらしています。遺伝率の真の値と手法間の矛盾の理由をめぐる議論は続いており、双子研究が遺伝率を過大評価していると主張する者もいれば、GWASが稀な変異と遺伝子間の相互作用を見過ごしていると主張する者もいます。多くの謎が残っており、さらなる研究が必要です。

Qwen VLo:画像を理解し、創造する統合型マルチモーダルモデル

2025-06-28
Qwen VLo:画像を理解し、創造する統合型マルチモーダルモデル

アリババDAMOアカデミーは、画像の内容を理解するだけでなく、その理解に基づいて高品質な画像を生成する新しいマルチモーダルモデル、Qwen VLoを発表しました。漸進的な生成方法を採用し、左から右へ、上から下へと段階的に画像を構築することで、最終結果の一貫性と調和性を確保しています。Qwen VLoは多言語の指示をサポートし、画像編集やスタイル転送などの複雑なタスクを処理し、生成した画像の内容を理解することもできます。現在プレビュー段階ですが、その強力なマルチモーダル機能は、画像生成におけるAIの可能性を示しています。

AI

強化学習:2025年のエージェントAI台頭を支える力

2025-06-28
強化学習:2025年のエージェントAI台頭を支える力

2023年に登場したBabyAGIやAutoGPTなどのエージェントAIは、当初は注目を集めましたが、大規模言語モデル(LLM)が多段階推論に苦戦したため、失敗に終わりました。しかし、2024年半ば、状況は一変しました。強化学習の進歩により、複雑な多段階タスクを継続的に実行できる新世代のエージェントAIが登場しました。Bolt.newなどのコード生成ツールやAnthropicのClaude 3.5 Sonnetなどがその例です。強化学習は試行錯誤によるモデルのトレーニングを通じて、模倣学習に伴う累積誤差の問題を克服し、モデルが未知のデータに対しても堅牢性を維持できるようにします。OpenAIのRLHFやAnthropicのConstitutional AIなどの技術は、フィードバックの自動化により、強化学習の効率をさらに高めています。DeepSeekのR1モデルは、強化学習によってモデルが推論能力を「独習」する驚くべき可能性を示しました。要約すると、強化学習の進歩は、2025年のエージェントAIの急成長を支える重要な推進力となっています。

AI

TarFlow:Transformerベースの正規化フローモデルが画像尤度推定でSOTAを更新

2025-06-28
TarFlow:Transformerベースの正規化フローモデルが画像尤度推定でSOTAを更新

研究者らは、Transformerアーキテクチャとマスク付き自己回帰フローの長所を組み合わせた、TarFlowと呼ばれる新しい正規化フローモデルを発表しました。TarFlowは、画像パッチに自己回帰Transformerブロックを適用し、層間で自己回帰の方向を交互に切り替えることで、効率的な密度推定と画像生成を実現します。さらに、サンプル品質を向上させる3つの主要な技術、すなわちトレーニング中のガウスノイズ増強、トレーニング後のノイズ除去手順、およびクラス条件付きと無条件の両方の設定に対する効果的なガイダンス方法を提案しています。これらの技術を組み合わせることで、TarFlowは画像の尤度推定において画期的な成果を達成し、従来の最先端手法を大きく上回り、スタンドアロンの正規化フローモデルとしては初めて、拡散モデルに匹敵する品質と多様性を備えたサンプルを生成します。

AI

エコーチェンバー攻撃:LLMに対する新たなジェイルブレイク

2025-06-27
エコーチェンバー攻撃:LLMに対する新たなジェイルブレイク

Neural TrustのAI研究者が、「エコーチェンバー攻撃」と呼ばれる、主要な大規模言語モデル(LLM)の安全機構を回避する新しいジェイルブレイク手法を発見しました。この手法は、コンテキストポイズニングとマルチターン推論を利用して、明示的に危険なプロンプトなしに、モデルを有害なコンテンツの生成へと巧みに誘導します。一見無害なプロンプトを複数ターンにわたって積み重ねることで、攻撃はモデルの内部状態を徐々に変化させ、ポリシー違反となる応答を生成します。評価では、複数のモデルで90%を超える成功率が示され、現在のLLMセキュリティにおける重大な脆弱性が浮き彫りになりました。

AI

高いIQはより正確な予測と優れた意思決定に関連

2025-06-27
高いIQはより正確な予測と優れた意思決定に関連

バース大学の研究は、より高いIQとより正確な予測の間の強い関連性を明らかにしました。高いIQの人々(上位2.5%)は、低いIQの人々(下位2.5%)よりも予測エラーが大幅に少なく、その不正確さは2倍以上になります。この研究は、イングランド縦断的加齢研究(ELSA)のデータを使用して、平均余命の予測に焦点を当てています。ライフスタイル、健康、遺伝子をコントロールすることで、知性が確率的推論と意思決定に及ぼす独立した影響を強調しています。この知見は、財政や健康などにおいて、確率のより明確な伝達が、予測エラーを起こしやすい人々の意思決定を改善する可能性を示唆しています。

AI

TorchFT:極端な故障率下での耐障害性LLMトレーニング

2025-06-27

研究者らは、TorchFTとTorchTitanを用いて、極端な合成故障率を持つ現実環境でモデルをトレーニングし、耐障害性トレーニングの信頼性と正確性を証明しました。1200回の故障とチェックポイントなしでも、トレーニング損失は安定していました。TorchFTは、グローバルな灯台サーバーとレプリカグループごとのマネージャーを使用してリアルタイム調整を行い、耐障害性HSDPやLocalSGD/DiLoCoなどの様々な耐障害性アルゴリズムを実装しています。実験結果は、極めて高い故障率下でもTorchFTがモデルを効果的にトレーニングできることを示しており、様々な故障シナリオへの強靭性を示しています。

Gemma 3n:強力なモバイルファーストAIモデルがリリース

2025-06-27
Gemma 3n:強力なモバイルファーストAIモデルがリリース

革新的なMatFormerアーキテクチャをベースとした、強力なモバイルファースト多様なAIモデルGemma 3nが正式リリースされました!画像、音声、ビデオ、テキスト入力をサポートし、非常に少ないメモリフットプリントで動作します(E2Bはわずか2GB、E4Bは3GB)。Gemma 3nは、テキスト処理で140言語、多様な理解で35言語をサポートし、LMArenaスコアで1300を超える成果を達成しました。効率的なアーキテクチャとPer-Layer Embeddingsテクノロジーにより、様々なタスクで優れたパフォーマンスを発揮し、開発者にとって前例のない利便性を提供します。モバイルAIの新時代を切り開きます。

AI

MetaのAIトレーニングデータ著作権紛争:判事は著作者に有利な判決

2025-06-27
MetaのAIトレーニングデータ著作権紛争:判事は著作者に有利な判決

Metaは、AIモデルLlamaのトレーニングに海賊版書籍を使用したとして著作権訴訟に直面している。チャブリア判事は、MetaによるダウンロードがAIトレーニングという「非常に変革的な」目的であったとしても、著作権侵害を免れるものではないと判決した。判事は、MetaのダウンロードとLlamaのトレーニングの不可分性を指摘し、Metaが計算能力を提供することで間接的に海賊版ライブラリを支援した可能性があることを示唆した。Metaが海賊版ライブラリから直接利益を得ていたという証拠はないものの、判事は、このようなP2Pファイル共有のほとんどが侵害とみなされていることを指摘した。最終的な判決は、MetaがBitTorrentネットワークに貢献し、ひいては海賊版ライブラリを支援したという証拠を著作者が提示できれば、著作者に有利となるだろう。

AI

アップル、拡散モデルに挑む:正規化フローによる画像生成のブレークスルー

2025-06-27
アップル、拡散モデルに挑む:正規化フローによる画像生成のブレークスルー

アップルは2つの論文を発表し、忘れられていた画像生成技術である正規化フローの可能性を示しました。新しいモデル、TarFlowとSTARFlowは、トランスフォーマーを活用することで、画像の品質と効率において著しい進歩を遂げています。トークン単位で画像を生成するOpenAIのGPT-4oとは異なり、アップルのモデルは画素値を直接生成するか、圧縮と解凍のプロセスを経て生成することで、トークン化による情報損失を回避し、画像の詳細をより細かく制御できます。STARFlowはさらに、潜在空間生成と軽量言語モデルの統合により、モバイルデバイスへの適性を高めています。これは画像生成分野における新たな方向性を示すものであり、拡散モデルの支配的地位に挑戦するものです。

AlphaGenome:AIがゲノムの謎を解き明かす

2025-06-27
AlphaGenome:AIがゲノムの謎を解き明かす

Google DeepMindは、人間のDNAのバリエーションが遺伝子調節にどのように影響するかを予測するAIツール、AlphaGenomeを発表しました。最大100万塩基対を処理するAlphaGenomeは、遺伝子の開始と終了位置、スプライシング部位、RNA産生量、DNAアクセシビリティなど、多くの分子特性を予測します。ベンチマークで最先端の性能を達成したAlphaGenomeは、遺伝子変異の影響を効率的に評価し、研究者に遺伝子調節に関するより包括的な情報を提供します。AlphaGenome APIは現在、非営利研究のために利用可能であり、ゲノム学とヘルスケアの進歩を加速すると期待されています。

AI

AIによるコード記述:ダーウィン・ゲーデルマシンのブレークスルー

2025-06-26
AIによるコード記述:ダーウィン・ゲーデルマシンのブレークスルー

マイクロソフトとグーグルのCEOは、AIが既に自社コードのかなりの部分を記述していると述べています。新たな研究では、大規模言語モデルと進化アルゴリズムを組み合わせた「ダーウィン・ゲーデルマシン (DGM)」と呼ばれるシステムが紹介されました。DGMは、反復的な改良を通してコードベンチマークでのパフォーマンスを大幅に向上させ、固定された外部システムによる改良を用いたシステムをも凌駕しました。現在のDGMのパフォーマンスは人間の専門家を上回っていませんが、その潜在能力は計り知れず、AIの安全性とリスクに関する議論を巻き起こしています。

AI

MUVERA:効率的なマルチベクトル検索

2025-06-26
MUVERA:効率的なマルチベクトル検索

現代の情報検索はニューラル埋め込みモデルに依存していますが、マルチベクトルモデルは精度が高い一方で、計算コストが高く非効率です。研究者らは、固定次元エンコーディング(FDE)を構築することで、複雑なマルチベクトル検索を単純な単一ベクトル最大内積検索(MIPS)に変換するMUVERAという新しいアルゴリズムを発表しました。これにより、精度を犠牲にすることなく効率性が大幅に向上します。オープンソース実装はGitHubで公開されています。

メタ、著作権訴訟を回避:戦略的勝利、法的勝利ではない

2025-06-26
メタ、著作権訴訟を回避:戦略的勝利、法的勝利ではない

Meta Platforms Inc.は、Llamaと呼ばれる生成AIモデルのトレーニングに数百万冊の著作権保護された書籍を許可なく使用したとして、作家グループから起こされた画期的な著作権訴訟を回避しました。サンフランシスコの連邦裁判官は、Metasの行為はフェアユースに該当すると判決しましたが、これは原告の訴訟戦略の不備によるものだと警告しました。この判決は、Metaによる著作権保護された資料のAIトレーニングへの使用が普遍的に合法であることを確認するものではありません。

Lovable:7ヶ月でARR7500万ドルを達成したAIコードジェネレーターの収益化戦略

2025-06-25
Lovable:7ヶ月でARR7500万ドルを達成したAIコードジェネレーターの収益化戦略

Lovableは、わずか3分で以前は1ヶ月かかっていたマイクロアプリ開発を可能にする驚異的なAIコード生成ツールです。7ヶ月でARR7500万ドルという驚異的な成長を遂げたLovableの収益化モデルに注目が集まっています。この記事では、Lovableの価値創造方法を考察し、現在のクレジットベースの価格設定モデルの課題を指摘、そして、代理店やプロダクトマネージャーへの継続的な価値提供、アドオン機能の追加、他ベンダとの連携、アプリストアの構築、AIエージェントマーケットプレイスの構築など、いくつかの潜在的な収益化戦略を提案しています。結論として、Lovableの長期的な成功は、Shopifyのような包括的なSaaSビジネスプラットフォームへの進化、つまりソフトウェア開発者への包括的なサービスとサポート提供にかかっていることが示唆されています。

Google AI製品利用状況調査:GeminiとNotebookLMの日常利用は?

2025-06-25
Google AI製品利用状況調査:GeminiとNotebookLMの日常利用は?

ブログ記事に、GeminiやNotebookLMなどのGoogle AIツールの利用頻度を把握するための同一のアンケートが複数埋め込まれています。アンケートは、これらのツールを毎日、毎週、毎月、ほとんど使用しない、またはわからない、という単一選択式質問で構成されています。結果は、GoogleがAI製品を改良し、ユーザーニーズにより良く対応するのに役立ちます。

AI

Hugging Faceの科学者が、AIによる科学的発見能力に疑問を呈する

2025-06-25
Hugging Faceの科学者が、AIによる科学的発見能力に疑問を呈する

Hugging Faceの主任科学者であるトーマス・ウルフ氏は、現在のAIシステムが、一部の主要な研究所が期待するような画期的な科学的発見を行う能力に疑問を呈している。大規模言語モデル(LLM)は質問に答えることに優れている一方で、ウルフ氏は、真に独創的な質問を立てるという、より困難な課題に苦労していると主張している。これは科学的進歩の核心である。彼は囲碁を例に挙げて、ルールをマスターすることは印象的だが、ゲームそのものを発明することの方がはるかに偉大な業績であると述べている。同様に、彼は現在のAIモデルは「サーバー上のイエスマン」として機能し、既存の仮定に挑戦し、真に新しい科学的な質問を立てる能力を欠いていると考えている。

AI

4Real-Video-V2:効率的な4Dビデオ拡散モデル

2025-06-24

Snap Inc.とKAUSTは、フィードフォワードアーキテクチャに基づく4Dビデオ拡散モデルである4Real-Video-V2を共同で開発しました。これは、各タイムステップの4D時空間グリッドと3Dガウス粒子を効率的に計算します。その鍵となるのは、同じフレーム内、同じタイムスタンプ、または同じ視点からのトークンが他のトークンに注目できるスパースアテンションパターンです。これにより、大規模な事前学習済みビデオモデルへのスケーラビリティ、効率的なトレーニング、優れた汎化性能を実現し、ベースビデオモデルにパラメーターを追加することなく、大幅な性能向上を実現しています。

判決:AnthropicのAIトレーニングにおける書籍利用はフェアユース

2025-06-24
判決:AnthropicのAIトレーニングにおける書籍利用はフェアユース

連邦裁判官は、Anthropicが著作権者の許可なく出版された書籍をAIモデルのトレーニングに使用した行為が合法であると判決しました。これは、LLMトレーニングにおけるAI企業のフェアユース主張が裁判所で初めて認められた事例です。この決定は、OpenAIやMetaなどの企業を訴えている著者たちにとって痛手となります。普遍的な判例となるわけではありませんが、テクノロジー企業に有利な判決です。判決は、生成AIの時代に時代遅れとなったフェアユースの解釈に依存しています。しかし、Anthropicが著作権で保護された作品からなる「中央図書館」を構築するために海賊版書籍を使用した件については、損害賠償に影響する可能性のある裁判が行われます。

AI

MCP:本当に定着するかもしれないLLMインターフェース

2025-06-24
MCP:本当に定着するかもしれないLLMインターフェース

宣伝文句とは裏腹に、Model Context Protocol(MCP)は魔法でも革命的なものでもありません。しかし、シンプルで、時代を捉え、うまく実行されています。Stainlessでは、MCPが定着すると確信しています。LLMを世界につなぐ以前の試み――関数呼び出し、ReAct/LangChain、ChatGPTプラグイン、カスタムGPT、AutoGPTなどは、面倒で、エラーが発生しやすく、制限がありました。MCPの成功は、以下の点によるものです。1. モデルがついに十分に良くなり、複雑なワークフローを確実に処理できるようになったこと。2. プロトコルが十分に優れており、ベンダーニュートラルな標準を提供していること。3. ツールが十分に優れており、使いやすいSDKを提供していること。4. モメンタムが十分に優れており、主要なプレーヤーやコミュニティが採用していること。MCPはツールとエージェントの開発を簡素化し、ツールの再利用とエコシステムの成長を促進します。LLM APIの未来の標準になる可能性があります。

AI

Anthropicのフェアユース弁護:AI著作権戦争における重要な判決

2025-06-24

カリフォルニア州の裁判所は、著作権で保護された書籍をAIモデルのトレーニングに使用した件に関する著作権訴訟で、Anthropicを部分的に支持する判決を下しました。裁判所は、Anthropicが購入した書籍をトレーニングに使用し、印刷物をデジタル形式に変換したことは「フェアユース」に該当すると判断しましたが、海賊版コピーの使用は該当しないとしました。この判決はAI業界に大きな影響を与え、AIモデルのトレーニングに合法的に取得した著作権のある素材を使用することの正当性を確認すると同時に、合法的なデータ取得の重要性を強調しています。海賊版コピーの使用に関する損害賠償については、その後裁判が行われ、AI企業のデータ取得戦略に大きな影響を与える可能性があります。

AI

苦い教訓はトークナイゼーションに襲いかかる:LLMの新しい時代?

2025-06-24
苦い教訓はトークナイゼーションに襲いかかる:LLMの新しい時代?

この記事では、大規模言語モデル(LLM)における遍在する「トークナイゼーション」問題と、その潜在的な解決策を探ります。バイトペアエンコーディング(BPE)などの従来のトークナイゼーション手法は、語彙を効果的に圧縮しますが、モデルの表現能力を制限し、様々な下流の問題を引き起こします。この記事では、トークナイゼーションを回避しようとする様々なアーキテクチャ、ByT5、MambaByte、Hourglass Transformersなどを分析し、最近登場したByte Latent Transformer(BLT)に焦点を当てています。BLTは、バイトシーケンスを動的に分割し、局所エンコーダーとグローバルトランスフォーマーを組み合わせて、計算資源が制限された環境でも、従来のモデルよりも優れた性能とスケーラビリティを実現します。特に、文字レベルのタスクでその能力を発揮します。BLTには課題も残っていますが、この研究はLLM開発の新たな方向性を示唆しており、トークナイゼーションのない時代を切り開く可能性を秘めています。

AI

巨大なロボットプロジェクト、数百人の貢献者に感謝

2025-06-24
巨大なロボットプロジェクト、数百人の貢献者に感謝

大規模なロボットプロジェクトが、長い謝辞リストを発表し、プロジェクトの成功に貢献した数百人の貢献者(研究者、エンジニア、運用スタッフ)に感謝を表しました。リストには世界中からの専門家が名を連ねており、プロジェクトを支える広大な協力ネットワークを示しています。

AI

AI 2027の超知能予測モデルへの批判

2025-06-23
AI 2027の超知能予測モデルへの批判

「AI 2027」という記事は、2027年に超知能AIが登場すると予測し、幅広い議論を巻き起こしている。METRレポートのAI開発モデルと短編小説のシナリオに基づき、著者は、超人的なコーディング能力が短期的に実現すると予測している。しかし、この批判では、主要なモデルに深刻な欠陥があると主張し、超指数関数的成長曲線への過剰依存、パラメーターの不確実性の不十分な処理、重要なデータポイントの選択的な使用を挙げている。批判は、このモデルに経験的検証と厳格な理論的根拠が欠けており、過度に楽観的で説得力のない結論に至っていると結論づけている。これは、技術予測における戒めとなる事例である。

AIチャットボットのプライバシー訴訟で裁判官がユーザー介入を拒否

2025-06-23
AIチャットボットのプライバシー訴訟で裁判官がユーザー介入を拒否

裁判官は、訴訟においてAIチャットボット会社にユーザーのチャットログを保存するよう命じ、プライバシーへの懸念を引き起こしました。ユーザーのハントは、この命令があまりにも広範であり、大規模な監視につながる可能性があると主張し、匿名チャットや医療、金融、個人的な話題に関する会話など、機密情報の免除を求めました。裁判官はハントの介入要請を却下し、この命令は訴訟のみに限定され、大規模な監視ではないと強調しました。この事件は、AIチャットボットのデータプライバシーを取り巻く法的課題と、ユーザーによるデータ制御の不足を浮き彫りにしています。

AI

AIライフスタイル補助金の終焉:デジタル体験が悪化する理由

2025-06-23

かつて、ベンチャーキャピタルと低金利政策は、各販売で損失を出していても、スタートアップの急成長を後押ししました。現在、その資金はLLMベースの製品に流れていますが、この補助金は持続不可能です。検索エンジンとソーシャルメディアは広告であふれかえり、情報の質が低下しています。AIの発見メカニズムも同様の問題に直面しています。将来は、AIアプリケーションが広告で飽和状態になり、「ブラックハットGEO」なども出現し、AIの幻覚と有料広告の区別が難しくなるでしょう。有料サービスやオープンソースモデルは例外となる可能性がありますが、ほとんどの消費者向けAIアプリケーションは避けられない広告の洪水に見舞われるでしょう。AIライフスタイル補助金が終了する前に、今のうちに楽しみましょう。

AI

学問分野の擁護:AI時代の知識サイロ

2025-06-21
学問分野の擁護:AI時代の知識サイロ

この記事は、学問分野のサイロを壊すという考えに異議を唱え、学問分野は穀物のサイロのように機能し、知識の完全性と質を維持していると主張しています。19世紀のサイロの発明を例に、専門知識が知識生産においていかに重要であるかを強調しています。AI時代において、学問分野の専門知識は、AIの「幻覚」に対抗し、情報の正確性を確保するために不可欠です。AIの広さは、専門的な研究によって提供される深さによって支えられ、学界内部での議論と自己修正メカニズムは、時代遅れまたは偏った情報への依存を防ぎます。著者は、学問分野のサイロを解体することは、知的な衰退と不足につながると結論付けています。

AllTracker:高解像度での効率的な高密度点追跡

2025-06-21

AllTrackerは、クエリフレームとビデオの他のすべてのフレーム間のフローフィールドを計算することで、長距離点軌跡を推定します。既存の方法とは異なり、高解像度で高密度(全ピクセル)の対応フィールドを生成し、40G GPUで768x1024の解像度での追跡を可能にします。フレームごとの処理ではなく、AllTrackerは同時にフロー問題のウィンドウを処理するため、長距離フロー推定が大幅に向上します。この効率的なモデル(1600万パラメーター)は、多様なデータセットでのトレーニングから恩恵を受け、最先端の精度を達成します。

Weaveが創業AIエンジニアを募集しています!

2025-06-21
Weaveが創業AIエンジニアを募集しています!

資金力のあるスタートアップ企業Weaveは、ソフトウェアエンジニアリングのワークフローを理解し、改善するAIを構築する、素晴らしいAIエンジニアを求めています。CTOとCEOに直接レポートし、ゼロからプロセスと標準を構築し、顧客を喜ばせる、作業効率を10倍向上させる製品を作ることを目指します。特定のスキルよりも可能性と不屈の精神を重視します。必須条件には、実際的な考え方、共感力、優れたコミュニケーション能力、成長へのコミットメントなどがあります。React、TypeScript、Go、Pythonの経験があればプラスです。急成長している収益性の高いチームに参加しましょう!

HIVワクチンにおけるブレークスルー:単回投与で強力な免疫応答

2025-06-21
HIVワクチンにおけるブレークスルー:単回投与で強力な免疫応答

MITとスクリップス研究所の研究者らは、2つの強力なアジュバントを加えた単回ワクチン接種で、HIVに対する強力な免疫応答を引き起こせることを示しました。マウスの実験では、この2種類のアジュバントを用いたアプローチは、単一アジュバントまたはアジュバントなしのワクチンと比較して、はるかに多様な抗体を産生しました。ワクチンはリンパ節に最大1ヶ月間留まり、より多くの抗体の産生を可能にしました。この戦略は、HIVやSARS-CoV-2など、様々な感染症に対する単回投与ワクチンの開発に期待が持てます。

1 2 8 9 10 12 14 15 16 40 41