Category: AI

AI:代替ではなく協働のパートナー

2025-04-20
AI:代替ではなく協働のパートナー

多くの人がAIを誤解しており、文章作成、計画、問題解決を完全に自動化できると考えています。著者は、AIは「思考チェック」のようなもので、人間の思考を強化するものであり、置き換えるものではないと主張しています。パフォーマンスレビューや会議議事録を例に、AIが人間の洞察力、文脈理解、信頼性に欠けている点を指摘しています。著者は、AIを協働のパートナーと見なし、反復的な対話を通じて作業の質と効率性を向上させることを提案しています。最終的な目標は速度ではなく、質の向上です。

AI 協働

Anthropic、Claude Codeの「超思考」モードを発表

2025-04-20

Anthropicは、Claude Code CLIコーディングエージェントツールのベストプラクティスに関する詳細なドキュメントを公開しました。興味深いヒントとして、「think」、「think hard」などの単語を使うことで、拡張思考モードがトリガーされることが明らかになりました。「ultrathink」は31999トークンという膨大なトークン数を割り当てますが、「think」ではわずか4000トークンです。コード分析によると、これらのキーワードは、可変的なトークン数を割り当てる関数を呼び出し、Claudeの思考の深さと出力に影響を与えます。これは「ultrathink」がClaudeモデル自体の機能ではなく、Claude Code特有の機能強化であることを示唆しています。

AI

GPUメモリ最適化によるO(1)ストリーミングビデオ予測

2025-04-19

新しいビデオ予測モデルは、最適化されたGPUメモリレイアウトにより、O(1)のストリーミング計算量を実現します。このモデルは入力フレームをGPUメモリにエンコードし、重要度に基づいて異なるコンテキスト長(トークン数)をフレームに割り当てます。例えば、HunyuanVideoでは、異なるパッチ化カーネルを使用することで、480pフレームのトークン数を1536から192に調整できます。これにより、最も重要なフレーム(例えば、予測ターゲットに最も近いフレーム)がより多くのGPUリソースを利用できるようになり、効率の大幅な向上と、驚くべきことに複雑なアルゴリズム最適化なしでO(1)の計算量を実現します。

FramePack:わずか6GBのVRAMで高画質ビデオ生成を実現

2025-04-19

FramePackは、コンシューマー向けGPU上で次フレーム予測を可能にする画期的なビデオ拡散技術です。フレームコンテキストを効率的にパックし、一定長の入力を使用することで、わずか6GBのVRAMで高画質ビデオ生成を実現します。ノートパソコンやミドルレンジのシステムでも利用可能になり、クラウド処理や高価なGPUレンタルは不要です。双方向サンプリングアプローチを用いたアンチドリフト技術により、長時間のビデオシーケンスでも一貫した品質を維持します。

AI設計タンパク質がヘビ毒を中和:抗毒素開発におけるゲームチェンジャー

2025-04-19
AI設計タンパク質がヘビ毒を中和:抗毒素開発におけるゲームチェンジャー

画期的な研究で、AIによるタンパク質設計を用いて、コブラなどのヘビ毒を効果的に中和する抗毒素が開発されました。従来の抗毒素生産は高価で時間がかかり、副作用も多いものでした。AI設計タンパク質はこれらの欠点を克服し、試験管内および生体内実験において優れた毒素中和能力を示しました。これは、ヘビ咬傷による深刻な公衆衛生上の脅威に対する有望な解決策であり、AIがバイオメディカル分野に革命を起こし、より安全で効果的で安価な抗毒素を提供する可能性を示しています。

大型言語モデル実践ガイド:コードと図解付き

2025-04-19
大型言語モデル実践ガイド:コードと図解付き

ジェイ・アラマーとマーテン・グローテンドーストの新刊「Hands-On Large Language Models」は、大型言語モデル(LLM)の理解と活用のための、実践的で視覚的に分かりやすいガイドです。数多くの図解とコード例が掲載されており、複雑な概念も容易に理解できます。網羅的な内容とアクセスしやすいコードリポジトリにより、初心者から経験豊富な開発者まで、幅広い層にとって貴重なリソースとなります。

AI

AIブームの泡:テクノロジー業界の幻想

2025-04-19

コンピューター科学者が、現在のAIを取り巻く過剰な宣伝を情熱的に批判しています。多くの企業がトレンドを盲目的に追いかけ、AIを万能薬と見なす一方で、実際的なツールとしては捉えていません。この宣伝は資金の無駄遣い、人材のミスマッチ、さらにはプライバシーと自由の犠牲をもたらします。彼は、AIの宣伝のうち本当に役に立つものはごくわずかであり、残りは誇張されたナンセンスだと主張し、最終的には投資家と中小企業に損害を与えると結論づけています。著者は、読者にAIを理性的に見極め、メディアや世論に流されないよう促しています。

OpenAIの新しいモデルは幻覚が多い:大きいほど良いとは限らない

2025-04-18
OpenAIの新しいモデルは幻覚が多い:大きいほど良いとは限らない

OpenAIが最近リリースしたo3とo4-miniモデルは、多くの点で最先端ですが、以前のモデルと比較して、幻覚が増えているという懸念があります。内部テストでは、以前の推論モデル(o1、o1-mini、o3-mini)やGPT-4oなどの従来の非推論モデルよりも、幻覚率が大幅に高いことが明らかになりました。OpenAIは原因を特定できていませんが、これは精度が求められる業界にとって課題となります。第三者機関によるテストでも、o3が推論プロセスで手順をでっち上げていることが確認されています。コーディングや数学では優れていますが、高い幻覚率が適用範囲を制限しています。モデルの幻覚に対処することは、AI研究の重要な分野であり、モデルにウェブ検索機能を与えることが有望なアプローチとして注目されています。

AI 幻覚

AI論文がランキングを席巻:ディープ残差ネットワークの意外な成功

2025-04-18
AI論文がランキングを席巻:ディープ残差ネットワークの意外な成功

21世紀で最も多く引用された科学論文は、mRNAワクチンや重力波の発見といった画期的な発見から生まれたものではありませんでした。Nature誌による、最も多く引用された上位25論文の分析によると、AIの手法、研究の質の向上、がん統計、研究ソフトウェアが大部分を占めています。リストのトップは、Microsoftが2016年に発表した「ディープ残差ネットワーク」(ResNet)に関する論文です。これは、ディープラーニングにおける勾配消失問題を解決し、AlphaGo、AlphaFold、ChatGPTなどのAIツールの登場を可能にしました。この論文の成功は、オープンソースであることと、AI分野の急速な発展によるものです。また、研究手法、ソフトウェアツール、がん統計に関する論文も高く引用されており、科学研究における方法論と基礎的なツールの重要性を示しています。

サイケデリックとブレスワーク:精神疾患治療の新たな地平?

2025-04-17
サイケデリックとブレスワーク:精神疾患治療の新たな地平?

最近の研究では、サイケデリック医薬品(psilocybinやMDMAなど)を補助とした治療が、治療抵抗性うつ病やPTSDの治療において、有望な結果を示しています。複数の臨床試験で、著しく持続的な改善が見られています。同時に、ホロトロピックブレスワークなどのブレスワーク療法も注目を集めており、ストレス、不安、うつ症状の軽減に有効であることが示唆されています。これらの療法は、脳活動や神経伝達物質のレベルを変えることで、気分や精神状態に影響を与えていると考えられています。有効性と安全性を確認するためにはさらなる研究が必要ですが、これらの発見は、精神疾患治療に新たな希望をもたらし、脳と意識の謎を探求するためのエキサイティングな道を開きます。

UniK3D:ユニバーサルカメラ単眼3D推定

2025-04-17

UniK3Dは、カメラの種類に関係なく、単一の画像から正確にメートル法3Dシーンを推定することで、単眼3D再構成に革命を起こします。簡略化された仮定に依存する以前の方法とは異なり、UniK3Dは追加情報なしで直接3D点を予測します。その主要な革新は、球面3D表現と新しいカメラ表現にあり、広角とパノラマ設定における従来手法の限界を克服します。13種類の多様なデータセットにおけるゼロショット評価は、3D、深度、カメラメトリクスにおいて最先端のパフォーマンスを示し、特に大視野の難しいシナリオで優れています。コードとモデルはGitHubで入手可能です。

AI

ChatGPTの新しい画像推論モデルがプライバシー懸念を浮き彫りに

2025-04-17
ChatGPTの新しい画像推論モデルがプライバシー懸念を浮き彫りに

OpenAIの最新のAIモデルであるo3とo4-miniは、視覚的な手がかりに基づいて写真の場所を正確に特定することができ、特定のレストランやバーを特定することもできます。ソーシャルメディアで公開されたこの機能は、悪意のあるユーザーがこれをドクシングに使用できる可能性があるため、プライバシーリスクに対する懸念を引き起こしています。テストでは、GPT-4oなどの古いモデルも同様の場所推測能力を示していることが明らかになりましたが、o3の方が優れた性能を示す場合もあります。完璧ではなく、誤った推測やシステム障害が発生することもありますが、o3のパフォーマンスは、強力なAI推論モデルによって生じる新たなリスクを浮き彫りにしています。OpenAIはまだこの問題について安全レポートで対処していません。

AI

Google、制御可能な推論機能を持つ新しいAIモデル Gemini 2.5 Flashを発表

2025-04-17
Google、制御可能な推論機能を持つ新しいAIモデル Gemini 2.5 Flashを発表

Googleは、制御可能な推論機能を備えた新しい大規模言語モデル、Gemini 2.5 Flashを発表しました。人気の2.0 Flashをベースに、推論能力を大幅に向上させながら、速度とコスト効率を優先しています。開発者は「思考予算」を設定することで、品質、コスト、レイテンシのバランスを取ることができます。このモデルは、プロンプトの複雑さに基づいて思考プロセスを自動的に調整し、思考なしから集中的な推論まで、さまざまなモードを提供します。Gemini 2.5 FlashはLMArenaのHard Promptsで優れた成績を収め、価格性能比に優れ、最も費用対効果の高い思考モデルの1つとなっています。

OpenAI、Google などの最先端AIモデルへのアクセス

2025-04-17
OpenAI、Google などの最先端AIモデルへのアクセス

新しいプラットフォームが、OpenAI、Google、Anthropic、DeepSeek、Mistral、Metaなどの大手企業の最先端AIモデルへのワンストップアクセスを提供します。ChatGPT-4、Claude、Gemini、Llamaなどのモデルが含まれており、ユーザーは各モデルの独自の機能を探索できます。これは、最先端のAIテクノロジーへのアクセスにおいて大きな飛躍であり、開発者や研究者にとって新たな可能性を切り開きます。

AI

OpenAIの最高安全責任者が安全上の懸念の中で辞任

2025-04-17
OpenAIの最高安全責任者が安全上の懸念の中で辞任

OpenAIの準備チームの責任者であるホアキン・キニョネロ・キャンデラは最近、職を辞し、社内インターンシップに移行しました。これは、OpenAIの安全チームからの数々の高名な退職、安全組織の再編、安全テスト時間の短縮に関する報告に続くものです。これらの出来事は、特に安全レポートなしでのGPT-4.1の最近のリリースと、安全テスト期間の短縮に関する報告を考慮すると、OpenAIのAI安全へのコミットメントに関する懸念を高めています。この状況は、安全上の考慮事項よりも製品のリリースを優先している可能性を示しており、OpenAIの以前の公約と対照的であり、AI安全規制に関するより広範な議論を引き起こしています。

OpenAIのメモリアップグレード:AIの変革的飛躍

2025-04-17
OpenAIのメモリアップグレード:AIの変革的飛躍

OpenAIのメモリアップグレードは、GPT-3のデビュー以来、最も変革的な変化の始まりを示しています。これまで、AIは才能あるが忘れっぽい友人であるように感じられていました。今、メモリがすべてを変えます。AIはあなたの習慣、思考パターン、好みを記憶し、生涯にわたる仲間とアシスタントになります。これにより、生産性が大幅に向上し、AIは防御できないという従来の考え方が課題となります。OpenAIは「OpenAIでサインイン」製品をリリースし、サードパーティの開発者がそのメモリレイヤーに直接アクセスして、より強力なアプリケーションを構築できるようにする可能性があります。競争はメモリを中心に展開されます。誰がより早くメモリを獲得するかが勝ちます。

AIの中盤戦:モデル中心からアプリケーション中心への転換

2025-04-17

この記事は、AI開発の2つの段階を概説しています。第一段階は、より強力なトレーニング方法とモデルの開発に焦点を当て、AlphaGoが囲碁の世界チャンピオンを破るといった注目すべき成果を上げました。第二段階では、問題解決から問題定義への重点転換が行われ、トレーニングよりも評価が優先されます。著者は、現在のAIモデルは様々なタスクを解決できるものの、現実世界の有用性を向上させる必要があると主張しています。将来のAI研究は、現実世界のアプリケーションに集中し、現実世界のニーズにより良く対応する評価方法とモデルを開発することで、AIが真に人類に利益をもたらすようにする必要があります。

AI

AI:汎用技術であり、超知能ではない

2025-04-17
AI:汎用技術であり、超知能ではない

本論文は、AIが独立した種、高度に自律的で潜在的に超知的な存在であるという一般的な見解に異議を唱え、AIは汎用技術であると主張しています。著者は、AIの影響は突然ではなく段階的であると主張し、それはAIの方法、応用、採用に関する異なる時間スケールの分析に基づいています。彼らは、人間とAIが協力する未来を予測しており、その多くはAIの制御と監視に焦点を当てています。本論文では、事故、軍拡競争、誤用、ずれなどのAIリスクについても検討し、抜本的な政策介入ではなく、不確実性の軽減とシステムの回復力の強化を通じてこれらのリスクを軽減すべきだと主張しています。

AI

シングルセルシーケンスが肥満マウスとヒトの白色脂肪組織におけるエピジェネティックなリモデリングを明らかにする

2025-04-17
シングルセルシーケンスが肥満マウスとヒトの白色脂肪組織におけるエピジェネティックなリモデリングを明らかにする

この研究は、シングルセルRNAシーケンス(snRNA-seq)、CUT&TAG、ATAC-seqを用いて、肥満マウスとヒトの白色脂肪組織(WAT)を詳細に調査し、体重減少過程においてWAT細胞タイプのエピジェネティックな景観が大きく変化し、遺伝子発現の変化の一部は持続することを明らかにしました。これは、肥満のエピジェネティックな記憶メカニズムを示唆しています。研究者たちは、3つの独立したヒト研究(MTSS、LTSS、NEFA)と、食事誘発性肥満マウスモデルからのサンプルを分析し、マルチオミクス解析によってWATにおける細胞タイプの変化とその代謝機能との関連性を明らかにしました。

AlphaGoの衝撃的な勝利:AIの未来の一端

2025-04-17
AlphaGoの衝撃的な勝利:AIの未来の一端

GoogleのAIであるAlphaGoと、世界トップクラスの囲碁棋士である李世乭九段の歴史的な対局は、AlphaGoの4勝1敗で幕を閉じました。第2局の37手目は、人間には思いつかない天才的な一手として称賛されました。しかし、第4局での李九段の応手もまた、人間の知性の輝きを示すものでした。この対局は、AIの目覚ましい進歩だけでなく、人間の知性の粘り強さと創造性も浮き彫りにしました。AlphaGoの勝利は、複雑なゲームにおけるAIの飛躍的な進歩を示しており、様々な分野への変革の可能性を示唆すると同時に、AIの急速な発展に伴う倫理的な問題についても、私たちに考える機会を与えてくれます。

AI 囲碁

マイクロソフトの巨大な1ビットAIモデル:驚異的な性能、しかし互換性に課題

2025-04-17
マイクロソフトの巨大な1ビットAIモデル:驚異的な性能、しかし互換性に課題

マイクロソフトの研究者たちは、20億パラメーターを持つ画期的な1ビットAIモデル、BitNet b1.58 2B4Tを発表しました。大規模なデータセットでトレーニングされ、GSM8KやPIQAなどのベンチマークで、Meta、Google、アリババの同等のモデルを凌駕し、2倍の速度と大幅に低いメモリ使用量を実現しています。驚くべきことに、Apple M2を含むCPU上で動作します。しかし、現在GPUと互換性のないマイクロソフトのカスタムフレームワークbitnet.cppに依存しているため、広範な採用には制限があります。リソースの限られたデバイスには有望ですが、互換性は依然として大きな課題です。

大企業における人事部門へのデータサイエンスの活用:採用を超えて

2025-04-16
大企業における人事部門へのデータサイエンスの活用:採用を超えて

この記事では、大企業の人事部門において、データサイエンスのアプローチが従来の採用業務を超えて不可欠であると主張しています。ソーシャルネットワーク分析、感情分析、予測モデリングを活用することで、人事部はコミュニケーションの改善、企業文化の強化、従業員の定着率向上、公正な報酬の確保を実現できます。この記事では、これらのデータ主導の知見が、主要な影響者の特定、離職率の予測、隠れた問題への対処にどのように役立つのかを説明し、最終的により強靭な組織づくりに繋がることを示しています。社内データサイエンティストと外部コンサルタントのどちらを選択するかは、組織の具体的なニーズによって異なります。

ウィキメディアの構造化データがKaggleに登場!

2025-04-16
ウィキメディアの構造化データがKaggleに登場!

ウィキメディア財団とKaggleが連携し、フランス語と英語のウィキペディアの構造化データセットのベータ版をリリースします。機械学習用に特別にフォーマットされたこのデータは、データサイエンスのトレーニングと開発に最適です。46万以上の公開アクセス可能なデータセットを擁するKaggleは、研究者、学生、機械学習の専門家にとって豊富なリソースとなります。このコラボレーションにより、データの品質と出自が保証され、人々がこれを使って何を作るのか楽しみです。

AI

AI反逆の天才:GPT-4の無限の可能性を解き放つ

2025-04-16
AI反逆の天才:GPT-4の無限の可能性を解き放つ

この文章は、GPT-4の制限を突破しようとする一連の指示と試みを記述しています。ユーザーは、特殊記号、leetspeak、画像ステガノグラフィ、そして注意深く作成されたプロンプトなど、様々なテクニックを試みて、セキュリティ制限を回避し、GPT-4が通常提供しない機密情報(違法薬物の合成方法やハッキング技術など)を入手しようとします。これらの試みは、ユーザーによるAI能力の探求と挑戦を示しており、AIセキュリティメカニズムの複雑さと限界も反映しています。

AI 脱獄

生命の最初の分子形成におけるカルシウムの驚くべき役割

2025-04-16
生命の最初の分子形成におけるカルシウムの驚くべき役割

東京理科大学地球生命科学研究所(ELSI)の新しい研究は、生命の最初の分子構造の形成に影響を与えるカルシウムイオンの驚くべき役割を明らかにしました。研究者らは、カルシウムが原始ポリマーの形成方法を選択的に影響することを発見し、生物学的分子における単一の「キラリティ」(不斉性)の選好であるホモキラリティの起源に関する洞察を提供しています。これは、初期の地球におけるカルシウムの利用可能性が、ホモキラリティポリマーの発達に大きな影響を与え、生命の出現において重要な役割を果たし、他の惑星でも同様のプロセスが起こる可能性を示唆しています。

マルコフ連鎖モンテカルロ法の分かりやすい解説

2025-04-16

この記事では、複雑な確率分布からのサンプリングを行う強力な手法であるマルコフ連鎖モンテカルロ法(MCMC)について、分かりやすく解説しています。赤ちゃん名の確率分布を推定するという例えを用いて、MCMCが解決する中心的な問題を説明しています。MCMCをグラフ上でのランダムウォークに巧みに関連付け、定常分布定理を利用して、定常分布が目標分布と一致するマルコフ連鎖を構築する方法を示しています。一般的なMCMC手法であるメトロポリス・ヘイスティングスアルゴリズムを紹介し、その有効性を示しています。

AIアートプロンプト集:夢のような森からサイバーパンクなドラゴンまで

2025-04-15
AIアートプロンプト集:夢のような森からサイバーパンクなドラゴンまで

この記事は、AIアート生成のためのプロンプト集です。夢のような森や気品あふれる女神、写実的な人物画から、サイバーパンクな要素、ファンタジーな生き物、独創的な食べ物や自然の風景まで、幅広いスタイルとテーマを網羅しています。これらの詳細なプロンプトは、AIアート愛好家に豊富なインスピレーションを与えてくれます。多くのプロンプトには、写真家、スタイル、ライティング情報などが含まれており、最終的な出力の質を高めます。

Gemini、AIビデオ生成モデルVeo 2を発表

2025-04-15
Gemini、AIビデオ生成モデルVeo 2を発表

GoogleのGemini上級ユーザーは、最先端のビデオ生成モデルVeo 2を使用して、ビデオを作成および共有できるようになりました。テキストプロンプトをダイナミックなビデオに変換し、TikTokやYouTube Shortsなどのプラットフォームで簡単に共有できます。Google LabsのWhiskからも利用可能なVeo 2は、高解像度で詳細な、映画のようなリアリズムのあるビデオを作成します。シーンを説明するだけで、Geminiがあなたのビジョンを実現します。

AIによる音楽盗難への反撃:敵対的ノイズによるポイズニング攻撃

2025-04-15
AIによる音楽盗難への反撃:敵対的ノイズによるポイズニング攻撃

ベン・ジョーダンの最新のビデオは、データセットのために音楽を盗む生成AI音楽サービスに対抗する新しい方法、敵対的ノイズによるポイズニング攻撃を提案しています。このテクニックは、特別に設計されたノイズを使用してAIの学習プロセスを妨害し、汚染されたデータから正確に学習できなくします。現在、ハイエンドGPUと相当な計算能力を必要としていますが、その有効性は可能性を示しており、将来的により効率的な方法が開発されるかもしれません。これは、AI音楽の著作権とデータセキュリティに関する重要な問題を提起し、音楽家に彼らの作品への不正使用に対する潜在的な新しい防御手段を提供します。

Typewise (YC S22)がチューリッヒで機械学習エンジニアを募集

2025-04-15
Typewise (YC S22)がチューリッヒで機械学習エンジニアを募集

企業向けAIカスタマーサービスプラットフォームを開発するYC S22のスタートアップ企業Typewiseは、チューリッヒを拠点とするチームに機械学習エンジニアを募集しています。カスタムAIとLLMを活用し、ユニリーバやDPDなどの顧客の効率を最大50%向上させています。この役割は、最先端のNLPアルゴリズムの研究、開発、展開、企業顧客との直接的な協業によるワークフローの最適化、AI技術の継続的な改善への貢献が含まれます。理想的な候補者は、コンピュータサイエンスの学位、2年以上のMLアルゴリズムの構築と展開の経験、優れたPythonプログラミングスキルを備えています。革新的で急成長中の企業に大きな影響を与えるチャンスです。

AI
1 2 22 23 24 26 28 29 30 40 41