LLMが現実世界のファクトチェックで失敗:能力の顕著な差

2025-06-05
LLMが現実世界のファクトチェックで失敗:能力の顕著な差

著者は、ADHD治療薬の長期的効果に関する複雑な現実世界のファクトチェックタスクで、いくつかの大規模言語モデル(LLM)をテストしました。その結果、パフォーマンスに大きな差があることが明らかになりました。いくつかのLLMは現実世界の文書を正確に引用し要約しましたが、他のLLMは深刻な「リンクの幻覚」と情報源の誤解に見舞われました。著者は、現在のLLMのテスト方法は単純すぎるため、複雑な情報を処理する能力を十分に評価できないと主張し、この重要な問題へのより多くの注意を呼びかけています。

続きを読む

オープンソースツールLVTShift:あなたの街の土地価値税をモデル化

2025-06-05
オープンソースツールLVTShift:あなたの街の土地価値税をモデル化

このブログ記事では、オープンソースツールLVTShiftを使用して土地価値税(LVT)の影響をモデル化する方法について詳しく説明しています。著者はサウスベンドとシラキュースの分析を示し、LVTShiftがさまざまなLVT政策(収益中立政策、異なる税負担のシフトなど)と、それらが都市住民と経済に与える影響をどのようにシミュレートするかを示しています。この記事では、データの取得、処理、モデル作成、分析を詳しく説明し、コード例とデータソースを含んでいます。読者はLVTShiftを使用して自分の都市のLVTをモデル化し、結果を共有することを推奨されています。

続きを読む

田舎のエンジニアが無料で公衆電話を復活させる

2025-06-05
田舎のエンジニアが無料で公衆電話を復活させる

電気技師のパトリック・シュロット氏は、珍しい趣味を持っている。それは、バーモント州の田舎で無料の公衆電話を修復し、設置することだ。彼は、多くの人が携帯電話を持っているが、田舎では必ずしも信頼性が高いとは限らず、固定電話が必要になることもあると主張している。彼の会社RandTelは現在3台の電話を運用しており、そのうちの1台は太陽光発電で動いている。このノスタルジックで社会的責任感の高いプロジェクトは、地域社会に貴重なサービスを提供すると同時に、アメリカの歴史の一部を展示している。

続きを読む
その他

NoteGen:AI搭載のクロスプラットフォームノートアプリ

2025-06-05
NoteGen:AI搭載のクロスプラットフォームノートアプリ

NoteGenは、AIを活用して記録と記述をシームレスに繋ぐクロスプラットフォームのMarkdownノートアプリです。様々な記録方法(スクリーンショット、テキスト、イラストなど)をサポートし、ネイティブMarkdownを使用することで容易な移行を実現しています。オフライン使用とGitHub、Giteeプライベートリポジトリとの同期にも対応しています。AI機能強化により、ChatGPTやGeminiなどの様々なモデルを設定し、AIアシストによる記述、推敲、翻訳などが可能です。最大の特長は「記録から執筆へ」というスムーズなワークフローで効率性を向上させる点です。

続きを読む
開発 AIノート

Foam:VS CodeとGitHub上に構築されたオープンソースの個人知識管理システム

2025-06-05
Foam:VS CodeとGitHub上に構築されたオープンソースの個人知識管理システム

Foamは、Roam Researchにインスパイアされた、Visual Studio CodeとGitHub上に構築された、無料のオープンソースの個人知識管理(PKM)および共有システムです。これにより、リサーチの整理、再発見可能なノートの保持、長文コンテンツの記述、およびオプションでWebへの公開が可能になります。双方向リンク、グラフの視覚化、テンプレート、タグ付けなどの機能により、使いやすいナビゲーションと管理ツールで個人知識ベースを構築できます。急速な開発中ですが、その強力な機能とオープンな性質により、魅力的なPKMの選択肢となっています。

続きを読む
開発

LLMはニッチなプログラミング言語を救えるか?Elixirの戦略

2025-06-05
LLMはニッチなプログラミング言語を救えるか?Elixirの戦略

大規模言語モデル(LLM)の台頭は、ニッチなプログラミング言語への影響について開発者の懸念を引き起こしました。この記事では、Elixirをケーススタディとして使用し、LLMがプログラミング言語にどのように影響するか、そしてLLMを活用してニッチな言語の競争力を高める方法を探ります。著者は、LLMのバイアスにより、主流のテクノロジースタックが優先される可能性があることを主張していますが、より良いドキュメントやLLMに最適化されたコード例を提供するなど、LLMとニッチな言語間の相互作用を改善することで、LLMはニッチな言語をより適切に理解し、活用できるようになります。さらに、ニッチな言語のための評価データセットを構築することで、LLMの熟練度が向上し、適切なシナリオでニッチな言語が推奨されるようになります。最終的に、著者は、受動的な抵抗ではなく、LLMを積極的に受け入れ、活用することが、AI時代におけるニッチなプログラミング言語の生存の鍵であると示唆しています。

続きを読む
開発

軽量3DレンダリングのためのSVGにおけるパースペクティブ変換の近似

2025-06-05
軽量3DレンダリングのためのSVGにおけるパースペクティブ変換の近似

開発者は、Reactで作成された回路基板をSVGとしてレンダリングするための、シンプルなTypeScript 3Dレンダラーを作成しました。SVGはネイティブにパースペクティブ変換をサポートしていないため、アフィン変換と画像分割を巧みに使用しました。画像を多くのサブ領域に分割し、各領域に局所的に正しいアフィン変換を適用することで、パースペクティブを近似しました。結果は、SVGファイルサイズを管理可能な状態に保ちながら、512分割で優れた視覚品質を示しました。このアプローチは、GitHubで回路基板の変更を表示および確認するための優れたソリューションを提供します。

続きを読む

巨大テック企業の独占:お金を払わなければ、あなたが商品だ

2025-06-05
巨大テック企業の独占:お金を払わなければ、あなたが商品だ

コリー・ドクターロウによる「Ensh-ttification」という概念は、無料の製品ではユーザー自身が商品であることを浮き彫りにしています。巨大テック企業は市場支配力を利用して競合他社を排除し、ユーザーエクスペリエンスとプライバシーを犠牲にしています。この記事は、反トラスト法の復活と関税政策の転換を、これに対する潜在的な武器として示唆しています。広告のないInstagramの代替アプリであるOG Instagramの例は、イノベーションがどのように窒息させられるかを示しており、この「ビジネスモデルへの犯罪的軽視」に対処するための法的改革の必要性を強調しています。

続きを読む
テクノロジー

AxumにおけるCookieベースの認証:エクストラクタからミドルウェアへ

2025-06-05

この記事では、RustのAxumフレームワークにおけるCookieベースのユーザー認証の実装方法について、2つのアプローチを探求しています。最初に、カスタムエクストラクタ`CookieJwt`を使用してリクエストからJWTトークンを取得し、JWTの有効性に基づいて「プロフィール」ボタンまたは「ログイン」ボタンを条件付きでレンダリングする方法が示されています。しかし、このアプローチは、複雑な認証シナリオではそれほどクリーンでスケーラブルではありません。そこで、この記事では、Axumミドルウェアを使用してソリューションをリファクタリングすることで、よりクリーンで、再利用可能で、柔軟な認証ロジックの処理方法を提供しています。このミドルウェアは、JWTを効率的に検証し、更新トークンを管理し、さまざまなリクエストタイプを処理することで、より堅牢で適応性のあるユーザー認証システムを実現します。この記事では、ミドルウェアの実装の詳細と、エクストラクタベースのアプローチに対する利点を強調しています。

続きを読む
開発

アップル、エピックゲームズとの独占禁止訴訟で控訴棄却

2025-06-05
アップル、エピックゲームズとの独占禁止訴訟で控訴棄却

米国第9巡回控訴裁判所は、アップルがApp Storeへの競争促進を命じた下級裁判所の命令の一時停止を求めた緊急申し立てを棄却しました。下級裁判所は、アプリ外取引に対する27%の手数料や、開発者を外部決済オプションへの誘導から阻止する試みなど、過去の差し止め命令を回避したとしてアップルを裁判軽視と判断しました。アップルは、この判決により事業の中核部分を制御できなくなると主張しましたが、裁判所は命令を維持し、開発者への制限が緩和されました。アップルは控訴を継続する予定です。

続きを読む
テクノロジー

自動車運搬船の火災が、海上のEVリスクの高まりを浮き彫りに

2025-06-05
自動車運搬船の火災が、海上のEVリスクの高まりを浮き彫りに

電気自動車を含む数千台の車両を積載していたモーニング・ミダス号の火災は、自動車運搬船の火災の最新事例です。この事件は、フリーマントル・ハイウェイ号やフェリシティ・エース号などの過去の災害の詳細な報告とともに、海上輸送におけるリチウムイオン電池が提示する大きな課題を浮き彫りにしています。調査では、不十分な消火システム、貧弱な緊急対応、根本的な設計上の欠陥などの問題がしばしば明らかになります。電気自動車の増加に伴い、海上輸送における安全規制と技術の緊急的な改善が必要です。

続きを読む
テクノロジー 自動車運搬船火災

Linuxハードウェアの第一人者:Michael Larabel

2025-06-05

Michael Larabelは、Phoronix.com(2004年設立)の創設者であり、Linuxハードウェアパフォーマンスにおける第一人者です。Linuxハードウェアサポート、パフォーマンス、グラフィックドライバーなどに関する20,000以上の記事を執筆しています。また、自動ベンチマークソフトウェアであるPhoronix Test Suite、Phoromatic、OpenBenchmarking.orgのリード開発者でもあります。

続きを読む
テクノロジー

arXivLabs:コミュニティとの協力による実験プロジェクト

2025-06-05
arXivLabs:コミュニティとの協力による実験プロジェクト

arXivLabsは、共同作業者がarXivの新しい機能を直接arXivウェブサイト上で開発・共有できるフレームワークです。arXivLabsと連携する個人や組織は、オープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという私たちの価値観を受け入れています。arXivはこれらの価値観に尽力しており、これらの価値観を遵守するパートナーのみと連携しています。 arXivコミュニティに価値を追加するプロジェクトのアイデアをお持ちですか?arXivLabsの詳細をご覧ください。

続きを読む
開発

アメリカン・サイエンス・アンド・サープラス:メイカースペースの楽園、eコマースの波に挑む

2025-06-04
アメリカン・サイエンス・アンド・サープラス:メイカースペースの楽園、eコマースの波に挑む

1937年創業のアメリカン・サイエンス・アンド・サープラスは、盛衰を経験してきた。当初はレンズや実験機器を販売していたが、科学玩具、クラフト用品、そして幅広い電子部品や工具を取り揃え、メイカー文化を体現する存在となった。しかし、eコマースの台頭は、望遠鏡など以前は人気だった商品に影響を与え、売上減少につながっている。老舗ならではの豊富な在庫、そして今はなきRadio Shackとの関係は、過去の小売業の時代を懐かしませる一方、現在の品揃えは今もなお創造性と革新性を刺激し続けている。

続きを読む
その他 メイカー文化

AnthropicのClaude 4.0システムプロンプト:改良と進化

2025-06-04
AnthropicのClaude 4.0システムプロンプト:改良と進化

AnthropicがリリースしたClaude 4.0は、バージョン3.7と比較して、システムプロンプトに微妙ながらも重要な変更が加えられています。これらの変更は、Anthropicがシステムプロンプトを使用してアプリケーションのUXを定義する方法、そしてプロンプトが開発サイクルにどのように適合するかを示しています。例えば、古いホットフィックスが削除され、肯定的な形容詞で回答を始めるのを避けたり、必要に応じてユーザーの許可を求めるのではなく、プロアクティブに検索するなど、新しい指示が追加されました。これらの変更は、検索ツールとモデルの適用に対する自信の増大、そしてユーザーが検索タスクにClaudeをますます利用しているという観察を示唆しています。さらに、Claude 4.0のシステムプロンプトは、より多くの種類の構造化ドキュメントに対するユーザーの需要を反映し、簡潔なコードを促進することでコンテキスト制限の問題に対処し、悪意のあるコードの使用に対する安全策を追加しています。要するに、Claude 4.0のシステムプロンプトの改善は、観察されたユーザー行動に基づいてチャットボットの動作を最適化するAnthropicの反復的な開発プロセスを示しています。

続きを読む
AI

マイクロソフトフライトシミュレーター:40年の飛行の歴史

2025-06-04
マイクロソフトフライトシミュレーター:40年の飛行の歴史

1979年のApple IIにおける скромное началоから、今日のグローバルに詳細なシミュレーションまで、マイクロソフトフライトシミュレーターは40年間飛行を続けてきました。この記事では、ゲームの旅を、その誕生からピーク、その後の衰退、そして華麗な復活までを克明にたどり、技術の進歩、チームワーク、そして飛行という夢への揺るぎない献身の力を示しています。Sublogic社での起源から、Microsoftによる買収、Aces Studioの努力を経て、Asobo StudioによるAIとBingデータを利用したリメイクに至るまで、各イテレーションは技術の飛躍と、開発者たちの革新への絶え間ない追求を反映しています。

続きを読む
ゲーム

PromptArmor:LLMを突破し、AIセキュリティの未来を築く

2025-06-04
PromptArmor:LLMを突破し、AIセキュリティの未来を築く

PromptArmorは、AIセキュリティに特化したスタートアップ企業です。大規模言語モデル(LLM)アプリケーションの脆弱性を突いて堅牢な防御システムを構築することに特化しています。米国の大企業を顧客として、AI導入の安全な加速化を支援しています。GoogleやTeslaといった企業出身のメンバーから構成され、Y Combinatorなどのトップ投資家から資金調達を受けています。顧客重視のアプローチを重視し、12万ドルから18万ドルのベースサラリーと0.75%から2%の株式を報酬として提供しています。サンフランシスコにオフィスを構え、高度な技術力と製品感覚を持つエンジニアを求めています。

続きを読む
スタートアップ

1978年NOVAドキュメンタリー:AIのブームとバスト、そして不確かな未来

2025-06-04
1978年NOVAドキュメンタリー:AIのブームとバスト、そして不確かな未来

1978年のNOVAドキュメンタリー「Mind Machines」は、ジョン・マッカーシーやマービン・ミンスキーといったAIのパイオニアへのインタビューを収録し、AIの可能性と課題を探っています。アーサー・C・クラークは、AIが人間の知能を超えた場合、社会が再編されることを予測し、人生の目的について省みるきっかけを与えています。このドキュメンタリーは、コンピューターチェスやシミュレーションされたセラピストといった初期のAI技術を紹介し、将来のAIの学習能力を展望し、AIの発展におけるブームと不況のサイクルを強調しています。

続きを読む

Waymoの1000万回走行達成:テスラの自動運転戦略に圧力?

2025-06-04
Waymoの1000万回走行達成:テスラの自動運転戦略に圧力?

2019年、イーロン・マスクはライダーとWaymoを軽視しました。2024年現在、Waymoの無人タクシーサービスは1000万回以上の走行を達成し、わずか数ヶ月で走行回数を倍増させました。対照的に、テスラのロボタクシーサービスはわずか10台で開始されます。著者は、Waymoが人口密集地帯に焦点を当て、ライダーなどの技術を活用することで大きな進歩を遂げたと主張しています。テスラの戦略は、都市部の自動運転における80/20則を見過ごしており、あまりにも攻撃的すぎるかもしれません。自動運転の残り20%を解決するには、80%の努力が必要になる可能性があります。Waymoの成功は、自動運転分野において、着実で管理された市場へのアプローチが、あらゆる状況に対応することを目指すよりも効果的であることを示唆しています。

続きを読む
テクノロジー

AdaとSPARK、自動車開発に参入:NVIDIAが安全プロセスをオープンソース化

2025-06-04
AdaとSPARK、自動車開発に参入:NVIDIAが安全プロセスをオープンソース化

AdaCoreとNVIDIAは協力して、AdaとSPARKプログラミング言語を自動車市場に導入し、ISO 26262規格に基づいた参照開発プロセスをオープンソース化しました。NVIDIAのDrive OSは、最高レベルの自動車安全認証要件を満たすために、重要なコンポーネントにAdaとSPARKを使用しています。このオープンソースプロセスは、他の企業がAdaとSPARKを採用し、増大する複雑さの中で自動車ソフトウェアの安全性を向上させることを目的としています。

続きを読む

マイクロソフト、AIパワー解き放つための再編:LinkedInとMicrosoft 365が融合

2025-06-04
マイクロソフト、AIパワー解き放つための再編:LinkedInとMicrosoft 365が融合

マイクロソフトは、AI戦略を加速させるため、大規模な組織変更を発表しました。LinkedInのCEOであるRyan Roslansky氏は、Microsoft 365 Copilotの開発をリードする役割を拡大し、LinkedIn CEOも兼任します。Charles Lamanna氏と彼のビジネスおよび業界CopilotチームはRajesh氏に報告するようになり、これは、モダンワークとビジネスアプリケーションを統合したAIビジネスソリューションセンターを形成するというマイクロソフトの戦略を反映しています。この動きは、従来の業界の枠組みを打破し、LinkedIn、Microsoft 365、Dynamics 365の統合によって、より大きな顧客価値を生み出し、次世代のAIイノベーションを促進することを目指しています。

続きを読む

VectorSmuggle:ベクトル埋め込みによるAI/MLシステムからのデータ流出

2025-06-04
VectorSmuggle:ベクトル埋め込みによるAI/MLシステムからのデータ流出

VectorSmuggleは、RAGシステムに焦点を当て、AI/ML環境における高度なベクトルベースのデータ流出技術を実証するオープンソースのセキュリティリサーチプロジェクトです。高度なステガノグラフィ、回避技術、データ再構築手法を用いて、潜在的な脆弱性を明らかにします。このフレームワークは多くのドキュメント形式をサポートし、防御的分析、リスク評価、AIシステムセキュリティの向上のためのツールを提供します。

続きを読む
AI

Neon上で実アプリを生成するapp.buildを発表

2025-06-04
Neon上で実アプリを生成するapp.buildを発表

app.buildはNeonプラットフォームを使用して、ゼロから完全に機能するアプリを生成します。Neon Postgres、Neon Auth、その他のNeon機能を活用しており、オープンソース、ローカルファースト、開発者向けです。Neon上で構築されるコード生成プロジェクトの参照実装として機能します。

続きを読む

iOS 26でApple NotesがMarkdownに対応するとの噂

2025-06-04
iOS 26でApple NotesがMarkdownに対応するとの噂

9to5Macによると、Apple NotesアプリがiOS 26とmacOS 26でMarkdownに対応するとの噂があります。これにより、ユーザーはシンプルな構文でテキストをフォーマットでき、アプリの現在のリッチテキストコントロールに頼る必要がなくなります。キーボード中心のユーザーにとって大きなアップグレードとなり、ボタンをタップする代わりに**太字**や#見出しを直接入力できます。これにより、Apple NotesはObsidian、Notion、Bearなどの一般的なメモアプリと同等の機能を備えることになります。GitHubやRedditでMarkdownを既に使用している開発者やライターは、簡素化されたワークフローを高く評価するでしょう。噂が事実であれば、この機能は来週のWWDCで、メッセージの自動翻訳や投票、ビジュアルデザインの大幅な変更などの他のiOS 26の改善点とともに発表される可能性が高いです。

続きを読む
開発

OpenAIのAPIチャットログ保存命令がユーザーのプライバシー懸念を引き起こす

2025-06-04
OpenAIのAPIチャットログ保存命令がユーザーのプライバシー懸念を引き起こす

裁判所がOpenAIにAPIチャットデータの保存を命じたことで、ユーザーにパニックが広がっています。ユーザーはLinkedInとXで懸念を表明し、これが重大な契約違反であり、プライバシーを危険にさらすと主張しています。Mistral AIやGoogle Geminiなどの代替手段を使用するよう勧める人もいます。OpenAIは、ユーザーが個人情報を管理することでChatGPTを自由に利用できると主張し、裁判所がユーザーの懸念を十分に考慮しなかったと考えています。裁判所が命令を取り消すかどうかは不明です。

続きを読む
テクノロジー

オープンソースソフトウェア:科学研究の礎

2025-06-04

この記事では、科学研究におけるオープンソースソフトウェアの重要な役割を探っています。著者は、オープンソースソフトウェアに固有の自由性と再現性は、科学の発展に不可欠であり、データ処理、シミュレーション、文書作成、保存における課題を効果的に解決すると主張しています。これに対し、プロプライエタリソフトウェアは、制限的なライセンス、ソフトウェアの劣化、結果の再現不能など、多くのリスクをもたらします。この記事は最後に、GCC、GFortran、Julia、Typst、Pandocなどの一般的に使用されているオープンソースソフトウェアパッケージをいくつか推奨し、科学的進歩へのオープンソースソフトウェアの大きな貢献を強調しています。

続きを読む
テクノロジー

Cursor 1.0 リリース:BugBot、バックグラウンドエージェントなど!

2025-06-04
Cursor 1.0 リリース:BugBot、バックグラウンドエージェントなど!

Cursor 1.0がリリースされました!数々の新機能が追加されています!BugBotはコードレビューを自動化し、潜在的なバグを検出してGitHub PRに直接修正案を提案します。バックグラウンドエージェントは全ユーザーに公開され、チャットやショートカットキーからアクセスできます。その他、Jupyter Notebookのサポート、ベータ版の「メモリー」機能、ワンクリックMCPインストール、視覚化によるよりリッチなチャット応答などが含まれています。開発者の生産性を大幅に向上させるリリースです。

続きを読む

Swift:組込みデバイスからクラウドまでを網羅する、究極のプログラミング言語

2025-06-04
Swift:組込みデバイスからクラウドまでを網羅する、究極のプログラミング言語

Swiftは、その使いやすさ、速度、安全性、そしてC/C++との優れた相互運用性により、組込みデバイスやカーネルからアプリ、クラウドインフラまでをカバーできる唯一のプログラミング言語です。簡潔で読みやすい構文は、あらゆるレベルの開発者を支援し、オブジェクト指向、関数型、ジェネリックプログラミングのパラダイムをサポートしています。段階的な情報公開により、初心者でも基礎を迅速に習得でき、経験豊富な開発者は高度な機能を活用できます。簡単な例として、数行のコードで完全なコマンドラインツールを実装する方法を示します。

続きを読む
開発

デルフト工科大学の自律型ドローン、歴史的なレースで人間のチャンピオンを破る

2025-06-04
デルフト工科大学の自律型ドローン、歴史的なレースで人間のチャンピオンを破る

デルフト工科大学のチームが、アブダビで開催されたA2RLドローン選手権で1位を獲得しました。この国際レースは、物理的な人工知能の限界を押し広げるもので、チームは単一のカメラのみを使用して完全に自律型のドローンを飛行させるという課題に挑みました。デルフト工科大学のドローンは、13機の自律型ドローンと人間のドローンレースチャンピオンを破り、革新的な方法で深層ニューラルネットワークを訓練して高性能制御を実現しました。この高効率で堅牢なAIに関する知見は、自動運転車から人型ロボットまで、多くのロボット工学アプリケーションに貢献します。

続きを読む
テクノロジー ドローンレース

Fakespot:偽Amazonレビュー対策の秘密兵器

2025-06-04
Fakespot:偽Amazonレビュー対策の秘密兵器

Fakespotは、AmazonなどのECサイトにおける偽レビューを特定するブラウザ拡張機能です。ユーザーレビューでは、低品質な製品の購入を避け、時間とお金を節約する効果があると絶賛されています。Fakespotはレビューを分析し、疑わしい偽レビューを特定し、製品と出品者を評価することで、ユーザーがより賢明な購買判断を下せるように支援します。多くのユーザーがFakespotを使い始めてから偽物を買ったことがなく、その効果を高く評価しています。

続きを読む
その他
1 2 186 187 188 190 192 193 194 595 596