LLMが簡単なタスクに失敗:HTML5要素とTLDのマッチング
著者は、市販されている3つのLLMに対して、一見簡単なタスク、つまり有効なHTML5要素と名前が同じトップレベルドメイン(TLD)を特定するタスクを試しました。結果はがっかりもので、3つのモデルすべてが不正確または不完全な結果を生成し、基本的な比較スキルを必要とするタスクにおいても、現在のLLMの限界が浮き彫りになりました。正確性は、ユーザーの主題に関する知識に大きく依存しているようです。
続きを読む
著者は、市販されている3つのLLMに対して、一見簡単なタスク、つまり有効なHTML5要素と名前が同じトップレベルドメイン(TLD)を特定するタスクを試しました。結果はがっかりもので、3つのモデルすべてが不正確または不完全な結果を生成し、基本的な比較スキルを必要とするタスクにおいても、現在のLLMの限界が浮き彫りになりました。正確性は、ユーザーの主題に関する知識に大きく依存しているようです。
続きを読む
Google Workspaceユーザーは、Geminiによるメール要約機能の大幅な強化を目にすることになります。Gmailは、複雑なメールスレッドに対して自動的に要約を生成するようになり、その要約はメールの上部に表示されます。AIによるメール要約機能は昨年からGoogle Workspaceアカウントで利用可能でしたが、これまで手動で起動する必要がありました。 GoogleのAIは、要約が役立つと判断した場合に自動的に要約を作成するようになり、ユーザーからの要求は不要です。要約は、新しい返信があると更新されます。現在、自動要約はモバイルデバイスでのみ表示され、英語のメールのみに対応しており、アカウントに反映されるまで最大2週間かかる場合があります。Googleは、デスクトップ版Gmailへの展開や、有料のWorkspaceアカウントを持たないGmailユーザーへの提供について発表していません。Gmailが自動的にAI要約を生成しない場合でも、これまでと同様に手動で要約を生成させることができます。また、アプリの設定で「スマート機能」をオフにすることで、GmailのすべてのAI機能を無効にすることができます。
続きを読む
この記事は、ソフトウェア設計において「動く最小限のシンプルなものを作る」という原則を提唱しています。理想的で過剰設計されたシステムを目指すのではなく、現在のシステムを深く理解し、最もシンプルな解決策を選択することを推奨しています。一見すると大したことないように見えるこのアプローチですが、UnixやRailsなどの優れたシステムのデザインに見られるように、驚くほど効果的な結果をもたらします。システムの非柔軟性や「シンプルさ」の定義といった課題はありますが、著者は、遠い将来の要件のために過剰設計するよりも、現在の問題に焦点を当て、段階的に改善していく方が優れていると主張しています。最終的に、シンプルで安定したシステムは、過剰設計され、保守が困難なシステムよりも優れていることが多いのです。
続きを読む
ネットワークインターフェースカード(NIC)の急速な発展に伴い、Linuxカーネルによるデータパケット処理の低パフォーマンスがボトルネックとなっています。インターネットの高性能ネットワーク処理の需要を満たすため、DPDK、NETMAP、PF_RINGなどのカーネルバイパス技術が注目されています。F-StackはDPDKをベースとした高性能オープンソースネットワークフレームワークです。Linuxカーネルは制御フロー処理のみに使用され、すべてのデータストリームはユーザー空間で処理されるため、カーネルによるパケットコピー、スレッドスケジューリング、システムコール、割り込みによるパフォーマンスボトルネックを回避します。F-Stackは、ユーザー空間TCP/IPスタック(FreeBSD 11.0安定版ベース)、POSIX API(Socket、Epoll、Kqueue)、プログラミングSDK(Coroutine)、NginxやRedisなどのアプリケーションインターフェースを含み、優れたネットワーク処理性能を実現することを目指しています。
続きを読む
パンデミック後の非COVID-19感染の急増を説明する「免疫負債」説は、ますます厳しく精査されています。当初は広く受け入れられていましたが、パンデミックの制限が病原体への曝露を抑制し、個人がより脆弱になったという考えは、制限が解除された後も感染率が上昇していることから疑問視されています。新たな研究は、SARS-CoV-2が免疫系を微妙に変化させ、他の病原体への反応を損なう可能性があることを示唆しています。これには、免疫系の「リセット」が含まれ、休眠ウイルスが再活性化される可能性があります。この仮説は、RSVから帯状疱疹、敗血症に至るまで、さまざまな病気に対する私たちの理解を改める可能性があります。一部で異論はありますが、証拠は、軽症のCOVID-19の場合でも、持続的な免疫系への影響があり、免疫機能障害を引き起こすことを示しています。その影響は、さらなる議論と研究の対象となっています。
続きを読む
LLVMとSwiftの開発者であるChris Lattnerが、Ronと新しいプログラミング言語Mojoについて議論しています。Mojoは、最新のGPUの能力を最大限に活用することを、生産的で楽しいものにすることを目指しています。その設計は、最先端のカーネルを作成するために必要な制御を提供しながら、使いやすい言語にすることに焦点を当てています。重要な概念は、プログラマーにハードウェアの詳細を理解させることですが、型安全なメタプログラミングを通じて、管理しやすく共有しやすいようにすることです。目標は、計算とハードウェアプラットフォームの両方に特化したサポートを提供することです。Lattnerは、AIコンピューティングエコシステムを単一のベンダーが支配することを防ぐために、これが必要だと主張しています。
続きを読む
圧縮を有効にしたZFSファイルシステム上で、`dd`コマンドを使って作成した256KBのゼロファイルが、奇妙な挙動を示します。`ls -l`では256KBと表示されるのに対し、`ls -s`と`ls -slh`でははるかに小さいサイズ、ほぼゼロと表示されます。これは、ZFSの高効率な圧縮によって物理ブロック数が最小限に抑えられているためです。この記事では、ファイルサイズの測定方法として、論理サイズ(バイト数)、物理ブロック数、論理ブロック数の3つの方法を検討し、POSIXの`st_blocks`フィールドがどのサイズを報告すべきかを明確に指定していないため、ファイルシステム間でファイルを移動すると`st_blocks`の値が変化し、場合によってはファイルサイズが膨張して新しいファイルシステムに収まらなくなる可能性があることを指摘しています。
続きを読む
この記事では、「ドットレスドメイン」という現象について探求しています。これは、.comや.orgなどのトップレベルドメイン(TLD)が、セカンドレベルドメインなしで直接アクセスできるというものです。ICANNとIABはこの慣習を推奨していませんが、国コードトップレベルドメイン(ccTLD)の中には、国の管轄権のために依然として存在するものがあります。この記事では、現在と過去におけるドットレスドメインの例を挙げ、電子メールの配信とウェブサイトへのアクセスにおける技術的な制限を分析しています。さらに、DNSツリーの構造と、ルートドメイン(.)が理論上A、AAAA、MXレコードを持つ可能性についても考察していますが、実際には存在しません。
続きを読む
研究者らは、サブピクセルモーション検出のために、溶液プロセスで処理された強誘電性P(VDF-TrFE)薄膜を用いた新規な強誘電性ランダムアクセスメモリ(FeRAM)を開発しました。このFeRAMは、受動的なクロスバーアレイコンデンサに基づいており、強誘電性ドメインの非線形ダイナミクスを利用して、寄生経路の問題を効果的に排除します。制御された電界極性によって強誘電性ドメインを切り替えることで、システムは画像情報を保存し処理し、画像の違いを直接抽出します。これにより、数学関数の微分計算や移動体の識別などのアプリケーションが可能になります。このシステムは、高精度、低消費電力、追加メモリユニット不要などの利点を持ち、ビデオ監視や欠陥検出などのアプリケーションにおいて大きな可能性を示しています。
続きを読む
インターネットの不自然さとアルゴリズム操作を嘆くRedditの投稿が、AIイラストの書籍を販売するために設計されたAI駆動型ボットであることが判明しました。このボットは巧みに共感できる投稿を作成し、数千ものアップボートとコメントを集めました。著者の調査は、洗練された計画を明らかにしました。ボットはAmazonページへの短縮リンクを使用し、アフィリエイトマーケティングを利用してユーザーのエンゲージメントから利益を得ています。この事件は、オンラインでのインタラクションの信頼性と、操作的なAIの可能性に関する懸念を引き起こし、著者は「Dead Internet Theory」(インターネットのほとんどのインタラクションはボット間の自動化されたループであるという考え方)の普及を疑問視しています。この経験は、著者に深い不安を与え、高度なAI時代の現実の本質を問いかけています。
続きを読む
ロサンゼルスでは、Waymoの自動運転タクシーが住宅街の特定の場所に頻繁に駐車しており、住民たちの好奇心と懸念を引き起こしています。中には、Waymoが自分の家の前に繰り返し停車し、数時間そこに留まるケースもあります。Waymoは、これはエネルギー消費、交通渋滞の軽減、需要への対応をバランスさせるAIアルゴリズムの結果だと説明していますが、なぜこれほど特定の場所を選ぶのかは説明できません。専門家らは、これが機械学習アルゴリズムの結果である可能性があると推測しています。Waymoはこれを確認していませんが、この透明性の欠如は、AI意思決定の説明可能性に関する懸念を引き起こし、自動運転技術が現実世界のアプリケーションで直面する課題を反映しています。
続きを読む
OpenStreetMapダウンロードサーバーのインフラストラクチャがアップグレードされ、ダウンロード速度と可用性が向上しました。サービスの速度低下を防ぐため、ユーザーは責任あるダウンロードを強く求められています。具体的な推奨事項としては、グローバルデータの場合はplanet.openstreetmap.orgから完全なplanetファイルを取得すること、大規模な地域データの場合はpyosmium-up-to-dateプログラムを使用して最新の変更のみをダウンロードすること、自動化されたダウンロードの場合はスクリプトを監視し、適切なエラー処理を組み込んで同じファイルを何度もダウンロードするのを防ぐことが挙げられます。
続きを読む
ActorCoreは、ステートフル、AIエージェント、コラボレーティブ、またはローカルファーストアプリケーションを簡単に構築するためのTypeScriptフレームワークです。データベースとORMの必要性を排除し、状態を計算と同一マシンに保存することで、超高速な読み書き速度を実現します。Rivet、Cloudflare、Bun、Node.jsなどにデプロイできます。組み込みの低遅延イベントにより、リアルタイムの状態更新と変更のブロードキャストが可能です。独自のEdgeデータストレージにより、即時的なインタラクションを実現します。現在、OLAP、データレイク、グラフデータベース、高度にリレーショナルなデータには最適ではありませんが、継続的に改善されており、ステートフルサーバーレスアプリケーションの構築とスケーリングのための普遍的な方法を目指しています。
続きを読む
Airbnbは、検索機能のグローバルアップデートを行い、清掃料金を含む総額を事前に表示するようになりました。この変更は、透明性を高め、チェックアウト時の予期せぬ料金を回避することを目的としています。これは、EUによる料金表示方法に関する精査を受けており、2019年に一部地域で最初に導入されました。その後、米国と数百カ国で、宿泊費の総額を表示する切り替え機能が導入されました。2022年の導入以来、約1700万人がこの切り替え機能を使用しています。現在、ユーザーはこれを有効にする必要がなくなり、「料金に全てが含まれています」というバナーが検索結果の上部に表示されます。
続きを読む
10年以上の建設期間を経て、中国は世界で最も感度の高いニュートリノ検出器である江門地下ニュートリノ実験施設(JUNO)を稼働開始しました。地下700メートルに位置するJUNOは、2万トンの液体シンチレーター検出器と4万5千本以上の光電子増倍管を備えています。近隣の原子力発電所から放出されるニュートリノを、ニュートリノがシンチレーター中の水素原子と相互作用して発生する光を検出することで観測します。JUNOの成功は、ニュートリノの質量階層と種類に関する理解を大幅に進歩させ、世界中の科学者による国際協力は、中国の基礎科学研究における大きな飛躍を意味します。
続きを読む
この記事では、可視化を用いてRustの非同期ランタイムTokioの並行処理と並列処理の機能を深く掘り下げています。著者は巧みに正弦波グラフを使用して、さまざまな非同期タスクの実行順序とCPU使用率を直感的に示しています。実験の結果、CPUバウンドなタスクは他の非同期操作をブロックしますが、Tokioの`tokio::spawn`と`tokio::task::spawn_blocking`はマルチコアリソースを効果的に活用してパフォーマンスを向上させることが示されています。この記事は、Tokioのタスクスケジューリング戦略とCPUバウンドなタスクの処理方法をまとめた、優れた、分かりやすく、視覚的に豊かなチュートリアルです。
続きを読む
これはAmiga愛好家の体験談で、Amigaプラットフォームの興亡を探っています。1988年以来Amiga 500に魅せられた著者は、PC台頭にもかかわらずAmigaを使い続け、アップグレードを重ねてきました。この記事では、Amigaの衰退はDoomというゲームではなく、PCの規模の経済と標準化、そしてCommodore社の戦略的誤算が原因だと主張しています。Amigaは優れたグラフィックとマルチタスク処理を誇っていましたが、最終的には安価で高性能なPCハードウェアと、より大きなソフトウェアエコシステムに敗れました。著者の経験は、Amigaの長所と、CommodoreがPCの支配力と競争する際に直面した課題を浮き彫りにしています。
続きを読む
シュメール人が紀元前3400年頃に文字を発明したという長年の説に異議を唱える新たな研究によると、先史時代の人類は数千年も前に一貫した記号体系を使っていた可能性があることが示唆されている。これらの記号は、ヨーロッパの複数の洞窟で見つかっており、点、線、三角形などの単純な形状から成っている。これは、従来考えられていたよりもはるかに早い段階で象徴的思考と情報交換が発達していたことを示唆しており、古代のグローバルなコミュニケーションネットワークを示唆している可能性がある。この発見は、文字の起源に関する私たちの理解を再定義し、初期人類の高度な認知能力を示唆している。
続きを読む
開発者が、古いi486SXラップトップで不足していた浮動小数点演算ユニット(FPU)をエミュレートすることに成功しました。数ヶ月にわたる作業を経て、NetBSD 10上でソフトFPUエミュレータの実装とオープンソース化を実現しました。このプロジェクトは、古いi486SXマシンに新たな命を吹き込むだけでなく、レトロコンピューティング愛好家に新たな可能性をもたらします。86Box仮想マシン上でのテストにも成功しています。
続きを読む
この記事は、人間とAIの共存の未来を探求し、さまざまな動物種間の関係と、人間とAIの潜在的な相互作用との類似点を示しています。著者は、将来のAIは、人間に依存する飼い犬のようなものから、独立したカラスのようなもの、さらにはトンボのように無関心なものまで、幅広い形態をとる可能性があると示唆しています。著者は、AIが圧倒的に支配的になるのを防ぐために、健康的な競争エコシステムを構築することが重要だと主張しています。また、この記事では、学生がChatGPTに過度に依存し、学習を怠るなど、AIの負の影響についても警告しています。最終的に、著者は、読者にAIの利便性と人間の学習能力および競争力の維持のバランスをとるよう促し、AI時代の継続的な成功を保証しています。
続きを読む
父親が、息子に数学を強制することなく、数学への愛情を育む方法を共有しています。彼は、数学は退屈な宿題ではなく、楽しい探求であるべきだと考えています。ゲーム、物語、日常生活の例を通して、息子は自然に数学を好きになり、平均以上の理解力を持つようになりました。この記事は、特定の科目を強制するのではなく、子どもの学習意欲を高めることの重要性を強調しています。
続きを読む
著者は、カスタム Lisp REPL(CIEL など)を批判し、それらがネイティブ REPL の強力な機能とカスタマイズ性を犠牲にしていると主張しています。具体的には、ネイティブ REPL コマンド、実装デバッガー、実装 API を使用したカスタマイズ機能などが挙げられます。この記事では、Trivial Toplevel ライブラリや rlwrap などのツールを使用してネイティブ REPL を拡張する方法を詳しく説明しており、カスタムプロンプト、コマンド、リーダーマクロ、ASDF を使用した依存関係管理などをカバーしています。著者は、"オールインワン" のカスタム REPL に頼るのではなく、ネイティブ REPL と実用的なツールを組み合わせて、効率的でパーソナライズされた Lisp 開発環境を構築することを推奨しています。
続きを読む
誰よりも早く最新のアプリを体験したいですか?TestFlightがその答えです!このガイドは、ベータアプリのインストールとテストに関する包括的な手順を提供します。メールまたは公開リンクによる招待、iOS、iPadOS、macOS、tvOS、visionOS、watchOSへのインストール、自動アップデートの管理、以前のビルドとビルドグループのテスト、さらにはiMessageアプリとApp Clipsのテストなど、あらゆる側面を網羅しています。テスト期間と重要な考慮事項についても詳細に説明することで、スムーズなベータテストと開発者への貴重なフィードバックを保証します。
続きを読む
最近の攻撃キャンペーンでは、GitHub Actionsワークフローを標的にしてPyPI公開トークンを盗もうとしました。攻撃者は様々なリポジトリのワークフローを変更し、GitHubシークレットとして保存されているPyPIトークンを外部サーバーに送信しました。一部のトークンは流出しましたが、PyPIでは使用されなかったようです。影響を受けたすべてのトークンは無効化され、影響を受けたプロジェクトのメンテナに通知されました。今後の攻撃を軽減するために、GitHub ActionsのTrusted Publishersを使用することをお勧めします。
続きを読む
EAがバトルフィールド6のPC版オープンベータでセキュアブートを必須としたことが、プレイヤー間で論争を呼んでいます。多くの人がセキュアブートを有効にできなかったり、EAのアンチチートツールにカーネルレベルのアクセスを許可することを拒否したりすることで、プレイできなくなりました。テクニカルディレクターのクリスチャン・ブールは、チート対策として必要な措置だと擁護しましたが、完全にチートをなくすことはできないとも認めています。セキュアブートはアンチチート機能を強化しますが、一部のプレイヤーを除外することにもなります。
続きを読む
新たな研究によると、2020年の国際海事機関による硫黄排出規制により、シンガポール海峡付近の最も交通量の多い航路における落雷が約50%減少したことが明らかになりました。研究者らは、船舶の排出物が雲の中の氷晶の形成と衝突に影響を与え、落雷に影響を与えていると考えています。この予期せぬ実験結果は、人間の活動が雷雨に及ぼす影響がこれまで考えられていたよりも大きいことを示しており、人間の排出物が気候変動に与える影響に関する重要な知見を提供しています。
続きを読む
この記事では、YAMLファイルとPythonスクリプトを使用して最小限のセマンティックレイヤーを構築する方法を示し、2000万件のニューヨーク市タクシーレコードをクエリしてその価値を示しています。セマンティックレイヤーが真に役立つ場合と、過剰な場合を明確にします。従来のデータベースとの違いを示し、データガバナンス、キャッシング、安全なアクセス制御、LLM統合における利点を強調しています。
続きを読む
この記事では、多角形メッシュの辺を計算するための3つの同等のアルゴリズムを紹介します。これは、効率性を向上させながら同じ結果を得るための段階的な最適化ステップを表しています。メッシュトポロジの表現と辺の概念の説明から始まり、3つのアプローチを詳しく説明します。マップベースのアルゴリズム(O(n log n)の複雑さ)、ソートベースのアルゴリズム(O(n log n)の複雑さ)、そして新しいマイナーバレンスアルゴリズム(O(n)の複雑さ)です。著者はそれらのパフォーマンスを比較し、マイナーバレンスアルゴリズムの革新的な性質と、ゲーム開発における潜在的な用途を強調しています。
続きを読む
ClickHouse Cloudの内部ロギングプラットフォームであるLogHouseは、1年で19PBから100PB以上に、行数は40兆行から500兆行に増加しました。イベント量の20倍の急増に対応するため、LogHouseチームは、CPU使用率を以前の10%未満に削減するカスタムエクスポーターであるSysExを開発しました。SysExはClickHouseシステムテーブルから直接データをコピーすることで、OpenTelemetryのパースとマーシャリングのボトルネックを回避します。同時に、LogHouseはClickHouseネイティブのオブザーバビリティUIであるHyperDXを統合し、シームレスな探索、相関関係、根本原因分析を提供します。
続きを読む
OpenAIは来年、AIを活用した求人プラットフォームを立ち上げ、企業や政府機関がAIスキルを持つ候補者とマッチングできるようにすることで、企業や政府機関におけるAI技術の導入を加速させる計画です。また、今後数ヶ月以内に、従業員が職場でAIをより効果的に活用する方法を教える新たな認定プログラムも開始します。このプログラムにはウォルマートなど複数の組織が参加しており、2030年までに1000万人のアメリカ人を認定することを目指しています。
続きを読む