トッププログラマーが生産性を向上させるためのLLMの使い方

2025-07-21

ベテランプログラマーのantirezが、Gemini 2.5 PROやClaude Opusなどの大規模言語モデルを18ヶ月間プログラミングに使用してきた経験を共有しています。彼は、現在のLLMは独立したプロジェクト完了ツールではなく、強力なアシスタントとして最適だと主張しています。問題を明確に記述し、効果的に反復処理することで、LLMはバグの排除、アイデアの迅速な探求、ペアデザインへの参加、さらには専門分野外の技術習得にも役立ちます。しかしantirezは、LLMの潜在能力を最大限に発揮するには、十分なコンテキストを提供し、適切なモデルを選択し、コードを常に制御し、自動化されたエージェントへの依存を避けることが重要であると強調しています。これによってのみ、コードの品質を保証し、効率を最大化できます。

続きを読む
開発

OpenBSDの大規模アップデート:FILEオブジェクト構造体が不透明化

2025-07-21

OpenBSDは最近、標準入出力ライブラリ内のFILEオブジェクトの内部構造を不透明化する大規模なシステムアップデートを行いました。これは、プログラムがFILEオブジェクトの内部構造に直接アクセスできなくなることを意味します。この変更は広範囲に影響し、libcとその依存ライブラリ(libcrypto、libtls、libsslなど)に影響を与えます。移行を容易にするため、いくつかのヘルパーシンボルは一時的に保持されますが、将来的には削除されます。潜在的な問題を回避するために、スナップショットアップグレードを使用することを強く推奨します。

続きを読む
開発

AMD RDNA 4アーキテクチャにおけるWMMAカーネルの最適化

2025-07-21
AMD RDNA 4アーキテクチャにおけるWMMAカーネルの最適化

第3世代マトリックスコアを搭載したAMD RDNA™ 4アーキテクチャGPUは、一般化行列乗算(GEMM)演算のパフォーマンスを大幅に向上させました。この記事では、RDNA 4 GPU上のHIPカーネルでWMMA(Wave Matrix Multiply Accumulate)組込み関数を使用して行列演算を最適化する方法について詳しく説明します。WMMAの機能、`__builtin_amdgcn_wmma_f32_16x16x16_f16_w32_gfx12`などの新しい組込み関数、およびRDNA 3アーキテクチャとの重要な違いについて説明します。簡素化された多層パーセプトロン(MLP)実装例は、RDNA 4での効率的な行列計算を示しています。

続きを読む
ハードウェア

SVGフィルターを使った手描き風「沸騰」効果のシミュレーション

2025-07-21
SVGフィルターを使った手描き風「沸騰」効果のシミュレーション

この記事では、手描きアニメーションでよく見られる「沸騰」効果をSVGフィルターを使ってシミュレートする方法を説明しています。この効果は、画像の端にわずかな歪みを適用することで、微妙な動きを演出します。feTurbulenceとfeDisplacementMapフィルターを使ってノイズテクスチャを生成し、画像に適用する方法、そしてJavaScriptを使ってフィルターパラメータをアニメーション化して「沸騰」効果を作成する方法を詳しく説明しています。インタラクティブなデモでは、パラメータを調整して効果の変化を観察できます。シンプルなSVGフィルターとJavaScriptだけで、Web上でリアルな手描きアニメーション効果をシミュレートすることに成功しています。

続きを読む
開発

新色の解禁:錐体細胞へのレーザー刺激

2025-07-21
新色の解禁:錐体細胞へのレーザー刺激

ある研究では、レーザーパルスを用いて網膜の錐体細胞を選択的に刺激することで、前例のない色を見ることができるという主張がなされました。研究報告書には詳細な被験者の報告が不足していますが、視覚錯覚を利用したアニメーションが同様の効果を生み出しているようです。このアニメーションは、赤い円を用いて赤色感受性錐体細胞を飽和させ、緑色感受性錐体細胞の活動を強調することで、鮮やかな青緑色を生み出します。しかし、錐体細胞のスペクトル重複と画面表示技術の限界のため、この方法が通常のヒトの色彩範囲を超える色を示すかどうかは疑問が残ります。

続きを読む
テクノロジー 錐体細胞

XMLUI:誰でもできるWeb開発

2025-07-21
XMLUI:誰でもできるWeb開発

XMLUIは、Visual Basicのコンポーネントモデルの使いやすさを最新のWeb開発にもたらします。シンプルなXMLマークアップを使用することで、開発者はReactやCSSに関する深い専門知識がなくても、反応性が高く、テーマ設定されたWebアプリを構築できます。事前に構築されたコンポーネントと宣言的なデータバインディングにより、プロセスが簡素化されます。LLMとの統合により、開発がさらに効率化され、共同作成と容易なメンテナンスが可能になります。XMLUIは、ソリューションビルダーを支援し、専門的なフロントエンドの専門知識がなくてもユーザーインターフェースを作成できるようにすることを目指しています。

続きを読む
開発

モデル合金:AIパフォーマンス向上のための秘密兵器

2025-07-21
モデル合金:AIパフォーマンス向上のための秘密兵器

XBOWチームは、「モデル合金」という巧妙な手法を用いて、脆弱性検出エージェントのパフォーマンスを劇的に向上させました。この手法は、異なるLLM(Google GeminiやAnthropic Sonnetなど)の長所を組み合わせ、単一のチャットスレッド内でそれらを交互に使用することで、単一モデルの限界を克服します。実験の結果、この「合金」戦略は成功率を55%以上にまで向上させ、単一モデルを大幅に上回ることが示されました。この技術はサイバーセキュリティの分野に限定されず、膨大な探索空間の中で解決策を見つける必要があるあらゆるAIエージェントタスクに関連しています。

続きを読む

ダイキンエアコンのオープンソースローカル制御

2025-07-21
ダイキンエアコンのオープンソースローカル制御

ダイキンの遅く、クラウドに依存したWi-Fi制御にうんざりしていませんか?このオープンソースプロジェクトが解決策を提供します!Webインターフェース、MQTT、Home Assistant統合を備えたローカル制御モジュールを提供し、クラウド接続を不要にします。PCB設計は公開されており、組み立て済みのモジュールはTindieとAmazon UKで販売されています。このプロジェクトはGPLライセンスを使用しており、フォークと貢献が許可されていますが、プロジェクト名と商標を使用した商業販売は禁止されています。このモジュールはさまざまなダイキンモデルと互換性があり、自動プロトコル検出、リモートモニタリング、ロギングなどの機能を提供します。

続きを読む
ハードウェア ダイキンエアコン

時間ベースのロギングはカウントベースのロギングよりも優れている

2025-07-21

ソフトウェアエンジニアリングにおけるロギング戦略は非常に重要です。この記事では、大量のイベントを処理する場合、時間ベースのロギング(例:X秒ごとにログ出力)が、カウントベースのロギング(例:Xメッセージごとにログ出力)よりも優れていると主張しています。カウントベースのロギングは、負荷によってログ出力頻度が大きく変動し、ログが少なすぎたり多すぎたりする可能性があります。時間ベースのロギングは一定のログ出力速度を維持し、ログが多すぎることによるパフォーマンス低下や、ログが少なすぎることによる可観測性の問題を回避します。著者は疑似コードの例と費用便益分析を用いて主張を裏付け、効率的なロギング戦略に関する新しい視点を与えています。

続きを読む
開発

connmap:世界地図上にネットワーク接続を可視化

2025-07-21
connmap:世界地図上にネットワーク接続を可視化

connmapは、世界地図上に現在のネットワークピアの地理的な位置を表示するX11デスクトップウィジェットです。Waylandでも動作します!インストールは簡単です。リポジトリをクローンし、依存関係(READMEに記載)をインストールして、実行ファイルを実行します。地図のサイズ、位置、更新間隔をカスタマイズできます。現在、IPv4のみをサポートしており、主にi3wmでテストされています。

続きを読む

動的計画法:あなたの思っていることではない

2025-07-21

アルゴリズムの学習において「動的計画法」という用語は、しばしば混乱を招きます。「動的」とは、その変化性を指すのではなく、「計画」というプログラミングの意味を指します。これは、1950年代にエンジニアが建設プロジェクトを「プロセススケジューリング」として計画したことに由来します。コンピュータサイエンスにおいて、動的計画法とは、問題を解決するために必要なサブステップの順序を計画することです。例えば、フィボナッチ数列を計算する場合、「プログラム」とは、依存関係の順序でfib(2)からfib(10)を計算するステップのシーケンスです。これはトップダウンまたはボトムアップで計画できます。最終的な計画は同じであり、どちらも動的計画法と見なされます。リチャード・ベルマンは、国防長官の「数学研究」への嫌悪感を避けるために、この用語を作り出し、「動的」という形容詞は軽蔑的に使えないため、「動的計画法」という語を選んだのです。

続きを読む
開発

中世の王の一日:フランス王シャルル5世

2025-07-21
中世の王の一日:フランス王シャルル5世

クリスティン・ド・ピザン著『Livre des faits et bonnes mœurs du sage roy Charles V』は、フランス王シャルル5世(1364~1380年)の日常生活を垣間見せてくれる魅力的な作品です。朝の祈りや民衆の嘆願の聞き入れから、評議会への出席、質素な食事、午後の謁見まで、綿密に構成された一日が詳細に記されています。シャルル5世の日課は、王室の義務と洗練された余暇のバランスを示しており、公の場に現れることで、公正で親しみやすい君主のイメージを戦略的に演出していました。

続きを読む

Toniebox をハックする:プライバシーに関する懸念とコミュニティによる解決策

2025-07-21

この記事では、NFCタグを使用してオーディオを再生する子供向けおもちゃである Toniebox のリバースエンジニアリングに関する著者の経験について詳しく説明しています。子供にとって楽しい一方で、このおもちゃはクラウドサービスに依存し、大量のユーザーデータを収集します。著者はオーディオファイルをバックアップするために SD カードを抽出し、メタデータとオーディオファイルの処理のために teddyBench などのコミュニティツールを強調しています。この記事では、プライバシーに関する懸念と、カスタムファームウェア、中間者攻撃、ハードウェアの修正など、機能の向上やプライバシーの保護を目的としたコミュニティ主導の修正について説明しています。著者は、おもちゃの魅力を評価しながら、プライバシーリスクも認めて、複雑な感情で締めくくっています。

続きを読む
その他

サムスン、次世代ペルチェ冷却技術でブレークスルー

2025-07-21
サムスン、次世代ペルチェ冷却技術でブレークスルー

サムスン電子は、ジョンズ・ホプキンス大学応用物理学研究所(APL)と共同で、次世代ペルチェ冷却技術に関する論文を権威ある科学誌Nature Communicationsに発表しました。ナノエンジニアリング技術を用いた高効率薄膜半導体ペルチェデバイスを開発し、冷媒を使用しない冷却を実証しました。この技術は既にサムスンのBespoke AIハイブリッド冷蔵庫に搭載されており、将来的には冷媒を使用しない冷蔵庫の実現を目指しています。

続きを読む
ハードウェア ペルチェ冷却

AIエージェント:2025年の過剰な期待と現実

2025-07-20
AIエージェント:2025年の過剰な期待と現実

2025年がAIエージェントの年と言われる中、実運用環境でAIシステムを構築してきたベテラン開発者は異議を唱える。1年以上にわたり12以上のAIエージェントシステムを構築した経験から、3つの重要な現実が指摘されている。それは、複数ステップのワークフローにおける指数関数的なエラー率の増加、コンテキストウィンドウによる2乗的なコスト増加、そしてエージェントが効果的に使用できるツールとフィードバックシステムの設計という本当の課題だ。成功したAIエージェントシステムは完全に自律的ではなく、AIと人間の管理、伝統的なソフトウェアエンジニアリングを組み合わせ、明確な境界内で動作し、検証可能な操作とロールバックメカニズムを持つと主張する。将来は、複雑なタスクにAIを活用しつつ、人間の制御を維持する、制約のあるドメイン固有のツールを構築するチームが成功すると予測する。「完全自律」ではなく「明確な境界を持つ、非常に有能なアシスタント」へと焦点が移るだろう。

続きを読む

RRRA:オンライン講演会とウェブサイト更新

2025-07-20

ローマ街道調査協会(RRRA)は、2024/25シーズンのオンライン講演会シリーズを発表しました。講演会はスコットランド、イングランド、ウェールズのローマ街道考古学の様々な側面を扱います。新しいウェブサイトも開発中で、現代的なデザインと向上した機能性を約束しています。

続きを読む
その他

GitHubにおけるコード提案適用制限

2025-07-20
GitHubにおけるコード提案適用制限

GitHubでコード提案を一括適用する際には、いくつかの制限があります。提案にはコードの変更が必要で、クローズ済みのプルリクエスト、変更の一部、1行に複数の提案がある場合、既に適用済みまたは解決済みの提案、保留中のレビュー、複数行のコメント、マージ待ちのプルリクエストには適用できません。さらに、一時的に提案を適用できない場合もあります。

続きを読む
開発

安価なものの時代:品質低下か、それとも過剰な期待か?

2025-07-20
安価なものの時代:品質低下か、それとも過剰な期待か?

私たちの社会は、ファストファッションから寿命の短い家電製品まで、安価で使い捨ての製品であふれており、製品の品質低下への懸念が高まっています。この記事では、その根本原因を探り、企業の利益最大化だけでなく、変化する消費者の価値観、社会経済的な不平等、そして技術進歩のマイナス面も関係していると主張しています。ファストファッションの台頭は、耐久性よりも新しさを優先し、自動化とAIは効率性を高める一方で、サービスの質と情報の信頼性を低下させています。この記事は、消費パターンを批判的に検討し、より持続可能で責任ある選択へと転換することを促す結論で締めくくられています。

続きを読む
その他

量子飛躍:単一チップへの光子量子システムのモノリシック統合

2025-07-20
量子飛躍:単一チップへの光子量子システムのモノリシック統合

ノースウェスタン大学、ボストン大学、カリフォルニア大学バークレー校の科学者たちは、画期的な成果を達成しました。従来の電子チップ上に小型の光子量子システムを統合することに成功したのです。この1平方ミリメートルのチップは、量子光を生成し、その光を安定させるためのスマートな電子システムを内蔵しており、光ベースの量子通信、センシング、処理に必要な光子対を信頼性高く生成します。商業用半導体ファウンドリで製造されたこのチップは、拡張性の可能性を示しており、より大規模な量子光子システムへの重要な一歩であり、コンピューティング、センシング、通信のアプリケーションへの扉を開きます。

続きを読む
テクノロジー フォトニクス チップ統合

GitHubコード提案適用制限:単一コミットの制約

2025-07-20
GitHubコード提案適用制限:単一コミットの制約

GitHubでのコード提案の一括適用には、いくつかの制限があります。コードの変更がない場合、プルリクエストが閉じている場合、変更の一部を表示している場合、1行に複数の提案がある場合、削除された行、提案が適用済みまたは解決済みとしてマークされている場合、保留中のレビューからの場合、複数行のコメント、またはプルリクエストがマージ待ち行列にある場合は、提案を適用できません。さらに、不明な理由で「この操作は現在実行できません。」というエラーが発生する場合があります。

続きを読む
開発

ドーシー、分散型ソーシャルメディアに1000万ドル投資

2025-07-20
ドーシー、分散型ソーシャルメディアに1000万ドル投資

Twitterの共同創設者でありBlockのCEOであるジャック・ドーシーは、「andOtherStuff」という団体に1000万ドルを投資し、オープンソースプロジェクトを通じてソーシャルメディアに革命を起こそうとしています。ドーシーと元Twitter社員からなるこのチームは、Nostrなどの分散型プロトコルに焦点を当て、Shakespeare(Nostrベースのアプリ構築プラットフォーム)、heynow(音声メモアプリ)などのアプリを開発しています。ドーシーは、従来のソーシャルメディアの広告主への依存を批判し、よりオープンで分散型のモデルを提唱しています。彼は元Twitter社員のエバン・ヘンショー=プラットと共に、ソーシャルメディアの未来について議論するポッドキャスト「revolution.social」を立ち上げ、Nostrの可能性と中央集権型プラットフォームの危険性を強調しています。

続きを読む
テクノロジー

Agoraプロトコル:安全で匿名の全国的な協議

2025-07-20

この論文は、権威主義政権によって生み出された社会的分裂の問題に対する技術的解決策として、Agoraプロトコルを提案しています。Telegramを活用することで、安全で匿名性の高い、複数段階の協議プロセスが確立され、国民が国家的な問題について議論し、投票することができます。実力主義的なフィルタリングシステムにより、最も共感を呼ぶアイデアが浮上し、透明性のある全国的なコンセンサスが導き出されます。これは、1億人の意見を6週間で100人のコアグループに絞り込むことができるほど、非常に効率的です。

続きを読む

2025年の大規模言語モデルアーキテクチャの進化:DeepSeek、OLMo、Gemma、Mistral、Qwenの深堀り

2025-07-20
2025年の大規模言語モデルアーキテクチャの進化:DeepSeek、OLMo、Gemma、Mistral、Qwenの深堀り

この記事では、2025年の大規模言語モデル(LLM)のアーキテクチャの進歩をレビューし、DeepSeek、OLMo、Gemma、Mistral、Qwenなどのオープンソースモデルに焦点を当てています。DeepSeek V3/R1は、マルチヘッド潜在的アテンション(MLA)と混合専門家(MoE)を用いて計算効率を向上させます。OLMo 2は、RMSNormの配置に重点を置き、Post-NormとQK-Normを使用しています。Gemma 3は、スライディングウィンドウアテンションを使用してメモリ要件を削減します。Mistral Small 3.1は、パフォーマンスと速度のバランスを取っています。Qwen 3は、柔軟性のために密なモデルとMoEの両方のバリアントを提供します。SmolLM3は、30億パラメータのサイズとNoPE(位置エンコーディングなし)で際立っています。最後に、Kimi 2は、1兆パラメータ規模とMuonオプティマイザで印象的です。これらのモデルは、アテンションメカニズム、正規化、MoE、オプティマイザにおけるイノベーションを示しており、LLMアーキテクチャの多様性と継続的な進化を示しています。

続きを読む

Androidスマートフォンを活用した世界規模の地震早期警報システム

2025-07-20
Androidスマートフォンを活用した世界規模の地震早期警報システム

新しい研究は、世界中の何百万ものAndroidスマートフォンの加速度センサーを使用して構築された、世界規模の地震早期警報システムの有効性を示しています。Android Earthquake Alerts (AEA)と呼ばれるこのシステムは、精度において従来の地震ネットワークに匹敵し、世界中の地震を検知し、ユーザーにタイムリーな警告を提供します。従来のインフラがない地域でも、AEAは数百万人に重要な早期警戒を提供し、地震による被害を軽減する可能性があります。地震波の速度差を利用することで、AEAは破壊的な波が到着する前に警告を発し、人々に対応するための貴重な時間を与えます。

続きを読む
テクノロジー 地震早期警報

CLJ-AGI:新しいAGIベンチマーク

2025-07-20

CLJ-AGIは、人工汎用知能(AGI)のための新しいベンチマークを提案します。このベンチマークは、AIがClojureプログラミング言語を、トランスデューサ優先設計、オプションの遅延評価、遍在するプロトコル、第一級のCRDTデータ構造などの機能で拡張することを課題としています。既存のClojureコードとの後方互換性を維持しながらこれらの拡張を実現することが成功であり、多大な報酬が与えられ、真のAGIへの重要な一歩となります。

続きを読む
AI

Arch LinuxからmacOSへ:博士課程学生による「怠惰な」設定

2025-07-20

神経AI研究の博士課程学生であり、コンピュータエンジニアでもある著者は、9年間Arch Linuxを使用してきた後、新しいMacBook Proに移行しました。この記事では、彼らが1日で新しいマシンを設定し、以前のワークフローを可能な限り再現する方法を詳しく説明しています。彼らはパッケージマネージャーとしてNix、ウィンドウマネージャーとしてAeroSpace、ランチャーとしてRaycastを使用し、zshシェルやZedエディターなどの使い慣れたツールを維持しました。macOSのパッケージ管理はArch Linuxほど便利ではありませんが、より安定したハードウェアと優れたユーザーエクスペリエンスのために妥協しました。

続きを読む

アメリカ民主主義:データが示す危機と希望

2025-07-20
アメリカ民主主義:データが示す危機と希望

この記事はデータを用いてアメリカ民主主義の現状を分析しています。データは、少数の富裕層への政治資金の集中、司法制度の分断、政治勢力による政府機関の変容、特に民主党支持者における低投票率などを示しています。しかし、データは希望も示しています。数百万人の潜在的な民主党支持者が投票に参加しておらず、歴史は市民運動による権威主義への抵抗の成功を示しており、指導者の説明責任は健全な民主主義において一般的です。この記事は、イデオロギー的な穏健化だけでなく、有権者の動員に焦点を当てることを提唱し、市民参加の重要性を強調しています。

続きを読む

Ringの監視優先アプローチへの回帰がプライバシー懸念を引き起こす

2025-07-20
Ringの監視優先アプローチへの回帰がプライバシー懸念を引き起こす

Ringの創設者であるJamie Siminoff氏が経営の座に戻り、同社の物議を醸す「監視第一、プライバシー第二」のアプローチが復活しました。これには、警察がユーザーの映像に直接アクセスできるようにする機能の復活と、自宅のセキュリティ機器へのライブストリーミングアクセスを許可する新機能の導入が含まれます。これは、警察が令状や同意なしにRingの映像を使って抗議者を監視した過去の事例を考えると、深刻なプライバシー懸念を引き起こします。Ringが「AIファースト」企業への転換を宣言していることは、すでに問題のあるデバイスにビデオ分析や顔認識が統合される可能性を示唆しています。批評家たちは、これが市民の自由に対する深刻な脅威であり、中絶や移民の取り締まりなどの理由で個人を追跡することを容易にする可能性があると主張しています。

続きを読む
テクノロジー

ローカルLLM対オフラインWikipedia:サイズ比較

2025-07-20

MIT Technology Reviewの記事が、終末シナリオにおけるオフラインLLMの使用に関する議論を引き起こしました。これにより、著者はローカルLLMとオフラインWikipediaダウンロードのサイズを比較しました。その結果、小型のローカルLLM(Llama 3.2 3Bなど)のサイズは、厳選された5万件のWikipedia記事とほぼ同等であることが示されました。一方、完全版Wikipediaは、最大のLLMよりもはるかに大きくなっています。目的は異なりますが、この比較は、ローカルLLMとオフライン知識ベース間のストレージ容量における興味深い対比を示しています。

続きを読む
AI

io_uringとデュアルWALによるデータベーススループット10倍向上

2025-07-20
io_uringとデュアルWALによるデータベーススループット10倍向上

複雑なデータベースを構築する際に、著者はio_uringとデュアルWAL設計を用いてパフォーマンスの向上を試みました。従来のWALアプローチ(書き込み後に適用)はパフォーマンスのボトルネックとなります。"書き込みの意図"と"書き込みの完了"を2つのWALに分離し、io_uringの非同期I/Oを活用することで、スループットを10倍向上させました。この設計では、意図を非同期的に書き込み、完了後に完了レコードを書き込みます。復旧時には、意図と完了の両方のレコードを持つ操作のみが適用され、データの一貫性が保証されます。著者はZig言語とPoroプロジェクト(実験的なキーバリューデータベース)を用いてこの手法の有効性を検証し、ハードウェア並列処理、バッチ処理、柔軟な一貫性モデルの重要性を強調しました。

続きを読む
開発
1 2 103 104 105 107 109 110 111 595 596