OpenAIが認める:最先端のAIモデルでも人間のプログラマーの代わりにはならない

2025-02-24
OpenAIが認める:最先端のAIモデルでも人間のプログラマーの代わりにはならない

OpenAIの新しい論文によると、GPT-4やClaude 3.5などの最先端の大規模言語モデル(LLM)でも、ソフトウェアエンジニアリングタスクの大部分をこなすことができないことが明らかになりました。研究者たちは、Upworkから1400以上のソフトウェアエンジニアリングタスクを集めた新しいベンチマークSWE-Lancerを使用しました。その結果、これらのモデルは表面的な問題しか解決できず、大規模プロジェクトのバグや根本原因を発見することはできなかったことがわかりました。LLMは高速ですが、正確性と信頼性が人間のプログラマーに取って代わるには不十分であり、OpenAIのCEOであるSam Altman氏の予測とは矛盾しています。

続きを読む
開発

PowerSchoolの大規模なデータ漏洩:6000万人の生徒と教師の情報が流出

2025-01-10
PowerSchoolの大規模なデータ漏洩:6000万人の生徒と教師の情報が流出

教育ソフトウェア大手PowerSchoolが深刻なデータ漏洩に見舞われ、6000万人以上の小中高生と教師の個人情報が盗まれた。社会保障番号や医療情報など機密データを含む23個のデータベーステーブルが侵害されたとされる。攻撃は、不正アクセスされた認証情報を利用したネットワーク侵入によるもので、ランサムウェアやソフトウェアのバグとは無関係だとPowerSchoolは説明している。PowerSchoolはパスワードのリセットやアクセス制御の強化などの対策を実施し、影響を受けた成人には信用監視サービスを提供しているが、サイバーセキュリティ企業Cybleは、この侵害が2011年から始まっていた可能性を示唆している。この事件は、教育機関におけるデータセキュリティの脆弱性と、迅速な報告と対応の重要性を浮き彫りにしている。

続きを読む
テクノロジー

Thunderbolt 4/5 ドック:SSD 性能への影響

2024-12-25
Thunderbolt 4/5 ドック:SSD 性能への影響

この記事では、Thunderbolt 4 および Thunderbolt 5 ドックが、さまざまな SSD(Thunderbolt 3 と USB4)の性能に与える影響をテストします。結果は、Intel Mac で TB5 ドックを使用すると、USB4 SSD の速度がほぼ 2 倍になり、20Gb/s に達することが示されました。これは前例のないことです。ただし、TB3 SSD の読み取り速度は TB5 ドックでは低下しました。TB4 ハブは USB4 SSD の速度を制限し、TB3 SSD の書き込み速度を低下させました。テストは、Mac、ドック、SSD の組み合わせによって、予測不可能なパフォーマンスのばらつきが生じることを示しており、慎重なテストが必要であることを強調しています。

続きを読む
ハードウェア パフォーマンステスト

LLVMのスケジューリングモデルにおける逆スループットの計算

2025-03-30

この記事では、LLVMの命令スケジューリングモデルにおける逆スループットの計算について詳しく説明します。LLVMのスケジューリングモデルは、命令を3つの主要なプロパティで記述します。レイテンシ、使用されるハードウェアリソース、および各リソースが保持するサイクル数です。従来のアプローチでは、最大解放サイクルを使用して逆スループットを計算しますが、非ゼロ取得サイクルが存在する場合、これは失敗します。リソースセグメントと命令スケジューリングプロセスを分析することにより、著者は新しい方法を導き出しました。すべてのハードウェアリソースの中で最も長いセグメントの長さを逆スループットとして使用することです。これは、リソースセグメントを扱う際の従来の方法の欠点を解消し、LLVMコンパイラの性能最適化のためのより正確な基盤を提供します。

続きを読む

Typst vs. TeX: レイアウトモデルの比較と将来展望

2025-02-14

この記事では、組版エンジンTypstとTeXのレイアウトモデルの違いを探ります。ボックスとグルーに基づくTeXは柔軟性がありますが、正確な位置を認識できません。Typstは領域モデルを使用し、要素が自身の位置に反応することを可能にしますが、柔軟性を犠牲にします。著者は両モデルの長所と短所を分析し、Typstは再レイアウトメカニズムを導入することで、柔軟性と最適化のバランスを取り、複雑なレイアウト(回り込み画像やページを跨ぐ表など)の処理における現在の欠点を解消できると指摘しています。

続きを読む

BYDの無料自動運転技術がEV業界を揺るがす

2025-02-12
BYDの無料自動運転技術がEV業界を揺るがす

中国最大の自動車メーカーであるBYDは、最安モデルを含む全車種に最先端の「ゴッドアイ」先進運転支援システム(ADAS)を無料で提供することで、電気自動車市場に衝撃を与えました。この動きにより、自動運転技術が民主化され、価格競争が激化し、テスラなどの競合他社に大きな影響を与える可能性があります。BYDは、特に中国市場で競合他社を価格で下回り、ヨーロッパ市場での販売にも影響を与える可能性があります。発表後、テスラの株価は下落し、BYDの株価は上昇しました。

続きを読む
テクノロジー

CTOからインディーハッカーへ:コーディングで受動的収入を得る私の道のり

2025-01-14
CTOからインディーハッカーへ:コーディングで受動的収入を得る私の道のり

150人の従業員を抱えるソフトウェア会社の元CTOが、オンラインでソフトウェア製品を販売することで受動的収入を得るフルタイムのインディーハッカーへの転身を共有しています。小さな席次表アプリから始まり、徐々に収益を生むソフトウェア製品のポートフォリオを構築し、最終的に経済的自由と時間的自由を実現しました。この記事では、時間を見つけること、プロジェクトの選択、MVPの構築からマーケティングとプロモーションに至るまでの経験を詳細に説明し、継続的な反復、期待値の管理、そして回復力の重要性を強調し、開発者がコーディングスキルを受動的収入源に変えることを奨励しています。

続きを読む

28.7億人のTwitterユーザーデータ流出:史上最大のソーシャルメディアデータ侵害か?

2025-03-29
28.7億人のTwitterユーザーデータ流出:史上最大のソーシャルメディアデータ侵害か?

Breach Forumsで、驚愕の28.7億人のTwitter(現X)ユーザーのデータ流出が報告されました。この流出は、最近の解雇中にデータを盗んだ不満を持つ元従業員によるものとされています。これは史上最大のソーシャルメディアデータ侵害となる可能性がありますが、Xは公式にこの事件を認めていません。流出したデータには、ユーザーID、ユーザー名、プロフィール情報、フォロワー数などが含まれますが、注目すべきはメールアドレスが含まれていないことです。流出元と犯人の身元は不明であり、ユーザーのプライバシーとデータセキュリティに対する大きな懸念を引き起こしています。

続きを読む
テクノロジー

OpenAIの高価格なo1-pro:強力な推論AIだが、そのコストに見合う価値はあるのか?

2025-03-20
OpenAIの高価格なo1-pro:強力な推論AIだが、そのコストに見合う価値はあるのか?

OpenAIは、開発者向けAPIを通じて、より強力な推論AIモデルであるo1-proをリリースしました。高い計算能力により、優れたパフォーマンスと信頼性の高いレスポンスを誇っていますが、o1-proは非常に高価です。入力トークン100万個あたり150ドル、出力トークン100万個あたり600ドルという価格で、GPT-4.5の入力コストの2倍、通常のo1の10倍にもなります。しかし、初期テストでは、数独パズルや錯視ジョークなどでの苦戦が明らかになり、結果はまちまちでした。内部ベンチマークでは、コーディングや数学の問題に対するパフォーマンスはo1よりわずかに優れているものの、信頼性が向上していることが示されました。OpenAIの賭けは、この向上した信頼性が、開発者にとっての高額なコストを正当化できるかどうかです。

続きを読む
AI

yknotify:macOS用YubiKeyタッチプロンプター

2025-02-12
yknotify:macOS用YubiKeyタッチプロンプター

yknotifyは、macOSのコマンドラインツールで、YubiKeyがタッチを待っていることに関連するイベントについてシステムログを監視し、ユーザーにプロンプトを表示します。FIDO2とOpenPGPをサポートし、タッチが必要かどうかを判断するために特定のログメッセージを識別します。まれな誤検知はありますが、未検知は報告されていません。ユーザーはインストールして実行できます。問題が発生した場合は、問題を報告してください。

続きを読む
開発

中世イタリアの塔:派閥抗争と都市計画の遺産

2025-03-25

イタリアの風景には、中世の塔の残骸が点在し、騒々しい過去を物語っています。裕福な家々が小さな要塞やステータスシンボルとして建てたこれらの構造物は、時にはライバルの家を焼き払うという破壊的な戦術につながりました。その結果生じた混乱と火災の危険に苦しんだフィレンツェは、高さ制限を導入し、独特な石の切り株を遺産として残しました。現在では都市景観のユニークな一部となっているこれらの切り詰められた塔は、中世の家族抗争と都市発展の歴史をささやいています。

続きを読む

ブロガーが2004年MITスパム会議の講演イントロ動画を公開

2024-12-13

ブロガーのJohn Graham-Cumming氏が、自身のブログで2004年のMITスパム会議における講演のイントロ動画を公開しました。この動画は「All your base are belong to us」というミームを巧みに利用し、スパムと機械学習について語り、Paul Graham氏へのオマージュも含まれています。初期の機械学習がアンチスパムに応用された様子と、ブロガーのクリエイティブでユーモラスな技術コミュニケーションが示されています。

続きを読む

2024年ソフトウェアエンジニアリング講演会トップ100

2025-02-12
2024年ソフトウェアエンジニアリング講演会トップ100

このリストは、2024年に世界中のほぼすべての主要なソフトウェアエンジニアリングカンファレンスで最も視聴された100件の講演をまとめたものです。トピックは、大規模言語モデルの実用的なアプリケーションや、RustとJavaの高性能技術から、最新のWeb開発や信頼性エンジニアリングのベストプラクティスまで多岐に渡ります。注目すべき講演には、Jodie BurchellによるLLMに関する洞察に富んだ講演や、Martin ThwaitesによるOpenTelemetryの説明があり、どちらも13万回以上の視聴数を記録しています。この厳選されたリストは、知識とスキルを向上させたいソフトウェアエンジニアにとって貴重なリソースとなります。

続きを読む

アラバマ大学工学者が革新的なプラスチックリサイクルプロセスを開発

2025-01-05
アラバマ大学工学者が革新的なプラスチックリサイクルプロセスを開発

アラバマ大学のJason Bara教授と彼のチームは、イミダゾールを用いた革新的なプラスチックリサイクルプロセスを開発しました。この方法は、ポリエチレンテレフタレート(PET)とポリウレタンを効果的に分解し、従来の化学的リサイクル方法の限界を克服します。イミダゾールは、追加の溶媒や触媒を必要とせず、費用対効果が高く、貴重な化学中間体を生成します。この技術は、包装材、自動車シートなど、リサイクルが難しいポリウレタンフォームなど、プラスチックのリサイクル率を大幅に向上させる可能性があり、環境持続可能性に大きく貢献します。

続きを読む
テクノロジー 化学分解 イミダゾール

トヨタのウーブンシティ:未来都市の実験

2025-01-06
トヨタのウーブンシティ:未来都市の実験

トヨタ自動車が100億ドルを投じて建設した未来都市「ウーブンシティ」が完成間近です。今夏から、トヨタ社員100人が最初の住民となり、自動運転車、スマートホーム技術、その他の革新的プロジェクトをテストします。Bjarke Ingelsが設計したこの都市は、最終的には2000人の住民を収容し、トヨタの水素燃料電池技術によって電力供給されます。革新的である一方、GoogleのSidewalk Labsプロジェクトと同様に、技術革新と住民のプライバシーのバランスを取る必要があります。最初の住民「ウィーバーズ」は、未来的なカフェ体験、高性能車椅子、ペットロボットなど、新しいコンセプトの開発とテストに貢献します。

続きを読む

低予算で自作する個人向けAIワークステーション:ハードウェアの冒険

2025-02-11
低予算で自作する個人向けAIワークステーション:ハードウェアの冒険

高価なクラウドAIサービスと潜在的な検閲にうんざりした著者、経済的な個人向けAIコンピューターを自作することに挑戦しました。この記事では、中古のHP Z440ワークステーション、2枚の中古Nvidia Tesla P40 GPU(合計48GBのVRAM)、その他必要な部品を使って、約1700ユーロでシステムを構築した過程を詳細に説明しています。GPUの冷却や電源の互換性など、多くの課題がありましたが、著者はそれらを一つずつ解決し、詳細な手順を共有しています。最終的なベンチマークテストでは、中規模のLLMをスムーズに実行できることが証明され、AIモデルの完全な制御を実現しました。

続きを読む
ハードウェア プライベートクラウド

簡単なスウェーデン語でEpubを読む

2025-03-07

Ereader Easy Swedishを使用すると、任意のepub書籍をアップロードして、簡略化されたスウェーデン語で読むことができます。スウェーデン語を学習中の方や、お気に入りの書籍がスウェーデン語で入手できない方に最適です。この無料ツールは、より大規模なスウェーデン語独習プロジェクトの一部であり、最近、書籍カバーの背景の修正、原文表示機能の追加、そして重要なことに、原文の一部をスキップしていた翻訳のバグ修正などのアップデートが行われました。

続きを読む

DeepSeek:ChatGPTに挑む、コストパフォーマンスに優れたオープンソースLLM

2025-02-08
DeepSeek:ChatGPTに挑む、コストパフォーマンスに優れたオープンソースLLM

中国のAI研究会社が開発したオープンソースの大規模言語モデル(LLM)DeepSeekは、独自の専門家混合(MoE)アーキテクチャにより、ChatGPTに性能とコストの両面で挑戦しています。必要なパラメータのみを活性化することで高速化と低コスト化を実現し、マルチヘッドアテンションとマルチトークンプレディクションにより、長文会話や複雑な推論において優れた性能を発揮します。データソースに関する懸念はありますが、DeepSeekのコストパフォーマンスと直接的な出力スタイルは、ChatGPTにとって強力な代替案となっています。

続きを読む
AI

TruffleRuby正規表現:C言語とSIMDより200倍高速

2025-03-18
TruffleRuby正規表現:C言語とSIMDより200倍高速

このブログ記事では、RubyにおけるJSON文字列エスケープのパフォーマンス最適化について考察しています。ベンチマークでは、3つのアプローチを比較しています。純粋なRubyバージョン、SIMD命令を使ったC拡張、そしてTruffleRuby上の純粋なRubyバージョンです。驚くべきことに、TruffleRubyの純粋なRubyバージョンは、高度なJITコンパイラとTRegexエンジンを活用することで、C拡張とSIMDよりも20倍高速であり、場合によっては基準となるCコードよりも200倍以上高速です。これは、TruffleRubyのTRegexエンジンが正規表現を決定性有限オートマトンにコンパイルし、バックトラッキングを回避し、SIMD命令を使用して最適化を行うためです。`Time.new(String)`と`StringScanner#scan_integer`についても同様の比較が行われており、TruffleRubyの正規表現実装はCRubyのC実装を大幅に上回っています。これは、高度なJITコンパイラと組み合わせた簡潔な純粋なRubyコードが、低レベル言語のパフォーマンスを上回ることがあることを示しています。

続きを読む
開発

大規模言語モデルでBaba Is Youをプレイする:AIゲームにおける挑戦

2025-07-05

この記事では、Baba Is Youというゲームと大規模言語モデル(LLM)を組み合わせた実験について説明しています。Baba Is Youは、プレイヤーがルール自体を操作して勝利を目指すユニークなパズルゲームです。著者は、ClaudeなどのLLMを使用してゲームを制御し、ゲームの状態情報を活用してLLMの意思決定を支援しようと試みました。結果、現在のLLMは複雑なレベルを解くことに大きな困難を抱えていることが示されましたが、このプロジェクトは、LLMのゲーム分野における応用を探求するための新しいアプローチを提供しています。

続きを読む
ゲーム

Raspberry Pi RP2350チャレンジ突破:グリッチ攻撃でセキュリティを回避

2025-01-05
Raspberry Pi RP2350チャレンジ突破:グリッチ攻撃でセキュリティを回避

エンジニアのAedan Cullen氏は、2万ドルの賞金が懸けられたRaspberry PiとHextree RP2350ハッキングチャレンジに勝利した可能性があります。彼はRP2350チップの53番ピンに電圧注入グリッチ攻撃を行い、Secure Boot、TrustZone、グリッチ検出器などの複数のセキュリティ機能を回避し、ワンタイムプログラマブル(OTP)メモリに保存されている秘密を読み取ることに成功しました。Cullen氏の攻撃は、通常無効になっているRISC-Vコアとそのデバッグアクセスポートを有効にする脆弱性を突いたものです。これは、いわゆる「永久的に無効化」されたセキュリティ機能でも、完璧ではないことを示しており、ハードウェアセキュリティ設計の複雑さと課題を浮き彫りにしています。

続きを読む
テクノロジー

エドワード・ゴリーとの書簡:奇妙な友情

2025-03-01
エドワード・ゴリーとの書簡:奇妙な友情

この記事は、著者とイラストレーターのエドワード・ゴリーとのユニークな書簡のやり取りについて語っています。ゴリーの独特なスタイルへの子供時代の魅了から、変わり者であるアーティストとの大人になってからの交流まで、作者は文学、芸術、そしてマカブルな世界への共通の関心を共有しています。彼らの手紙は、風変わりな観察で満たされており、殺人ミステリーから奇妙なレシピ、ロンドンの安価な書店からゾンビの行動まで、ゴリーの独特な文体と細部への綿密な注意を表しています。この記事は、ゴリーの手紙の不可解な消失と、ゴリーがデザインした表紙が現在も大切にされているという著者の記述で締めくくられ、人生における予測できないつながりについて考察しています。

続きを読む
その他 書簡

USDA監察官、解雇拒否でオフィスから警備員に付き添われて退去

2025-02-01
USDA監察官、解雇拒否でオフィスから警備員に付き添われて退去

アメリカ農務省(USDA)の監察官、フィリス・フォンは、トランプ政権による解雇を拒否したため、今週、警備員に付き添われてオフィスから退去させられました。22年間USDAに勤務したフォンは、政権が適切な手順に従わなかったと主張し、解雇通知が無効であると判断した委員会の意見を引用しました。ホワイトハウスは、解雇は「不正で党派的な官僚」を排除するために必要だったと主張して、解雇を擁護しました。フォンは、Neuralinkの調査や動物虐待事件など、幅広い責任を監督していました。彼女の解雇は、連邦政府の監視機関の大規模な粛清の一部であり、政治的な動機による行為として批判されています。

続きを読む

GNU Make標準ライブラリ:Makefileのための強力な関数ライブラリ

2025-02-05

GNU Make標準ライブラリ(GMSL)は、ネイティブのGNU Make機能を使用して実装された関数のコレクションです。リストと文字列操作、整数演算、連想配列、スタック、デバッグ機能を提供します。BSDライセンスでリリースされており、テストスイートが含まれています。論理演算子、リスト/文字列操作、集合演算、整数演算、連想配列、名前付きスタック、関数メモ化、デバッグツールなどの機能を提供し、複雑なMakefileの作成を簡素化します。

続きを読む

SWE-bench:大規模言語モデルは現実世界のGitHubの問題を解決できるか?

2025-01-08
SWE-bench:大規模言語モデルは現実世界のGitHubの問題を解決できるか?

SWE-benchは、大規模言語モデルが現実世界のGitHubの問題を自動的に解決できる能力を評価するためのベンチマークデータセットです。研究者たちは、12の人気のあるPythonリポジトリから2294のIssue-Pull Requestペアを収集し、ユニットテストを使用してソリューションを検証しました。最新のリーダーボードは、さまざまなモデルが異なる成功率を達成していることを示しており、解決率が50%を超えるモデルもあります。このプロジェクトは、軽量版データセットや事前学習済みモデルなど、評価と再現性を容易にするためのリソースを提供しています。

続きを読む

オーストラリア人エンジニアによる米国企業での勤務体験:時差、文化、安定性

2025-01-12

オーストラリア人エンジニアが、米国テクノロジー企業で10年間勤務した経験を共有しています。時差のある共同作業の課題について説明しています。朝は夜間に完了した仕事に追いつくのに費やし、午後は貴重な集中作業の時間が得られます。孤独感も課題となる可能性がありますが、優れたチームワークとドキュメント文化によって軽減されます。また、海外から米国企業で働くことの固有の不安定性にも言及しており、より大規模な事業、より良い報酬、より高いブランド認知度を主な動機として強調しています。最後に、オーストラリアと米国の文化の違いについて議論しており、米国人はより熱心で、オーストラリア人はより控えめであるため、米国の職場文化に適応する必要があると述べています。

続きを読む

マスク氏、ISSの軌道離脱を要求:科学、外交、将来の宇宙探査に関する議論

2025-02-23
マスク氏、ISSの軌道離脱を要求:科学、外交、将来の宇宙探査に関する議論

イーロン・マスク氏は先日、国際宇宙ステーション(ISS)の軌道離脱をできるだけ早く行うよう求めた。この動きは物議を醸しており、ステーションは科学研究、技術開発、STEM教育、国際外交にとって非常に重要であるためだ。専門家は、ISSの微小重力環境により、地球上では不可能な実験、例えば微小重力が人体に及ぼす長期的な影響の研究や、新薬や新素材の開発などが可能になると指摘する。さらに、ISSは国際協力を促進し、冷戦後の宇宙における国際協力の象徴となっている。マスク氏はISSの有用性が低下していると主張する一方、早すぎる軌道離脱は重要な研究やイノベーションを中断し、将来の月面や火星ミッションに悪影響を与えるだろう。

続きを読む
テクノロジー

逆コンパイル研究の復活:2024年を振り返る

2025-01-30
逆コンパイル研究の復活:2024年を振り返る

2024年は、逆コンパイル研究の顕著な復活の年でした。その年に発表された学術論文は、この分野における過去最高のトップレベル論文の約30%を占めています。この記事では、2024年の逆コンパイル研究における学術的およびイデオロギー的な進歩をまとめます。学術論文の急増があり、そのうち4本は「優れた」逆コンパイルの定義に焦点を当て、4本はシンボル予測やコードの簡素化など、AIの役割を探求しました。ほとんどすべての論文にはオープンソースの実装が含まれており、業界での採用を促進しました。この年は、逆コンパイルのパイオニアであるクリスティナ・シフエンテス博士による講演ツアーと、Recon 2024での著名な専門家パネルも開催され、この分野をさらに前進させました。

続きを読む

Mistral Saba:中東・南アジア向けの軽量AIモデル

2025-02-17
Mistral Saba:中東・南アジア向けの軽量AIモデル

Mistral AIは、中東・南アジアの言語(アラビア語や多くのインド言語、特に南インドの言語)向けに特化してトレーニングされた、240億パラメーターのAIモデル「Mistral Saba」を発表しました。この軽量モデルはシングルGPUで動作し、高速でコスト効率が高く、ローカルでの展開も可能です。Mistral Sabaは、アラビア語での会話サポート、ドメイン固有の専門知識、文化的に関連性の高いコンテンツ作成など、様々な用途で強力な機能を発揮し、企業により正確で文化的に適切なサービスを提供します。

続きを読む

アンソロボット:自己組織化バイオボットが再生医療に革命を起こす

2025-01-03
アンソロボット:自己組織化バイオボットが再生医療に革命を起こす

マイケル・レビン博士のチームは、成人ヒト肺上皮細胞から作られた自律型バイオボット、アンソロボットを開発しました。以前のゼノボットとは異なり、アンソロボットは野生型ゲノムを持ち、自己組織化して様々な行動を示します。驚くべきことに、アンソロボットの集合体は神経組織の修復を促進し、再生医療における大きな可能性を示しています。この研究は細胞能力に対する私たちの理解に挑戦し、パーソナル医療と新しいバイオメディカルプラットフォームのための新たな道を切り開きます。

続きを読む
1 2 496 497 498 500 502 503 504 595 596