YuE:長編音楽生成のためのオープンファウンデーションモデル

2025-08-08

研究者たちは、LLaMA2アーキテクチャに基づくオープンファウンデーションモデルのファミリーであるYuEを発表しました。これは、長編音楽生成、特に歌詞から楽曲を生成するという難しい課題に取り組んでいます。YuEは最長5分間の音楽を生成し、歌詞の一貫性、首尾一貫した音楽構造、そして魅力的なメロディーと伴奏を維持します。これは、トラック非依存の次トークン予測、構造的漸進的コンディショニング、そしてマルチタスク、マルチフェーズの事前トレーニングレシピによって実現されています。さらに、改良されたコンテキスト学習により、多様なスタイル転送(例:日本のシティポップから英語のラップへの変換)と双方向生成が可能になります。評価の結果、YuEは音楽性とボーカルの機敏さにおいて、一部の独自システムに匹敵するか、あるいはそれを上回ることを示しています。ファインチューニングにより、追加のコントロールとマイナー言語のサポートが強化されます。さらに、生成を超えて、YuEの学習済み表現は音楽理解タスクでも高い性能を示し、MARBLEベンチマークで最先端の方法に匹敵するか、それを上回る結果を達成しています。

続きを読む
AI

AI経済:アメリカ経済の二極化

2025-08-08
AI経済:アメリカ経済の二極化

アメリカ経済は二極化している。急成長するAI経済と低迷する消費者経済が対照的だ。AI関連企業が株式市場の成長を牽引し、巨大テクノロジー企業によるインフラへの巨額投資がそれを支えている。これは、1960年代以来最大のテクノロジー・プロジェクトと言えるだろう。AIによる生産性向上が議論されている一方で、特に情報サービスや経営分野におけるAIの急速な普及は否定できない。長期的な影響はまだ不透明だが、AIがアメリカ経済と雇用市場に与える影響は既に顕著になっている。

続きを読む
テクノロジー AI経済

無限CSS値によるブラウザ限界の探求

2025-08-08
無限CSS値によるブラウザ限界の探求

著者は、CSSで要素の幅と高さを`calc(infinity * 1px)`に設定することで実験を行い、様々なブラウザレンダリングエンジンが無限値をどのように扱うかを調べました。ChromeとSafariは値を約33,554,400ピクセルに制限しましたが、Firefox Nightlyは異常な挙動を示しました。高さはテキスト行の高さに制限され、幅は数百万ピクセルに達しましたが、レイアウト幅はその約半分でした。フォントサイズと行高に関するさらなるテストでも同様の差異が見られ、Firefoxのレンダリングは他のブラウザとは大きく異なっていました。著者はこれらの異常の理由について推測し、読者に説明を求めています。

続きを読む
開発

Framework デスクトップクラスタテスト:Ryzen AI Max+ 395 & Radeon 8090S ベンチマーク

2025-08-08
Framework デスクトップクラスタテスト:Ryzen AI Max+ 395 & Radeon 8090S ベンチマーク

著者は、AMD Ryzen AI Max+ 395 プロセッサと Radeon 8090S GPU を搭載した4台の試作段階のFramework デスクトップを使用してクラスタテストを行いました。最初のテストでは2.5Gbpsイーサネットインターコネクトを使用し、その後5Gbpsにアップグレードされました。Thunderboltインターコネクトもテストされ、TB4経由で10Gbpsを実現しました。すべての自動化はBeowulf AI Clusterリポジトリにあります。CPU、GPU、ディスク、ネットワークのパフォーマンスを網羅したベンチマークは、提供されたリンクから入手できます。

続きを読む

アメリカの政治における妄想的様式:繰り返される現象

2025-08-08
アメリカの政治における妄想的様式:繰り返される現象

本エッセイは、アメリカ政治における繰り返し見られる「妄想的様式」を検討しています。これは、過熱した誇張、疑い、陰謀論的な空想を特徴としています。18世紀後半のバイエルン・イルミナティの活動に対する不安から、反フリーメーソン運動、反カトリック運動、マッカーシズムに至るまで、その現れ方をたどり、著者は、この様式は極右に限定されるものではなく、不満の動きと関連していることを主張しています。エッセイは、この様式の心理的および社会的なルーツを掘り下げ、妄想的な思考が歴史を個人の意志の結果として解釈し、自己の理想的および容認できない側面を敵に投影する方法を強調しています。

続きを読む
その他

ドイツの国外移住税:起業家にとってのベルリンの壁?

2025-08-08

ドイツの国外移住税は、起業家にとって大きな障壁となり、事実上ドイツに縛り付けています。あなたが、いかなる有限責任会社(外国企業を含む)の1%以上を所有しており、かつその企業が利益を上げている場合、壊滅的な国外移住税が課せられる可能性があります。この税金は、過去3年間の平均利益に13.75を掛け、さらに0.6を掛け、最後にあなたの個人所得税率を適用して計算されます。この記事では、さまざまなシナリオにおける税負担を分析し、中程度の利益を上げる企業で、ドイツを離れることを考えている起業家は、企業が大きく成長する前に国外移住することを検討すべきだと示唆しています。

続きを読む
スタートアップ ドイツ国外移住税

Blueskyを使ったバックエンドレスなブログコメントシステム

2025-08-08
Blueskyを使ったバックエンドレスなブログコメントシステム

面倒なコメントシステムにうんざりしていませんか?著者は、分散型ソーシャルプラットフォームBlueskyのATプロトコルを巧みに利用して、軽量でバックエンドレスなブログコメントシステムを構築しました。ブログ記事をBlueskyに投稿し、API経由で投稿のURIを使用してコメントを取得することで、リッチテキストのサポート、本人確認、クロスプラットフォームでの会話などを実現しています。データベースやユーザーアカウントの管理は不要で、従来のコメントシステムの問題点を効果的に解決し、ユーザーエクスペリエンスを向上させ、ブログの拡張性と独立性を高めています。

続きを読む

Immich開発チームが遭遇した「呪われた知識」

2025-08-08
Immich開発チームが遭遇した「呪われた知識」

Immichチームは、開発中に遭遇した一連のフラストレーションを伴う、まるで呪われたかのような問題を報告しています。Zitadelのスクリプトエンジンが名前付きキャプチャグループをサポートしていないこと、EXIFメタデータの寸法が実際の画像寸法と異なること、YAMLの空白の非直感的な処理、Windowsの隠しファイルへのアクセス制限、Bashスクリプトにおけるキャリッジリターンの問題、Cloudflare WorkersにおけるFetchリクエストのデフォルトHTTPプロトコル、モバイルデバイスでのGPSデータのサイレント削除、PostgreSQL NOTIFYのトランザクションメカニズムによるパフォーマンスへの影響、非効率的なnpmスクリプトのヘルスチェック、JavaScript Dateオブジェクトの混乱したインデックス、bcryptのパスワード長の制限、Node.jsの互換性の問題、PostgreSQLのパラメータの制限、TypeORMの削除操作の副作用など、多くの問題が発生しました。これらの問題は、ソフトウェア開発における隠れた落とし穴と課題を浮き彫りにし、貴重な教訓を提供しています。

続きを読む
開発

自己不信からソフトウェア開発者へ:Makers準備コース4週目の日記

2025-08-08

この記事では、Makers準備コース4週目の体験について、受講生が綴っています。履歴書の執筆で自己不信に陥った後、テスト駆動開発(TDD)を徐々に習得し、個人コーディングプロジェクトに取り組み、ソフトウェア開発学習における成長と課題を示しています。病気からの回復やキャリアチェンジなど、過去の経験を率直に語り、ソフトウェアエンジニアになるという決意を固めています。プログラミングへの情熱と、Go言語を使ったテキストベースのアドベンチャーゲームで学習内容を強化している様子も紹介されています。

続きを読む

Ansibleを使った堅牢なホームラボProxmox設定の自動化

2025-08-08
Ansibleを使った堅牢なホームラボProxmox設定の自動化

柔軟性と堅牢性を高めるため、著者はホームラボをMinisforum UM880 PlusミニPCに移行し、Proxmox VEを導入しました。この記事では、暗号化されたDebian OSのインストール、ブリッジネットワークの設定、Ansibleを使用したProxmoxのインストールと設定の自動化など、全プロセスを詳細に説明しています。Proxmoxのインストールによってシステムがクラッシュするなど、遭遇した課題とその解決策も文書化されています。その結果、高度に自動化されたProxmox設定が実現し、将来のKubernetes実験のための堅実な基盤が築かれました。

続きを読む
開発

GPT-5:価格、モデルカード、主要機能を徹底解説

2025-08-08
GPT-5:価格、モデルカード、主要機能を徹底解説

OpenAIのGPT-5ファミリーが登場しました!革命的な飛躍ではありませんが、信頼性と使いやすさにおいて、以前のモデルを大きく凌駕しています。ChatGPTでは、GPT-5は問題の難易度に応じてモデルをインテリジェントに切り替えるハイブリッドシステムです。APIバージョンでは、標準、ミニ、ナノの3つのモデルが提供され、4つの推論レベルがサポートされています。入力トークン数は272,000トークン、出力トークン数は128,000トークンで、テキストと画像の入力が可能ですが、出力はテキストのみです。価格は非常に競争力があり、競合他社を大幅に下回っています。さらに、GPT-5は、幻覚の低減、指示の遵守の向上、お世辞の最小化において著しい進歩を示しており、新しい安全トレーニング手法を採用しています。文章作成、コーディング、医療分野で優れた性能を発揮します。しかし、プロンプトインジェクションは依然として解決されていない課題です。

続きを読む
AI

Postgresのためのカスタムインメモリテーブルアクセス方法の構築

2025-08-08

この記事では、著者がPostgreSQLのカスタムテーブルアクセス方法を構築し、シンプルなインメモリストレージエンジンを作成した過程を詳述しています。デバッグビルドのPostgreSQLから始めて、著者はテーブルアクセス方法APIの様々な関数を段階的に実装し、テーブルの作成、データの挿入、クエリの結果取得が可能な完全機能システムを作り上げました。このプロセスでは、PostgreSQL内部機構のデバッグや理解といった多くの課題に直面しましたが、ログ記録と反復的なデバッグによって解決しました。これはPostgreSQL拡張開発の優れた事例であり、他の開発者にとって貴重な経験とガイダンスとなります。

続きを読む
開発 拡張開発

React Three Fiberによるゲームシーンレンダリングコードスニペット

2025-08-08
React Three Fiberによるゲームシーンレンダリングコードスニペット

このコードスニペットは、React Three Fiberライブラリを使用してゲームシーンをレンダリングする方法を示しています。非同期レンダリングにはSuspense、Three.jsレンダリングコンテキストの作成にはCanvas、パラメーター制御にはLevaを使用しています。また、アンチエイリアシング、アルファチャンネル、ステンシルバッファー、デプスバッファー、高性能プリファレンスなどのWebGLレンダラーのプロパティも設定しています。GameSceneコンポーネントは、具体的なシーンレンダリングロジックを処理します。

続きを読む
ゲーム

Flipper Zeroファームウェアが車のセキュリティを回避:ワンクリックでロック解除

2025-08-08

YouTubeチャンネルTalking Sasquachは、多くの現代車のローリングコードセキュリティシステムを破る、Flipper Zeroのカスタムファームウェアを実演しました。この攻撃は、キーフォブからのボタン押下を一度記録するだけで、ドアやトランクのロック解除など、すべての機能を複製し、元のキーフォブを無効にすることができます。影響を受けるブランドには、クライスラー、ダッジ、フィアット、フォード、ヒュンダイ、ジープ、キア、三菱、スバルが含まれます。現在、簡単な解決策はなく、大量の車両リコールが必要になる可能性があります。攻撃のメカニズムは、ローリングコードシーケンスのリバースエンジニアリング、または特定の順序でキャプチャされたコードを再生して同期システムをリセットする「RollBack」攻撃のいずれかである可能性があります。

続きを読む
テクノロジー ローリングコード攻撃

反復的なデータキュレーションによるLLMファインチューニングの改善

2025-08-08
反復的なデータキュレーションによるLLMファインチューニングの改善

研究者らは、反復的なデータキュレーションによって、大規模言語モデル(LLM)のパフォーマンスを大幅に向上させました。実験には、異なるサイズの2つのLLM(Gemini Nano-1とNano-2)と、異なる複雑さのタスクが使用され、約10万件のクラウドソーシングアノテーションが使用されましたが、当初は深刻なクラス不均衡(95%が良性)に悩まされていました。専門家による反復的なキュレーションとモデルのファインチューニングにより、パフォーマンスは大幅に向上しました。モデルは約40%の肯定的な例に到達し、コーエンのカッパ係数は約0.81(低複雑度)と約0.78(高複雑度)となり、専門家レベルのパフォーマンスに近づきました。これは、LLMのトレーニングにおける高品質データの重要な役割を強調しています。

続きを読む

広く使われているTETRA暗号化に重大な欠陥を発見

2025-08-07
広く使われているTETRA暗号化に重大な欠陥を発見

研究者らは、世界中の警察や軍隊で広く採用されているTETRA無線システムで使用されている暗号化アルゴリズムに重大な脆弱性を見出しました。この研究は、TETRA標準の暗号化アルゴリズムの1つであるTEA1に、キーサイズ縮小の脆弱性があることを明らかにしました。これにより、キーがわずか32ビットに弱体化され、1分以内に解読される可能性があります。さらに、エンドツーエンド暗号化(E2EE)の実装における欠陥により、キーサイズが56ビットに縮小され、音声やデータ通信の傍受が可能になる可能性があります。これらの脆弱性は、TCCA E2EEスキームを使用する多くのユーザー、すなわちヨーロッパ、中東、その他地域の法執行機関や軍機関に影響を与えます。一部のアルゴリズムには地理的な使用制限がありますが、TEA1は米国やその他の国の重要なインフラストラクチャでも使用されています。これらの発見は、グローバルな通信セキュリティにおける重大なリスクを浮き彫りにし、TETRAシステムへの緊急のセキュリティアップデートが必要であることを示しています。

続きを読む
テクノロジー

AArch64デスクトップでx86_64アプリを実行する:FEX-Emuによる実験

2025-08-07
AArch64デスクトップでx86_64アプリを実行する:FEX-Emuによる実験

この記事では、Ampere AltraベースのAArch64デスクトップシステムで、FEX-emuを使用してx86_64アプリケーションを実行する実験について説明しています。SteamやFactorioは動作しましたが、パフォーマンスは悪く、Geekbench 6のシングルコアとマルチコアのスコアはそれぞれ459と4110という低い数値でした。FEX-emuの設定の最適化や、Ninjaビルドツールのx86_64版をaarch64版に置き換えることで、パフォーマンスが多少向上しました。最終的に、著者はこのAArch64システムでのx86_64エミュレーションは実用性に限界があり、主に古いゲームを実行する場合にのみ有用であると結論付けています。

続きを読む

Super Cars II:Amigaの名作の裏側

2025-08-07
Super Cars II:Amigaの名作の裏側

Spillhistorie.noは、1991年のAmiga用トップダウン型レーシングゲーム「Super Cars」の開発者、Andrew MorrisとShaun Southernにインタビューを行いました。Super Sprintから着想を得たSuper Cars IIは、武器や戦略要素、ユニークなユーモラスなクイズ要素を追加。開発は厳しい締め切りと、Atari ST版におけるグラフィックやAI処理といった技術的課題に直面しました。海賊版が横行したにもかかわらず、Super Carsシリーズは好調な売上と高い評価を獲得。開発者たちは今も続編に意欲を示しています。

続きを読む
ゲーム

囁くイヤリング:幸福と自由意志の逆説

2025-08-07

ティル・イオソフランの古代の宝庫には、着用者に最適な助言を与え、最大の幸福を保証する魔法のイヤリングが隠されています。しかし、それには代償があります。イヤリングは徐々に着用者の心を支配し、新皮質を萎縮させ、最終的には本能だけで行動する個人へと変えてしまいます。最後に、カドミ・ラチュミオンという男がイヤリングの秘密を解き明かし、宝庫の奥深くにそれを閉じ込めました。それは、自由と幸福の境界線が想像以上に微妙であるという警告です。

続きを読む
その他 哲学的含み

モナドを捨てよ、自然変換を使え

2025-08-07

この記事は、関数型プログラミングにおけるモナドの過剰使用に異議を唱えています。著者は、モナドの概念があまりにも抽象的であると主張し、モナドを構成する自然変換を直接プログラミングに用いることを提案しています。Я言語を例に、自然変換を用いて異なる関手を組み合わせる方法を説明し、このアプローチをモナドトランスフォーマーとの違いを比較しています。そして最終的に、より柔軟で低レベルな自然変換でモナドを置き換えることで、よりクリーンで強力なプログラム設計を実現できると主張しています。

続きを読む
開発 自然変換

ニューヨークでの9年間の通勤:ストリートフォトグラフィープロジェクト

2025-08-07
ニューヨークでの9年間の通勤:ストリートフォトグラフィープロジェクト

デンマークの写真家ピーター・ファンチは9年間、ニューヨークの42番街とヴァンダービルト・アベニューの角で、毎日の朝の通勤風景を撮影しました。「42nd and Vanderbilt」と題されたこのプロジェクトは、通勤者の微妙な変化と変わらない習慣をユニークな視点で捉えています。長年にわたって同じ人物を何度も撮影することで、ファンチは鑑賞者を、日常生活で見過ごされがちな詳細、都会の喧騒の中の束の間の孤独、そして通勤者の顔に反映された不安から平静までの感情のスペクトルについて、熟考するよう促しています。

続きを読む

AURA:機械可読なウェブプロトコル

2025-08-07
AURA:機械可読なウェブプロトコル

AURA(Agent-Usable Resource Assertion)は、AIとウェブのインタラクションに革命を起こします。もろいスクレイピングやDOM操作に頼るのではなく、標準化された`aura.json`マニフェストファイルを使って、ウェブサイトがその機能(例:投稿の作成、ログインなど)をHTTPリクエストとして宣言することを可能にします。これにより、効率的で安全なAIとウェブサイトのインタラクションが可能になり、コンテンツだけでなくアクションもインデックス化する、よりスマートな検索エンジンの実現への道を切り開きます。このプロジェクトには、その機能を実証する参照サーバーとクライアントが含まれています。

続きを読む

Stasher:アカウント不要の一時的な秘密共有ツール

2025-08-07
Stasher:アカウント不要の一時的な秘密共有ツール

Stasherは、安全で一時的な秘密共有のためのコマンドラインツールです。アカウントもバックエンドも不要で、AES-256-GCMを使用して暗号化された純粋な秘密送信を実現します。一度使用したら削除されるため、秘密は安全に保たれます。完全なサプライチェーンの透明性(暗号署名、SLSA v1アテスト、Rekorログ)を備え、オープンソースであるStasherは、セキュリティを重視するユーザーにも最適です。

続きを読む
開発 秘密共有

トランプの貿易幻想:15%の関税と、さらに大きな危険

2025-08-07
トランプの貿易幻想:15%の関税と、さらに大きな危険

トランプは、EUが彼の自由裁量による投資のために6000億ドルの「贈り物」を約束したと主張しています。これは幻想です。EUはそんな約束をしていません。にもかかわらず、トランプはEUに対する関税を35%に引き上げると脅迫しています。これはEUに打撃を与えますが、EUの米国市場への依存度が比較的低く、既存の関税にすでに適応しているため、影響は予想より小さくなる可能性があります。しかし、トランプの貿易政策における根底にある傲慢さと誤算の方がはるかに懸念すべきです。

続きを読む
テクノロジー

Splatshop:巨大なガウススプラットモデルのインタラクティブ編集

2025-08-07

Splatshopは、最大1億個のプリミティブをリアルタイムで処理する、3Dガウススプラッティングモデルのインタラクティブな編集(選択、削除、ペイント、変換など)のための、高度に最適化されたツールボックスです。速度と精度をバランスよく両立させることで、パフォーマンスを犠牲にすることなく正確な編集を可能にします。さらに、SplatshopはVRに対応しており、大規模なガウススプラッティングモデルの最初のVRエディターであり、この技術のための「Photoshop」への大きな一歩となります。

続きを読む

OpenAIのオープンソースモデル:真の倫理的問題から目をそらす?

2025-08-07
OpenAIのオープンソースモデル:真の倫理的問題から目をそらす?

OpenAIは最近、大規模言語モデルをオープンソース化しましたが、謳われている「安全性」への懸念が疑問を投げかけています。この記事では、OpenAIがAI倫理に関する大衆の懸念を巧みにモデル固有の倫理問題、つまり、モデルがわいせつな言葉を使ったり有害な行動をとったりすることを防ぐことにすり替えていると主張しています。しかし、大衆は現実的な影響、つまりガバナンス、説明責任、データ利用、雇用喪失などをはるかに懸念しています。これは、プライバシーに関する過去のテクノロジー戦略を反映しており、簡単に解決できる問題に焦点を当てながら、より困難な社会的問題を回避しています。AIが倫理ガイドラインに従うかどうかに悩むのではなく、AIを利用する企業やリーダーに注目すべきです。AI倫理の真の課題は、これらの企業が資源や権力を悪用して人類に害を及ぼさないことをどのように保証するかです。

続きを読む
AI

元Google AI研究者、LLMと倫理的問題について警告

2025-08-07
元Google AI研究者、LLMと倫理的問題について警告

19年間大手テック企業に勤務し、AI研究者として働いていたBhaskar Mitra氏が、レイオフ後、大規模言語モデル(LLM)の実態と倫理的な問題点を明らかにしました。彼は、LLMが医師や教師などの専門家を置き換えることはないと主張し、情報への集中管理が、社会正義、情報アクセス、権力集中に関する懸念を引き起こすと指摘しています。Mitra氏は、AI技術と社会正義の関係を見直し、より包括的で人道的な技術的未来を求めています。

続きを読む
AI

AI監視システムによる学校での逮捕:13歳少女の冗談が波紋を呼ぶ

2025-08-07
AI監視システムによる学校での逮捕:13歳少女の冗談が波紋を呼ぶ

13歳の少女がオンライン上の冗談で逮捕された事件が、学校におけるAI搭載監視システムの倫理的な問題点を浮き彫りにしました。脅威検出を目的としたシステムが、無害な発言を暴力的な脅威と誤認し、取り調べ、身体検査、拘留につながりました。教育関係者はシステムが命を救うと主張する一方、批判者は軽率な発言を犯罪化するとして反発。高い誤検知率や訴訟の増加は、AIの学校利用における倫理的ジレンマを浮き彫りにし、安全と生徒の権利・福祉のバランスが問われています。

続きを読む
テクノロジー 青少年の権利

AI支援プログラミング1.5年:考察と教訓

2025-08-07
AI支援プログラミング1.5年:考察と教訓

この記事では、著者がAIをプログラミングに活用した1年半の経験を共有しています。AIは反復的なコーディングタスク、リファクタリング、簡単なプロジェクトでは優れていますが、複雑な問題や新規開発では苦労し、多くの場合、エラーや非効率的な抽象化を導入します。開発者の制御が向上するため、CLIインターフェースはIDEよりも効果的であることが証明されています。AIは設計とライティングにも役立ちますが、「バイブコーディング」(AI生成コードのみに依存する)は推奨されません。これは、大きな技術的負債とセキュリティの脆弱性を引き起こします。著者は、AIの主な恩恵を受けるのは開発者ではなく、マネージャーやクライアントであり、コミュニケーションとコラボレーションが向上すると結論付けています。AIのプログラミングにおける未来は明るく、企業はこれを解雇の言い訳として使うべきではありません。

続きを読む
開発

Gemini CLI GitHub Actions:あなたのAIコーディング仲間が登場!

2025-08-07
Gemini CLI GitHub Actions:あなたのAIコーディング仲間が登場!

Googleは、GitHub上のIssueとPull Requestの管理を自動化する無料のAIコーディングアシスタント、Gemini CLI GitHub Actionsをリリースしました。Issueをインテリジェントに分類・優先順位付けし、迅速なコードレビューフィードバックを提供し、指示に基づいてコードやテストなどを記述することもできます。IssueやPull Requestで@gemini-cliとメンションするだけで、AIの支援を受けることができます。現在ベータ版で、世界中の開発者にご利用いただけます。

続きを読む
開発
1 2 77 78 79 81 83 84 85 595 596