Category: 開発

Fivetran、Censusを買収:データジャーニーの完全自動化へ

2025-05-01
Fivetran、Censusを買収:データジャーニーの完全自動化へ

FivetranによるリバースETL企業Censusの買収は、データ統合における大きな進歩を示しています。Censusの信頼性の高いリバースETLエンジンは、SalesforceやHubSpotなどの運用アプリケーションに、データウェアハウスからガバナンスされたデータをシームレスかつ信頼できる方法で移動させ、分析と行動のループを閉じます。これにより、Fivetranプラットフォームはデータ取り込みと変換を超えて拡張され、顧客はカスタムコードや継続的なメンテナンスなしで、自動化と可観測性によってリアルタイムの意思決定、AI、ビジネスオペレーションを実現できます。Canvaなどの顧客は、すでにFivetranとCensusを使用して、メールの開封率の向上、プラットフォームエンゲージメントの向上、エンジニアリング時間の大きな節約など、目覚ましい成果を上げています。

Macアプリの起動が遅い原因:マルウェアのスキャン?それともハッシュキャッシュミス?

2025-05-01

ブロガーのJeff Johnsonは昨年、Macアプリの起動が遅い原因がsyspolicydプロセスによるマルウェアスキャンであることを発見しました。しかし、ブロガーのHoward Oakleyはこれに異議を唱えています。Johnsonはspindumpを使用してOakleyの主張を反駁し、マルウェアスキャンが動的ライブラリの読み込み時のdlopenで発生することを示しました。Oakleyは、起動が遅いのはFrameworksフォルダ内のファイルのSHA-256ハッシュキャッシュミスが原因だと主張しています。Johnsonは、Oakleyの理論は証拠に乏しく、ユニバーサルバイナリが2つのアーキテクチャを含むという事実を無視しているため、Oakleyのハッシュ計算時間の見積もりは不正確だと主張しています。この議論の中心は、システムログとプロセスのスナップショットに対する異なる解釈、そしてキャッシングメカニズムに対する異なる理解にあります。

開発

RedisがAGPLv3オープンソースライセンスに戻る

2025-05-01

Redisの主要開発者であるantirezは、RedisがAGPLv3オープンソースライセンスに戻った経緯を振り返ります。彼は個人的にAGPLを強く主張し、SSPLはコミュニティで広く受け入れられていないと考えていました。正式リリースされたRedis 8はAGPLv3ライセンスを使用しており、antirezは満足しています。彼はRedis、特に新しいデータ型であるVector Setsの継続的な改善を約束しています。

開発

オープンソース、自己ホスト可能なブックマークマネージャー:あなたのプライバシー、あなたの選択

2025-05-01

このオープンソースで自己ホスト可能なブックマークマネージャーは、あなたのプライバシーを最優先します。あらゆる画面サイズに対応するレスポンシブデザイン、コンテンツの容易な検索を可能にする強力な検索機能、シームレスなウェブページ保存のためのブラウザ拡張機能を備え、一括操作、インポート/エクスポート、ダーク/ライトモードの切り替えをサポートしています。最も重要なのは、あなたのデータを第三者に販売することは決してなく、カスタムソリューションの作成を容易にするための安全なAPI統合を提供することです。このプライバシー重視で強力なブックマークマネージャーを今日から体験してください!

SQLiteデータベースコピーの高速化:テキストダンプの秘訣

2025-05-01
SQLiteデータベースコピーの高速化:テキストダンプの秘訣

著者は、大きなSQLiteデータベースのコピー時に、インデックスファイルのサイズが大きいために速度のボトルネックに遭遇しました。そこで、データベースをテキストファイル(`.dump`コマンドを使用)にダンプし、gzipで圧縮することで、ファイルサイズを大幅に削減し、コピー速度を向上させる方法を発見しました。3.4GBのデータベースを直接コピーする場合と比較して、この方法ではファイルを240MBに圧縮し、14倍の速度向上を実現しました。さらに、この方法は、コピー中に更新が行われたことによるデータベースの破損問題を防ぎ、信頼性を向上させます。

Windows 7の30秒間の起動バグ:単純なコーディングエラー?

2025-05-01
Windows 7の30秒間の起動バグ:単純なコーディングエラー?

Windows 7を覚えていますか?Microsoftにとっての成功でしたが、奇妙なバグが一部のユーザーを悩ませました。単色の壁紙を使用した場合、30秒間の起動遅延が発生するのです。最近のブログ投稿で、その原因が明らかにされました。単純なコーディングエラーです。システムは背景画像の準備完了を確認するメッセージを待っていましたが、このメッセージは複雑なビットマップを使用した場合にのみ送信され、単色では送信されませんでした。さらに悪いことに、デスクトップアイコンを非表示にするグループポリシー設定が、コード内での配置のために問題を悪化させました。数ヶ月後に展開された修正は、一見小さなコーディングミスがいかに大きな問題を引き起こすかを浮き彫りにしています。

ブラウザ上で動作する高機能CSV変換スイート:データ処理を簡単に

2025-05-01

この強力なオンラインCSV変換ツールを使えば、様々なデータ形式をブラウザ上で簡単に処理できます!CSV、TSV、XLSX、XLS、TXTファイルのインポートに対応し、フォーマットとエンコーディングを自動検出します。ヘッダーの名前変更、フィールドの有効化/無効化、ドラッグ&ドロップによる列の並べ替え、列の分割や結合、正規表現を使ったテキスト置換、JSONやXMLへのデータ変換などが可能です。フルスクリーン表示で大きなデータセットの確認も容易で、検索、フィルタリング、ソート機能も搭載。データセット間の違いを比較して分析することもできます。ダウンロードやインストールは不要です!データ処理をシンプルに!

開発 CSV変換

FinArva AI ハッカソン 2025:AIでインドの金融流通問題を解決

2025-05-01
FinArva AI ハッカソン 2025:AIでインドの金融流通問題を解決

GroMoがAWSの支援を受けて開催するFinArva AIハッカソン2025は、AIと製品イノベーションを活用して、インドの最も困難な金融流通問題に取り組むハイステークスのコンペティションです。参加者は、インドの次なる10億人のユーザー向けのインテリジェントなソリューションを設計し、独占的なメンタリングを受け、トップのフィンテックリーダーにプレゼンテーションを行い、100万ルピーを超える賞金を競います。学生、専門家、AI愛好家向けで、3~5人のチームが推奨されます。勝利の基準には、問題の理解、イノベーション、ビジネスインパクト、効果的なAI統合、使いやすさが含まれます。

SerenityOSのLadybirdブラウザエンジンにおけるUse-After-Free脆弱性の悪用

2025-05-01

SerenityOSプロジェクトのLadybirdブラウザエンジンのLibJS JavaScriptエンジンに、Use-After-Free(UAF)脆弱性が発見されました。この脆弱性は、インタプリタの引数バッファの不適切な管理に起因しており、攻撃者は悪意のあるプロキシ関数オブジェクトと`[[Get]]`ハンドラを使用してこの脆弱性をトリガーできます。このUAFを悪用すると、任意のメモリ読み書きが可能になり、最終的にはコード実行(`/calc`の実行など)につながります。この脆弱性はFuzzilliファザーを使用して発見され、メモリリークとオブジェクトの偽造を含む一連の手順によって悪用されました。

開発

文字列長の制限における落とし穴

2025-04-30

この記事では、文字列長の制限の複雑さについて深く掘り下げています。文字コード(UTF-8、UTF-16、Unicodeコードポイント、グラフェムクラスタ)の違いにより、長さの計算方法が異なり、フロントエンド、バックエンド、データベースなどのレイヤー間で不整合が生じやすく、バグの原因となります。著者は、完璧ではありませんが、NFC正規化を用いたUnicodeコードポイントのカウントを最良の方法として提案しています。この記事では、グラフェムクラスタのカウント、UTF-8バイトのカウント、UTF-16コードユニットのカウントなどの方法の長所と短所についても考察し、ハイブリッドカウント方法のサンプルコードを提供しています。

開発 文字列長

オープンソースラボ (OSL) は25万ドルを確保しなければ閉鎖の危機

2025-04-30
オープンソースラボ (OSL) は25万ドルを確保しなければ閉鎖の危機

オレゴン州立大学のオープンソースラボ(OSL)は深刻な資金不足に直面しています。企業からの寄付金減少と大学の予算削減により、OSLは2025年5月14日までに25万ドルを調達しなければ閉鎖せざるを得ません。この資金は、職員と学生の給与、運営費に充てられます。OSLは世界中で500以上の無料のオープンソースプロジェクトをホストしており、22年間で130人以上の学生を育成してきました。また、データセンターの廃止という課題にも直面しており、新たな場所の確保も非常に困難となっています。

開発 資金危機

JetBrains、AIアシスタントのネガティブレビューを削除し論争に

2025-04-30
JetBrains、AIアシスタントのネガティブレビューを削除し論争に

JetBrainsのAIアシスタントプラグインは2200万回以上ダウンロードされていますが、評価はわずか2.3星と低いものです。最近、ユーザーはネガティブレビューが削除されていることに気づき、JetBrainsは、これらのレビューが解決済みの問題に関するものか、ポリシーに違反していたため削除したと説明しました。しかし、この行為は反発を招き、ユーザーはJetBrainsがAIアシスタントの多くの問題、例えばサードパーティモデルの限定的なサポート、頻繁な遅延、コア機能のクラウドサービスへの依存、プロジェクトタイプ間でのユーザーエクスペリエンスの不一致、ドキュメントの不足などを隠蔽しようとしていると非難しています。AIアシスタントの無許可自動インストールも大きな問題となっています。JetBrainsは新しいAIエージェントJunieと無料プランを導入しましたが、高コストと、競合他社とは異なり、独立したクラウドビジネスがないことが、依然として課題となっています。

CVE-2025-21756: vsock を介した Linux カーネルの脆弱性攻撃

2025-04-30

研究者は、KernelCTFへの提出物の中で、vsockを介して特権昇格を許容する単純なLinuxカーネルの脆弱性CVE-2025-21756を発見しました。この攻撃の中心は、数行のコードで修正されたUse After Free(UAF)の問題です。研究者はパッチを分析し、脆弱性を特定し、クロスキャッシュ攻撃を試みました。しかし、AppArmorによって直接的な攻撃は阻止されました。そこで、研究者は巧みにvsock_diag_dumpをサイドチャネルとして利用し、kASLRをバイパスしてカーネルアドレスをリークしました。最後に、慎重に設計されたROPチェーンを使用して`commit_creds`関数を呼び出し、root権限を取得しました。この過程は困難でしたが、貴重なカーネルセキュリティに関する知識を得ることができました。

開発

NotebookLMが複数言語対応のオーディオサマリー機能を提供開始

2025-04-30
NotebookLMが複数言語対応のオーディオサマリー機能を提供開始

NotebookLMはオーディオサマリー機能をアップデートし、ユーザーが好みの出力言語を選択できるようになりました。ポルトガル語のドキュメンタリー、スペイン語の研究論文、英語の学習レポートなど、どのような言語のコンテンツをアップロードしても、選択した言語でオーディオサマリーを生成できます。これにより、多言語コンテンツや学習教材の作成が容易になります。例えば、教師はアマゾンの熱帯雨林に関する資料を様々な言語で共有でき、生徒はそれらをアップロードして自分の母語でオーディオサマリーを生成できます。これにより、言語の壁を取り払い、情報へのアクセスを容易にします。

ART: 最小限のコード変更でLLMのパフォーマンスを最大化する強化学習ライブラリ

2025-04-30
ART: 最小限のコード変更でLLMのパフォーマンスを最大化する強化学習ライブラリ

Agent Reinforcement Trainer (ART)は、エージェントワークフローにおける大規模言語モデル(LLM)のパフォーマンス向上を目的とした、オープンソースの強化学習ライブラリです。強力なGRPOアルゴリズムを利用して、モデル自身の経験から学習します。ほとんどのRLライブラリとは異なり、ARTは既存のコードベースにシームレスに統合され、RLトレーニングループの複雑さをバックエンドにオフロードします。ARTはクライアント(コードとのインタラクションを担当)とサーバー(推論とトレーニングを担当)で構成されています。トレーニングループには、推論(データの収集と報酬の割り当て)とトレーニング(GRPOを使用してモデルのトレーニングとLoRAの更新を行う)が含まれます。ARTは、vLLM/HuggingFace Transformersと互換性のあるほとんどの因果言語モデルをサポートしています。現在アルファ版であり、貢献を歓迎しています。

開発

BSSG: 10年の歳月を経てBash静的サイトジェネレーターがオープンソースで公開

2025-04-30
BSSG: 10年の歳月を経てBash静的サイトジェネレーターがオープンソースで公開

著者は90年代後半から個人ウェブサイトを所有しており、HTMLの手書きからWYSIWYGエディター、WordPressなどの動的CMSまで、様々なウェブサイト作成方法を経験してきました。動的CMSの継続的なセキュリティアップデートとメンテナンスに不満を感じ、静的サイトジェネレーターへと転向。bashblog、Pelican、Nikola(Nikola用のDockerコンテナも作成)を試用した後、2015年に独自のBash静的サイトジェネレーター(BSSG)を開発しました。BSSGは時間とともに進化し、テーマ、アーカイブ、タグなどの機能が追加されました。その強みは軽量性、移植性、高性能、高いアクセシビリティスコア、Markdownのサポート、そして多様なテーマにあります。コードの不完全性を認識しつつも、著者はBSSGをオープンソースとして公開し、動的CMSのメンテナンスに疲れた人々に役立つことを願っています。

開発

Raven:OCamlのための新しい機械学習エコシステム

2025-04-30
Raven:OCamlのための新しい機械学習エコシステム

Ravenは、OCamlに機械学習とデータサイエンスをもたらす包括的なエコシステムです。NumPy(Ndarrayを使用)、Jupyter(Quillを使用)、JAX(Runeを使用)といった人気のPythonツールを反映したライブラリを提供し、OCamlの型安全性とパフォーマンスを活かしながら、Pythonのような使いやすさを目指しています。現在プレアルファ版ですが、数値計算、可視化(Hugin)、その他多くのツールを備えており、より安全で高速な言語を求めるデータサイエンティストにとって魅力的な選択肢となります。

開発

ノーと言う技術:洗練された拒否のための軽量API

2025-04-30
ノーと言う技術:洗練された拒否のための軽量API

丁寧な断りに苦労していませんか?この軽量API「No as a Service」は、あらゆる状況に合わせた何千もの創造的でユーモラスな断りの理由を提供します。アプリ、ボット、ランディングページなどに簡単に統合でき、気の利いた断りの手紙の作成にも役立ちます。オープンソースコードは簡単に実行でき、スタイリッシュに「ノー」と言うための楽しく効率的なツールです。

arXivLabs:コミュニティとの協力によるarXivの新機能開発

2025-04-30
arXivLabs:コミュニティとの協力によるarXivの新機能開発

arXivLabsは、共同作業者がarXivの新しい機能をウェブサイト上で直接開発・共有できる実験的なフレームワークです。参加者は、arXivのオープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという価値観を共有しています。arXivコミュニティを改善するアイデアをお持ちですか?arXivLabsの詳細をご覧ください!

開発

Talanoa:10年の構想がついに実現

2025-04-30
Talanoa:10年の構想がついに実現

ウェブエンジニアのJohn Martinは、2014年に会話のようにメールを処理できるアプリケーションTalanoaのアイデアを考案しました。毎年このアイデアを見直し、市場に同様の製品がないことに気づいてから、ついにそれをローンチしました。この物語は、ビジョンを実現し、市場のギャップを埋めるために必要な献身と粘り強さを示しています。

開発

dataframely:Polarsネイティブのデータフレーム検証ライブラリ

2025-04-30

QuantCoがレガシーコードベースを近代化しようとした際に、データフレーム処理における重大な欠陥、つまり検証の欠如が明らかになりました。パフォーマンス向上のためpandasからPolarsに移行したことで、この問題が浮き彫りになりました。panderaやpatitoなどの既存ライブラリは不十分であることが判明しました。そこで、彼らはPolarsネイティブのライブラリであるdataframelyを開発しました。これは、宣言的なデータフレーム検証を可能にします。dataframelyはスキーマの定義、データフレームの内容の検証、データフレーム間の検証、ソフトバリデーションをサポートし、パイプラインの堅牢性と可読性を大幅に向上させます。すでに複数のチームとプロジェクトで使用されています。

開発

HP webOS 'Eel':実現しなかった革新的なOS

2025-04-30
HP webOS 'Eel':実現しなかった革新的なOS

HPのタブレットや電話の計画の多くは期待外れだった一方、ソフトウェアチームは真に革新的なデザインを開発していました。コードネーム「Eel」のwebOSの次のメジャーバージョンは、オリジナルのPalm Preで導入された「カード」のメタファーを拡張することを目指しました。「カードスタック」と「レスポンシブパネル」を組み合わせることで、ユーザーは左側に新しい独立したカードとしてリンクを開き、それをスライドしたり、「切り離し」て別のスタックに移動したりすることができました。これにより、ウィンドウのサイズとグループ化が柔軟になり、スマートフォンとタブレットの両方でうまく機能しました。これは生産性を向上させるための革新的な試みでしたが、最終的にプロジェクトは潜在能力を十分に発揮することはありませんでした。

開発

ミッション・インポッシブル:現実世界におけるAIエージェントの管理

2025-04-30
ミッション・インポッシブル:現実世界におけるAIエージェントの管理

この記事では、ソフトウェア開発など様々な分野におけるAIエージェントの有効な制御に関する課題と戦略を探ります。著者は経験から得た教訓を共有し、綿密な計画とAIエージェントのコンテキスト制限の重要性を強調しています。ツール選び、タスク計画、計画の作成と改訂、計画のテスト、そしてより大きな問題の発見といった手法について詳しく説明し、ルール、パフォーマンスの回収、モデルの選択、コスト管理といった重要な側面にも触れています。また、Cursorなどのツールを使って再利用可能な計画を作成し、計画を段階的に実行し、継続的に改訂とテストを行うことでAIエージェントの信頼性を向上させ、効率的なソフトウェア開発を実現する方法を詳細に説明しています。

開発 計画管理

DuckDBを使ったHacker News完全データセットの分析

2025-04-30
DuckDBを使ったHacker News完全データセットの分析

著者は、サイトに投稿されたすべてを含む20GBのJSONファイルである、Hacker Newsの完全なデータセットをダウンロードし、DuckDBデータベースを使用して分析しました。記事では、ダウンロードプロセスと、特定のプログラミング言語(Python、JavaScript、Java、Ruby、Rust)の言及頻度の12週間移動平均を計算するSQLクエリについて詳しく説明しています。著者はDuckDBの使いやすさと速度を称賛し、データセットでLLMモデルをトレーニングするなど、将来の可能性をユーモラスに示唆しています。

開発

ExcelでLinuxを実行:楽しいハック

2025-04-30
ExcelでLinuxを実行:楽しいハック

開発者がMicrosoft Excel内でLinuxシステムを実行することに成功しました!mini-rv32imaという軽量エミュレータを使用して、DLLとしてコンパイルし、VBAマクロを介して呼び出すことで、Excelセルに直接Linuxの出力を表示することに成功しました。プロジェクトにはバグがあることは認められており、開発者はVBAやExcel数式でエミュレータを書き直す代わりに外部DLLを使用していることを認めていますが、これは創意工夫とプログラミングスキルを示す創造的で楽しい実験です。

開発

自動スパース微分:高次元ヘッセ行列の制御

2025-04-30

高次元ヘッセ行列の計算は、機械学習における大きなボトルネックです。この記事では、行列のスパース性を利用してヘッセ行列とヤコビ行列の計算を高速化する手法である、自動スパース微分(ASD)を紹介します。ASDは、スパースパターン検出と行列彩色を用いて、複数の構造的に直交する列(または行)を単一のベクトルにまとめて計算することで、計算コストとメモリ要件を削減します。この記事では、ASDの仕組みを詳細に説明し、順方向と逆方向の自動微分、スパース行列表現、彩色アルゴリズムなどを網羅しています。Julia言語によるコード例でその適用と性能上の利点を示し、Newton法などの最適化アルゴリズムのように、スパースなヤコビ行列やヘッセ行列の計算が必要なアプリケーションにおいて、ASDが大きな利点をもたらすことを結論づけています。

LinuxのPATH:シェルの秘密

2025-04-29

Linuxが実行するコマンドをどのように見つけるのか疑問に思ったことはありませんか?答えは、カーネルではなくシェルに依存していることです!この記事では、PATH環境変数のメカニズムを深く掘り下げ、dashのようなシェルが`padvance`関数を使用してPATH内で実行可能ファイルを探し、カーネルの`execve`システムコールが実際には完全なパスを受け取る方法を明らかにします。Python、Go、Rustなどのプログラミング言語も、サブプロセスライブラリに独自のPATH検索を実装しており、最終的には`execvp`などの基底関数に依存しています。この記事では、shebangが絶対パスを必要とする理由と、`/usr/bin/env`の巧妙な役割についても説明します。

開発

Amazon RDS for PostgreSQLマルチAZクラスタはスナップショット分離に失敗する

2025-04-29

Jepsenによるテストで、Amazon RDS for PostgreSQLマルチAZクラスタがスナップショット分離を完全に保証していないことが明らかになりました。スナップショット分離のルールに違反するG非隣接サイクルなどの異常が観測されました。これにはLong Forkが含まれており、RDS for PostgreSQLがより弱い並列スナップショット分離を提供している可能性を示唆しています。これは、高並行性下で読み取りトランザクションが実行順序について意見が異なる可能性があることを意味します。ユーザーはトランザクション構造に注意し、Long Forkを避け、またはスナップショット分離を回復するために書き込みエンドポイントのみを使用する必要があります。

古いKindleを家族用ダッシュボードに変身させる

2025-04-29

娘の学校の遅刻に悩んでいた父親が、使わなくなったKindleを家族の情報ダッシュボードに改造しました。Kindleを脱獄し、スクリプトを作成してバックエンドAPIを構築することで、リアルタイムの天気、公共交通機関の情報、娘の学校の時間割などを表示できるようにしました。バックエンドにはCloudflare Workers、Hono JSなどを使い、画像フォーマットの変換といった課題も巧みに解決しました。その結果、実用的でパーソナルな情報表示デバイスが完成しました。

開発

Zip爆弾で悪意のあるボットと戦う

2025-04-29
Zip爆弾で悪意のあるボットと戦う

容赦ない悪意のあるボットの攻撃に直面していますか? ウェブサイトの所有者が、彼の独創的な解決策を共有します:Zip爆弾。これらの小さな圧縮ファイルは巨大なファイルに展開され、攻撃者のリソースを圧倒します。悪意のあるリクエストを検出することにより、著者は圧縮されたZip爆弾を提供し、複数の攻撃を効果的に撃退し、彼のウェブサイトを保護します。完全無欠ではありませんが、洗練されていないボットネットに対する驚くほど効果的な防御策です。

開発 Zip爆弾
1 2 100 101 102 104 106 107 108 214 215