LLMのOCRとデータ抽出のためのオープンソースベンチマーク

2025-04-01
LLMのOCRとデータ抽出のためのオープンソースベンチマーク

Omniは、gpt-4oなどの様々な大規模マルチモーダルモデルのOCRとデータ抽出能力を比較するオープンソースのベンチマークツールです。テキストとJSONの抽出精度を評価します。このベンチマークは、従来のOCRプロバイダーとLLM全体におけるOCR精度の包括的な評価を提供します。データセットと方法はオープンソースであり、貢献と拡張を促進します。ベンチマークはJSON抽出に焦点を当て、Document ⇒ OCR ⇒ Extractionという全パイプラインの精度を測定します。JSONの精度には修正されたjson-diff、テキストの類似性にはLevenshtein距離を使用します。OpenAI、Google Gemini、Anthropicなど、様々なモデルをサポートし、シンプルなコマンドラインインターフェースとJSON出力で利用できます。

続きを読む
開発

TopoSort:高効率なZigライブラリによるトポロジカルソート

2025-04-01
TopoSort:高効率なZigライブラリによるトポロジカルソート

TopoSortは、依存グラフに対するトポロジカルソートを実行するための、非常に効率的なZigライブラリです。依存グラフの構築、トポロジカルソート、並列処理のための依存関係のないサブセットの生成、サイクル検出とレポート、さまざまなノードタイプのサポートなどの機能を備えています。コマンドラインインターフェースツール`toposort-cli`により、使用が簡素化されます。`max_range`パラメータを設定することでパフォーマンスが最適化され、依存ツリーの構築速度が3~4倍向上する可能性があります。TopoSortはMITライセンスです。

続きを読む

RubyUI:超高速Rails UIコンポーネントライブラリ

2025-04-01
RubyUI:超高速Rails UIコンポーネントライブラリ

RubyUI(旧PhlexUI)は、PhlexをベースとしたRails UIコンポーネントライブラリで、従来のERBテンプレートと比べて最大12倍の速度を誇ります。再利用可能でカスタマイズ可能なコンポーネントの集合を提供しており、アプリケーションに直接コピー&ペーストできます。RubyUIは、クリーンなデザイン、整理されたコンポーネント、高度なカスタマイズ性を重視しており、包括的なドキュメントと例を提供しています。カスタムビルドのStimulus.jsコントローラーを使用し、依存関係を最小限に抑え、効率的で美しいRailsアプリケーションインターフェースを簡単に構築できます。

続きを読む

AIでAndroidスマホを制御:コマンドをコードで記述

2025-04-01
AIでAndroidスマホを制御:コマンドをコードで記述

オープンソースプロジェクト`mobile-use`は、AIを使ってAndroidスマホを制御できます。「Instagramを開いてDMを送信する」といったコマンドを記述するだけで、ローカルにインストールされたAndroid SDKツール(adb)を使って実行します。カスタムLLMモデルにも対応しており、コマンドラインとファイル入力の両方の方法を提供するため、ターミナルやファイルから簡単に指示を送信できます。MITライセンスで公開されています。

続きを読む
開発

わずか149バイトの超軽量PubSubライブラリ

2025-04-01
わずか149バイトの超軽量PubSubライブラリ

この記事では、わずか149バイトの超軽量PubSubライブラリを紹介しています。依存関係はほとんどありません。nano-pubsub(194バイト)やtiny-pubsub(401バイト)などの競合ライブラリと比較することで、その非常に小さなサイズが強調されています。EventTargetを使用して構築されており、コードは明確で簡潔で、TypeScriptの型定義も含まれています。ライブラリのサイズをさらに縮小するための貢献を歓迎しています。

続きを読む
開発

KOReader:強力なクロスプラットフォーム電子書籍リーダー

2025-04-01
KOReader:強力なクロスプラットフォーム電子書籍リーダー

KOReaderは、主に電子インクリーダー向けに設計されたドキュメントビューアで、多くのフォーマット(PDF、EPUB、MOBIなど)とデバイス(Kindle、Koboなど)をサポートしています。高度にカスタマイズ可能な読書ビュー、多言語サポート、Calibreなどのツールとの統合、高速なページめくりを実現する電子インク最適化などを備えています。プラグインによる拡張も可能です。世界中のボランティアによって開発・維持されています。

続きを読む

LLMでAirflowパイプラインを強化:Apache Airflow AI SDK

2025-03-31
LLMでAirflowパイプラインを強化:Apache Airflow AI SDK

Pydantic AIをベースとしたこのApache Airflow AI SDKを使用すると、Airflowワークフローに大規模言語モデル(LLM)をシームレスに統合できます。デコレータベースのタスク(@task.llm、@task.llm_branch、@task.agent)を使用して、LLM呼び出しとエージェントのオーケストレーションを簡素化します。さまざまなモデル(OpenAI、Anthropicなど)のサポート、自動出力解析、DAG分岐機能により、データパイプラインがよりスマートで効率的になります。

続きを読む
開発

GumloopのguMCP:オープンソースの統合モデルコンテキストプロトコルサーバーコレクション

2025-03-31
GumloopのguMCP:オープンソースの統合モデルコンテキストプロトコルサーバーコレクション

Gumloopは、ローカルとリモートの両方で実行できる、オープンソースのモデルコンテキストプロトコル(MCP)サーバーのコレクションであるguMCPをリリースしました。これは、最大の統一されたMCPサーバーコレクションを作成し、AI統合とAGIの未来を取り巻くコミュニティを育成することを目的としています。stdioとSSEの両方の転送をサポートするguMCPには、ファイルシステム、データベース、開発ツール、Web自動化など、さまざまなサーバーが含まれており、コミュニティの貢献を奨励しています。GPL-3.0ライセンスの下でライセンス供与され、セキュリティが最優先事項であり、SOC 2 Type II、GDPR、HIPAAに準拠しています。

続きを読む
開発

ClaudeでWhatsAppを制御:WhatsApp MCPサーバー

2025-03-31
ClaudeでWhatsAppを制御:WhatsApp MCPサーバー

このプロジェクトは、WhatsAppと大規模言語モデル(LLM)であるClaudeを統合します。Goで記述されたブリッジは、WhatsApp WebのマルチデバイスAPIに接続し、メッセージをローカルのSQLiteデータベースに保存します。Pythonサーバーはモデルコンテキストプロトコル(MCP)を実装し、Claudeがツールセットを通じてメッセージ、連絡先を検索し、メッセージを送信できるようにします。すべての処理はローカルで行われ、ユーザーのプライバシーが優先されます。

続きを読む
開発

超高速Windows 9xインストール:90秒以内!

2025-03-31
超高速Windows 9xインストール:90秒以内!

Windows 98の遅いインストールにうんざりしていませんか? Windows 9x QuickInstallが登場です!このプロジェクトはLinuxとカスタムインストーラーを利用して、既にインストールされているWindows 98システムを最適化されたISOイメージにパッケージ化し、約60~90秒でインストールを完了できるようにします。Windows 98、Windows 98 SE、Windows MEに対応しており、ドライバーやツールの柔軟な追加も可能です。ISOの作成はnLiteよりも複雑ですが、カスタマイズ性の向上により、速度と高度にカスタマイズされたインストールを優先するユーザーにとって最適な選択肢となります。

続きを読む

Ambermoon Advanced:エピソード形式でリリースされる大規模RPG拡張

2025-03-31
Ambermoon Advanced:エピソード形式でリリースされる大規模RPG拡張

インディーデベロッパーのPyrdacorは、RPG「Ambermoon」の非公式拡張である「Ambermoon Advanced」をエピソード形式でリリースしています。5つのエピソードが予定されており、現在最初の3つのエピソードが公開されています。「海の謎」や「エレメンタルクリーチャー」などのコンテンツが含まれています。Amigaと現代のシステムで動作しますが、Amiga版はまだ開発中です。開発者は、ゲームはまだ開発中であり、バグやバランスの崩れが含まれている可能性があると述べています。ゲームの情報とAmbermoonの lore を含む、物理的なマニュアルも計画されています。

続きを読む
ゲーム ゲーム拡張

Blue95:90年代風レトロなデスクトップ体験

2025-03-30
Blue95:90年代風レトロなデスクトップ体験

Blue95は、Chicago95テーマを備えたFedora Atomic Xfceをベースにした、90年代を彷彿とさせる軽量なデスクトップ体験を提供します。付属のインストーラーはまだアルファ版であるため、winblues/vauxiteなどの他のFedora Atomicデスクトップからリベースする方法が推奨されています。Blue95は、古いオペレーティングシステムの正確な複製よりも、使いやすさとアクセシビリティを優先し、Universal Blueからの改良(コーデック、自動更新など)を組み込んでいます。インストール不要で試せるライブISOも用意されています。

続きを読む

Kalua:手軽なメッシュネットワーク構築

2025-03-30
Kalua:手軽なメッシュネットワーク構築

Kaluaはメッシュネットワーク構築を簡素化します。OpenWrtルーター上でメッシュネットワークを簡単に構築・設定できるスクリプトを提供し、様々なハードウェアとユースケースに対応しています。数コマンドでKaluaをダウンロード、ビルド、インストールし、手軽にメッシュネットワークを展開できます。

続きを読む

rrデバッガーがメジャーアップデート:ソフトウェアカウンタモード

2025-03-30
rrデバッガーがメジャーアップデート:ソフトウェアカウンタモード

rrデバッガーにソフトウェアカウンタモードが追加されました。これにより、CPUハードウェアパフォーマンスカウンタにアクセスせずに実行できるようになり、クラウドVMやコンテナ環境の制限を克服します。このモードは、軽量な動的および静的インストルメンテーションを利用して、記録と再生の機能を実現し、デバッグワークフローを簡素化します。著者のブログ記事では、記録と再生技術の原理、rrデバッガーの利点、開発の経緯について詳しく説明しています。

続きを読む

PG-MCP:拡張されたPostgreSQLモデルコンテキストプロトコルサーバー

2025-03-30
PG-MCP:拡張されたPostgreSQLモデルコンテキストプロトコルサーバー

PG-MCPは、AIエージェント向けに機能が強化されたPostgreSQLデータベース用のモデルコンテキストプロトコル(MCP)サーバーです。PostgreSQL MCPリファレンス実装を基盤として構築されており、マルチデータベースサポート、PostGISやpgvector拡張機能を含む豊富なメタデータ情報、クエリ実行計画分析ツール、堅牢な接続管理などの機能が追加されています。Dockerまたは仮想環境を使用して展開でき、提供されているPythonクライアントを使用してPG-MCPと対話できます。Claudeなどの大規模言語モデルを活用して、自然言語からSQLへの変換を行うことも可能です。

続きを読む
開発

msgpack23:最新のC++ MessagePackライブラリ

2025-03-30
msgpack23:最新のC++ MessagePackライブラリ

msgpack23は、MessagePackフォーマットへのデータのシリアライズとデシリアライズを行う軽量なC++ヘッダーオンリーライブラリです。最新のC++機能(C++20以降)を活用し、STLコンテナ、タイムポイントオブジェクト、カスタムタイプなど、さまざまなデータ型をサポートする柔軟で依存関係のないソリューションを提供します。シンプルなAPI、パフォーマンスへの焦点、拡張性により、効率的なデータ処理のための強力なツールとなります。

続きを読む
開発

xan:超高速CSV処理用CLIツール

2025-03-29
xan:超高速CSV処理用CLIツール

xanは、Rustで構築されたコマンドラインツールで、巨大なCSVファイル(ギガバイト単位!)を高速に処理します。マルチスレッドによる並列処理を活用し、プレビュー、フィルタリング、スライス、集計、ソート、結合などのCSVデータ処理タスクを容易に実行できます。xanは、複雑な操作においてPython、Lua、JavaScriptなどの速度を凌駕する強力な式言語を備えています。元々はxsvからフォークされましたが、大幅に書き直され、社会科学データ分析のニーズ、つまり語彙測定、グラフ理論、さらにはウェブスクレイピングにも対応しています。cargo、Homebrew、pacman、Nix、またはプリビルドバイナリで簡単にインストールできます。

続きを読む
開発 CSV処理

JobHuntr:AIでLinkedInの求人応募を自動化

2025-03-29
JobHuntr:AIでLinkedInの求人応募を自動化

JobHuntr.fyiは、Ollama搭載のAIを使用してLinkedInの求人に24時間365日自動的に応募するmacOSデスクトップアプリです。OpenAI APIキーは不要です。「簡単に応募」オプションのある求人(約70%)を対象としており、毎日最大25件の応募が可能です。AIはあなたの履歴書とFAQに基づいて応募フォームを賢く入力し、情報を慎重に確認します。不明確な質問はFAQに保存され、その応募はスキップされます。人間の行動を模倣し、あなたのIPアドレスを使用することで、LinkedInによる自動化の検出リスクを最小限に抑えます。

続きを読む
開発

LVGL:軽量で汎用性の高い組込みグラフィックスライブラリ

2025-03-29
LVGL:軽量で汎用性の高い組込みグラフィックスライブラリ

LVGLは、あらゆるMCU、MPU、ディスプレイタイプで美しいUIを作成するための、人気の高いオープンソース組込みグラフィックスライブラリです。30種類以上のビルトインウィジェット、強力なスタイルシステム、Webにインスパイアされたレイアウトマネージャーを備え、複数の言語をサポートしています。最小限のリソース(32kB RAMと128kB Flash)で動作し、UI開発を簡素化します。LVGLチームは、高品質なGUIの構築を支援するため、デザイン、実装、コンサルティングサービスも提供しています。

続きを読む

RTABench:リアルタイム分析アプリケーションのための新しいベンチマーク

2025-03-29
RTABench:リアルタイム分析アプリケーションのための新しいベンチマーク

従来の分析ベンチマークは、特定のユーザー、デバイス、またはトランザクションに対する迅速かつターゲットを絞ったインサイトの生成など、リアルタイムアプリケーションのニーズをしばしば見過ごしてきました。RTABenchはこのギャップに対処するために、正規化されたスキーマ、現実的なデータセットサイズ、および現実世界の使用パターンに一致するクエリを使用して、アプリケーション内のリアルタイム分析を正確に反映するベンチマークを提供します。33個のクエリを含み、生のイベントクエリ、選択的フィルタリング、複数テーブルの結合、および事前集計クエリを網羅して、正規化されたスキーマ、選択的フィルタリング、および増分マテリアライズドビューにおけるデータベースのパフォーマンスを評価します。RTABenchは複数のデータベースをサポートしており、データベースのサポートと最適化を拡張するためにコミュニティからの貢献を歓迎しています。

続きを読む

vramfs: GPUのVRAMをファイルシステムに変換

2025-03-29
vramfs: GPUのVRAMをファイルシステムに変換

vramfsは、FUSEライブラリを利用して、GPUのVRAMにファイルシステムを作成するユーティリティです。RAMディスクに似ていますが、ビデオRAMを使用します。高負荷な用途には適していませんが、4GB以上のVRAMを搭載したコンシューマー向けGPUでは驚くほど良好に動作します。開発者は、約2.4GB/秒の読み取り速度と2.0GB/秒の書き込み速度を達成しており、RAMディスクのおよそ1/3です。メモリ管理にはOpenCLを使用し、開発の簡素化にはFUSEライブラリを使用しています。将来の改善目標は、PCI-e帯域幅の限界に到達することです。

続きを読む
開発

TypeScriptで日本語文法を学ぶ:Typed Japaneseの紹介

2025-03-29
TypeScriptで日本語文法を学ぶ:Typed Japaneseの紹介

Typed Japaneseは、TypeScriptの型システムを使って完全な日本語の文を表現できる型レベルのライブラリです。日本語の文法規則に基づいてドメイン固有言語(DSL)を作成し、TypeScriptコンパイラを使用して文法的に正しい自然言語の記述と検証を可能にします。このプロジェクトは、AIによる言語学習の中間形式も探求しており、JSONの代わりに型チェックされた表現を使用することで精度を向上させる可能性があります。動詞や形容詞の様々な活用形、句や文の構成をサポートし、日本語文法の学習と検証のための型システムの構築を目指しています。まだ初期段階であり、LLM生成の規則に依存していますが、言語学習と文法検証に対するユニークなアプローチを提供します。

続きを読む
開発

リアルタイムチェス:ターン制をなくした物理的なチェスボード

2025-03-29
リアルタイムチェス:ターン制をなくした物理的なチェスボード

ターン制チェスの長い待ち時間にうんざりしていませんか?開発者が、ターン制を完全に排除したリアルタイムの物理的なチェスボードを作成しました。各駒には個別のクールダウン時間があり、電子機器と電磁石によって強制的に適用され、不正行為を防ぎます。このプロジェクトのPCB設計とファームウェアはオープンソースですが、著者は電力供給不足や公差が厳しすぎるなどの問題点を指摘しています。

続きを読む
ハードウェア

bknd:軽量でフル機能のバックエンド、アプリ開発を簡素化

2025-03-29
bknd:軽量でフル機能のバックエンド、アプリ開発を簡素化

bkndは、データベース管理、認証、メディア、ワークフローのための完全な機能を備えたバックエンドを提供することで、アプリ開発を簡素化します。Web標準に基づいて構築されており、軽量で、選択したフレームワーク内を含むほぼどこにでも展開できます。複数の独立したサービスを展開する必要はもうありません!REST API、React SDK、認証およびメディアコンポーネント用のReact要素、使いやすい管理UIを提供します。現在も積極的に開発中(v1.0.0以前)であるため、完全な下位互換性は保証されていません。

続きを読む
開発

ESP32ベースのポモドーロタイマー:ハードウェアとソフトウェアのDIYプロジェクト

2025-03-29
ESP32ベースのポモドーロタイマー:ハードウェアとソフトウェアのDIYプロジェクト

生産性向上への追求と友人を助けるという思いから、ソフトウェアエンジニアがESP32ベースのポモドーロタイマーを設計しました。このタイマーは電子ペーパーディスプレイとロータリーエンコーダを使用し、物理的なデバイス、楽しさ、直感的な使いやすさを重視しています。プロジェクトには、ハードウェアの選定(ESP32、電子ペーパーディスプレイ、ロータリーエンコーダ、LEDなど)、ソフトウェア開発(C++、Arduinoフレームワーク、GxEPD2ライブラリ)、3Dプリントケースのデザインなどが含まれます。作者は、ディスプレイの選定、入力方法のデザイン、LEDインジケータの実装、ソフトウェアコードの管理など、設計プロセスで得られた教訓を共有しています。最終的な製品は実用性と楽しさを兼ね備えており、イースターエッグも含まれています。

続きを読む

Xilinx 7シリーズFPGA上のPCIeエンドポイント:オープンソース実装

2025-03-29
Xilinx 7シリーズFPGA上のPCIeエンドポイント:オープンソース実装

このプロジェクトは、PCIE_2_1ハードブロックとGTPトランシーバを使用して、Xilinx 7シリーズFPGA上にPCIeエンドポイントを実装します。独自のVivado IPコアを使用せず、openXC7と互換性があります。設計には、クロック生成、GTPトランシーバ、PCIE_2_1ハードブロックが含まれており、PCIe Gen1 x1とGen2 x1をサポートしています。Alinx AC7100B SoMとWavelet uSDRでテスト済みです。Dockerビルドと実行スクリプト、MSI割り込みとカーネルドライバのサポートも提供します。このプロジェクトはNGI0 Entrustによって資金提供されています。

続きを読む
ハードウェア

Postgres言語サーバー:開発者向けの強力なSQLツールチェーン

2025-03-29
Postgres言語サーバー:開発者向けの強力なSQLツールチェーン

このプロジェクトは、Postgresの独自のパーサー(libpg_query)に基づいて構築された、Postgres開発のための包括的なツールチェーンを提供します。100%の構文互換性が保証されます。トランスポート非依存の設計によるサーバークライアントアーキテクチャを採用し、LSP、CLI、HTTP API、WebAssemblyを介してアクセスできます。現在の機能には、自動補完、構文の強調表示、型チェック(EXPLAINのインサイトを使用)、リンターが含まれます。今後の開発は、これらのコア機能の強化と堅牢なインフラストラクチャの構築に焦点を当てています。貢献は大歓迎です!

続きを読む
開発

Oracle Cloudでほぼ無料でオープンソースのTURNサーバーをセルフホストする方法

2025-03-28
Oracle Cloudでほぼ無料でオープンソースのTURNサーバーをセルフホストする方法

このガイドは、サードパーティサービスに依存するWebRTC実装の代替手段として、Oracle Cloudの無料層でほぼ無料でオープンソースのTURNサーバーをセットアップする方法を詳細に説明しています。サブネット、セキュリティリスト、インスタンス構成の作成、Nginx、Certbot、PeerJSサーバー、Coturnサーバーのインストール手順を説明します。iptablesルールの構成と、認証のためのcoturn-credential-apiの使用についても説明し、WebRTC通信の完全な制御を提供し、Googleなどの大規模プロバイダーへの依存を回避することで、プライバシーとセキュリティを強化します。

続きを読む

Hexi:軽量C++23ライブラリによる安全なバイナリデータ処理

2025-03-28
Hexi:軽量C++23ライブラリによる安全なバイナリデータ処理

Hexiは、任意のソース(主にネットワークデータ)からのバイナリデータを安全に処理するための、軽量でヘッダーのみのC++23ライブラリです。手動でのバイトのコピーと本格的なシリアライゼーションライブラリの中間的な位置付けです。使いやすさ、信頼できないデータ処理時の安全性、妥当な柔軟性、オーバーヘッドの最小化を設計目標としています。カスタムコンテナ(非連続コンテナを含む)をサポートし、例外処理と境界チェックを提供します。追加機能として、バイナリファイル用のバッファタイプ、静的/動的バッファ、スレッドローカルブロックアロケーターが含まれています。

続きを読む

6502用超小型Forth:600バイト未満

2025-03-28
6502用超小型Forth:600バイト未満

この記事では、8ビットCPUである6502向けの、非常に小型化されたForthの実装について説明しています。サイズは600バイト未満です。作者は、直接スレッドコード(DTC)と最小スレッドコード(MTC)という2つのインタープリターモデルを比較し、サイズの小ささからDTCを選択しました。このプロジェクトは、パフォーマンスよりもサイズを重視しており、標準的なDTCとMTCのバリエーションを検証することを目的としています。結果として得られたForthには、コアプリミティブが含まれており、`my_hello_world.FORTH`でテストされ、その機能が実証されています。

続きを読む
開発
1 2 27 28 29 31 33 34 35 50 51