VLM Run Hub:簡素化された視覚データ抽出のための事前定義済みPydanticスキーマ

2025-02-20
VLM Run Hub:簡素化された視覚データ抽出のための事前定義済みPydanticスキーマ

VLM Run Hubは、画像、ビデオ、ドキュメントなどの非構造化視覚ドメインから構造化データを抽出するための、事前定義済みのPydanticスキーマの包括的なリポジトリです。ビジョン言語モデル(VLM)向けに設計されており、現実世界のユースケースに合わせて最適化されているため、視覚的ETLをワークフローに統合することが容易になります。請求書メタデータを抽出するための請求書スキーマなど、さまざまな事前定義済みスキーマを提供し、OpenAIのGPT-4oやAnthropicのClaude Visionなど、複数のVLMをサポートしています。Pydanticスキーマを使用することで、正確で信頼性の高いデータ抽出が保証され、下流のワークフローが簡素化されます。

続きを読む
開発

Postgres言語サーバー:強力なSQL開発ツールチェーン

2025-02-19
Postgres言語サーバー:強力なSQL開発ツールチェーン

Postgresのための言語ツールとLanguage Server Protocol(LSP)実装の集合で、開発者体験と信頼性の高いSQLツールを重視しています。Postgres独自のパーサー(libpg_query)をベースに構築されており、100%の構文互換性を確保しています。サーバー・クライアントアーキテクチャとトランスポート非依存の設計を採用しており、LSP、CLI、HTTP API、またはWebAssemblyを介してアクセスできます。現在、自動補完、構文の強調表示、型チェック(EXPLAIN経由)、Squawkにインスパイアされたリンターなどの機能を備えており、これらのコア機能の改良と堅牢なインフラストラクチャの構築に重点を置いています。貢献は大歓迎です!

続きを読む
開発 SQLツール

BloodFlowTrixi.jl:Juliaによる高性能血液流動モデル

2025-02-19
BloodFlowTrixi.jl:Juliaによる高性能血液流動モデル

BloodFlowTrixi.jlは、Navier-Stokes方程式から導出された、動脈循環のための1次元および2次元の血液流動モデルを実装するJuliaパッケージです。心臓血管病理に関する博士研究のために開発され、効率的な不連続ガラーキン(DG)シミュレーションのためにTrixi.jlフレームワークを活用しています。このパッケージは、曲線幾何学とコンプライアントな壁のダイナミクスをサポートしています。将来の開発には、3次元流体構造相互作用と血管ネットワークのシミュレーションが含まれます。

続きを読む

Mastra:AIアプリケーションを迅速に構築するためのTypeScriptフレームワーク

2025-02-19
Mastra:AIアプリケーションを迅速に構築するためのTypeScriptフレームワーク

Mastraは、AIアプリケーションと機能を迅速に構築するための、TypeScriptベースのフレームワークです。ワークフロー、エージェント、RAG、統合、評価といった基本的なプリミティブを提供します。ローカルマシンで実行することも、サーバーレスクラウドにデプロイすることもできます。主な機能には、LLMモデルの統合(Vercel AI SDKを介してOpenAI、Anthropic、Google Geminiをサポート)、エージェントシステム(LLMがツールを使用し、データにアクセスできるようにする)、型付きツール関数、永続的なグラフベースのワークフロー、RAGナレッジベースの構築、事前に構築されたサードパーティAPIクライアント、自動化された評価などがあります。`create-mastra`を使って開始し、`mastra dev`でPlaygroundを開きます。貢献は大歓迎です!

続きを読む

Subtrace:Dockerコンテナ用のWireshark

2025-02-19
Subtrace:Dockerコンテナ用のWireshark

Subtraceは、Dockerコンテナ向けのWiresharkのようなツールです。開発者は、バックエンドサーバーへのすべてのネットワークリクエストの送受信を確認できるため、本番環境の問題をより迅速に解決できます。コードを変更する必要がなく、すぐに使用でき、すべての言語をサポートし、完全なペイロード、ヘッダー、ステータスコード、およびレイテンシを表示し、100µs未満の性能オーバーヘッドを実現します。ClickHouseをベースとしたオープンソース(ただし、リソースの制約により、現在プルリクエストは受け付けていません)であり、機能リクエストとバグレポートを歓迎しています。

続きを読む
開発

go-msquic:MicrosoftのQUICライブラリのGoラッパー

2025-02-19
go-msquic:MicrosoftのQUICライブラリのGoラッパー

go-msquicは、MicrosoftのQUICライブラリのGoラッパーであり、Go開発者にとってHTTP/3などのQUICベースのプロトコルを操作するための使いやすいインターフェースを提供します。そのAPIはquic-goから着想を得ており、ドロップイン置換として使用できます。Cライブラリを扱うことに慣れていない限り、go-msquicよりもquic-goをお勧めします。インストールするには、最初にローカルのMsQuic Cライブラリをビルドし、その後`go get github.com/noboruma/go-msquic`でインストールします。サンプルコードはsample/ディレクトリにあります。

続きを読む
開発

OpenArc:Intelハードウェア上でLLMを高速化する軽量推論APIバックエンド

2025-02-19
OpenArc:Intelハードウェア上でLLMを高速化する軽量推論APIバックエンド

OpenArcは、OpenVINOランタイムとOpenCLドライバーを利用して、Intel CPU、GPU、NPU上でTransformersモデルの推論を高速化する軽量推論APIバックエンドです。エージェントユースケース向けに設計されており、型安全なFastAPI実装を備え、モデルのロード、アンロード、テキスト生成、ステータス問い合わせなどのエンドポイントを提供します。OpenArcは、機械学習コードとアプリケーションロジックの分離を簡素化し、Ollama、LM-Studio、OpenRouterと同様のワークフローを提供します。カスタムモデルとロールをサポートし、OpenAIプロキシ、ビジョンモデルのサポートなどの機能拡張が計画されています。

続きを読む

Augment:Vim/Neovimプラグイン、AIによるコード補完とチャット

2025-02-19
Augment:Vim/Neovimプラグイン、AIによるコード補完とチャット

Augmentは、コードベースに合わせて調整されたインラインコード補完と複数ターンチャット会話を提供するVim/Neovimプラグインをリリースしました。インストール後(Node.js 22.0.0+と互換性のあるVim/Neovimバージョンが必要です)、ワークスペースフォルダを追加してAugmentサービスにサインインします。タイプするとコンテキスト認識コード補完が表示されます。`:Augment chat`コマンドを使用して、AIによるコードに関するディスカッションを行います。このプラグインは、ステータス管理、ログイン/ログアウト、サジェスチョン有効化/無効化、ログの表示、新しいチャット会話の開始などのコマンドを提供します。`.augmentignore`は、大規模プロジェクトの管理に役立ちます。サジェスチョンの受け入れに関するキーバインドを簡単にカスタマイズできます。

続きを読む

大規模言語モデルはSetゲームに失敗、推論モデルが勝利

2025-02-19
大規模言語モデルはSetゲームに失敗、推論モデルが勝利

大規模言語モデル(LLM)の推論能力をカードゲームSetでテストする実験が行われました。Setは、12枚のカードから形状、色、数、陰影に関する特定のルールに基づいて3枚のカードのセットを特定するゲームです。GPT-4o、Sonnet-3.5、MistralなどのLLMは、正しいセットを首尾一貫して特定できず、多くの場合、無効な組み合わせを提案したり、セットが存在しないと主張したりしました。しかし、DeepThink-R1やo3-miniなどの新しい推論モデルは、問題を解決し、優れた論理的推論能力を示しました。これは、LLMが自然言語処理では優れているものの、複雑な論理的タスクには限界があることを示しており、専門的な推論モデルが明確な利点を持つことを示しています。

続きを読む

RustOwl:Rustにおける所有権とライフタイムの可視化

2025-02-18
RustOwl:Rustにおける所有権とライフタイムの可視化

RustOwlは、Rustコードにおける変数の所有権とライフタイムを可視化する強力なツールです。色分けされた下線を使用して、変数のライフタイム、不変の借用、可変の借用、値の移動などを直感的に表示し、デバッグと最適化を支援します。VSCode、Neovim、Emacsなどのエディタをサポートし、コマンドラインによる簡単なインストールとソースコードからの手動インストールなど、さまざまなインストール方法を提供しています。表示上の軽微な問題が発生することがありますが、RustOwlはRust開発効率の向上に大きな可能性を示しています。

続きを読む
開発

mt32-pi開発がオンラインでの嫌がらせにより中止

2025-02-17
mt32-pi開発がオンラインでの嫌がらせにより中止

Raspberry Pi用のローランドMT-32オーディオモジュールをエミュレートするベアメタルMIDIシンセサイザーであるmt32-piの開発者が、継続的なオンラインでの嫌がらせによりプロジェクトの終了を発表しました。これには、個人的な攻撃、コードの盗用、3Dプリントデザインの盗難などが含まれます。開発者は、精神的な健康への悪影響を理由に開発を中止すると述べ、コミュニティからの感謝と励ましの不足を訴えました。

続きを読む

NESでELKSを実行する:NES86プロジェクト

2025-02-17
NESでELKSを実行する:NES86プロジェクト

NES86プロジェクトは驚くべきエンジニアリングの成果です。NES上で動作するIBM PCエミュレータです!Intel 8086プロセッサと対応するPCハードウェアをエミュレートすることで、シェルやユーティリティを含むELKS(Embeddable Linux Kernel Subset)を正常に実行します。つまり、古いNESで一部のx86ソフトウェアを実行できます(ただし、シンプルなシリアルターミナルに制限されます)。このプロジェクトはオープンソースであり、ELKSイメージのコンパイルとNES86 ROMの生成を網羅した詳細なビルド手順を提供しています。レトロなハードウェアで最新のOSを実行するという挑戦に備えましょう!

続きを読む
開発

大規模言語モデルR1の思考プロセスの可視化

2025-02-17
大規模言語モデルR1の思考プロセスの可視化

研究者らは、大規模言語モデルR1の「思考プロセス」を可視化するために、思考の連鎖をテキストとして保存し、OpenAI APIを使用して埋め込みに変換し、t-SNEを用いて時系列的にプロットしました。連続したステップ間の余弦類似度を計算することにより、「検索」、「思考」、「結論」という3段階のプロセスが示唆されました。自転車の仕組みの説明から新しい輸送手段の設計まで、10個の多様なプロンプトが使用されました。研究者らは、思考連鎖データとコードへのアクセス方法を提供しています。

続きを読む

Bag of Words:AIでスマートデータアプリを構築・共有

2025-02-17
Bag of Words:AIでスマートデータアプリを構築・共有

Bag of Wordsは、ユーザーが単一のプロンプトから包括的なダッシュボードを作成し、反復的に改良することを可能にする強力なツールです。データベース、API、ビジネスシステムなど、さまざまなデータソースとシームレスに統合し、効率的なデータ活用を実現します。主な機能には、自然言語クエリ、ダッシュボード管理、複数のLLM(OpenAI、Anthropicなど)との互換性などがあります。このプロジェクトは、Dockerによるデプロイと、PythonおよびNode.js環境の詳しいセットアップ手順を提供しており、AGPL-3.0ライセンスを使用しています。

続きを読む

Umami:プライバシー重視のGoogle Analytics代替ツール

2025-02-17
Umami:プライバシー重視のGoogle Analytics代替ツール

Umamiは、シンプルで高速、プライバシー重視のGoogle Analytics代替ツールです。MariaDB、MySQL、PostgreSQLデータベースに対応しています。インストールは簡単で、GitHubリポジトリのクローン作成、依存関係のインストール、データベース接続の設定を行うだけです。デフォルトではhttp://localhost:3000で起動します。Dockerイメージも利用可能です。詳細な入門ガイドも提供されています。

続きを読む
開発

シェルコマンド効率化ハック:アイコンで過去の履歴を素早く特定

2025-02-16
シェルコマンド効率化ハック:アイコンで過去の履歴を素早く特定

シェル履歴でコマンドを何度も検索して再実行していませんか?著者は賢い方法を共有しています。コマンドの前にアイコンやテキスト識別子を追加するのです(例:✅; ./utils/check.sh)。これらの識別子はコマンドの実行には影響しませんが、視覚的な認識を大幅に向上させ、目的のコマンドを素早く見つけることができ、履歴を何度もスクロールするストレスを軽減します。シェル効率を向上させるシンプルながらも効果的な方法です。

続きを読む

Remco:軽量な構成管理ツール

2025-02-16
Remco:軽量な構成管理ツール

Remcoは、confdにインスパイアされた軽量な構成管理ツールです。etcdやConsulなどのキーバリューストアからデータを使用して、ローカルの構成ファイルを最新の状態に保ち、テンプレートリソースを処理し、アプリケーションを自動的に再ロードします。confdとは異なり、Remcoはテンプレートリソースごとに複数のソース/デスティネーションペアとバックエンドをサポートし、Pongo2テンプレートエンジンを使用し、ゾンビプロセスの処理、追加のバックエンドのためのプラグインサポート、JavaScriptを使用した簡単なカスタムテンプレートフィルターの作成などの機能が含まれています。インストールは簡単で、ソースコードからのビルドまたは事前にビルドされたバイナリのダウンロードが可能です。

続きを読む
開発 構成管理

Gixy:Nginx設定のセキュリティ監査ツール

2025-02-16
Gixy:Nginx設定のセキュリティ監査ツール

Gixyは、Nginxの設定を分析して、セキュリティ上の誤設定を防ぎ、欠陥検出を自動化するツールです。Python 3.6~3.13をサポートし、主にGNU/Linuxシステムでテストされています。Gixyは、HTTP分割脆弱性などの様々なNginx設定の問題を検出します。インストール方法は柔軟で、pip、yum、Dockerに対応しています。ユーザーは設定ファイルのパスを指定したり、パイプ入力を使用したり、テストをスキップしたりできます。Gixyは積極的にメンテナンスされており、コードへの貢献とドキュメントの改善を歓迎しています。

続きを読む
開発 監査

メキシコ湾:ルールを破るプログラミング言語

2025-02-16
メキシコ湾:ルールを破るプログラミング言語

DreamBerdはメキシコ湾という名前になり、独特で風変わりなプログラミング言語になりました。文は感嘆符で終わり、セミコロンは「not」演算子、宣言は4種類(const const、const var、var const、var var)、配列はインデックス-1から始まり、浮動小数点インデックスもサポート、`when`キーワードで変数の変化をチェック、ガベージコレクタ搭載、変数のライフサイクルはカスタマイズ可能(ホイスティングのための負のライフサイクルを含む)、ループは存在しません。インストールは複雑で、ブール値はtrue、false、maybeの3種類、空白は算術演算の優先順位を決定、分数と数字の名前をサポート、インデントは厳密に3スペース、複数の比較演算子、柔軟な関数宣言、ゼロ除算はundefinedを返す、文字列の宣言方法は複数、地域通貨の補間をサポート、型アノテーションは任意、正規表現の型をサポート、`previous`、`next`、`current`キーワードで変数の履歴にアクセスできます。コードは5つ以上の等号で複数のファイルに分割可能、コードの反転、グローバル変数、感嘆符、括弧、引用符の自動挿入をサポート。メキシコ湾はリッチテキストと非同期関数のターンベース実行メカニズムもサポートしています。

続きを読む

OmniParser V2:純粋なビジョンベースGUIエージェントのためのスクリーンパースツール

2025-02-15
OmniParser V2:純粋なビジョンベースGUIエージェントのためのスクリーンパースツール

OmniParserは、ユーザーインターフェースのスクリーンショットを構造化され、理解しやすい要素に解析するための包括的な方法であり、GPT-4Vがインターフェースの対応する領域に正確に根拠を置くアクションを生成する能力を大幅に向上させます。最近リリースされたOmniParser V2は、Screen Spot Proベンチマークで最先端の結果(39.5%)を達成し、OmniToolを導入し、選択したビジョンモデルを使用してWindows 11仮想マシンを制御できます。詳細なインストール手順とデモが提供され、モデルの重みはHugging Faceで入手できます。

続きを読む

Schemesh:Lispでスクリプト可能なUnixシェル

2025-02-15
Schemesh:Lispでスクリプト可能なUnixシェル

Schemeshは、Lispでスクリプト可能な対話型シェルで、bash、zshなどの従来のUnixシェルの使いやすい代替として設計されています。対話型の行編集、自動補完、履歴を提供し、複雑なタスクのためにChez Schemeを搭載した完全なLisp REPLをシームレスに統合しています。ユーザーはシェル構文とLisp構文を簡単に切り替えでき、Unixプロセスの管理のための豊富な関数が提供されています。スクリプトや本格的なプログラミングでは、Schemeshは遅くてエラーが発生しやすい従来のシェルスクリプトを、強力なLisp REPLに置き換え、効率性と信頼性を向上させます。

続きを読む
開発

Jill:Nand2Tetrisプラットフォーム向けの新規関数型プログラミング言語

2025-02-15
Jill:Nand2Tetrisプラットフォーム向けの新規関数型プログラミング言語

Jillは、元のJack高級言語の代替として、Nand2Tetrisプラットフォーム向けに構築された関数型プログラミング言語です。Jackと同じVM命令セットと基盤となるHACKアーキテクチャを使用し、置き換えとして機能しますが、よりエレガントで関数的なスタイルを提供します。主な機能には、一等関数、最適化された末尾再帰、パターンマッチングによる代数的データ型、そして3つの主要な概念のみを持つ最小限のデザインが含まれます。コンパイルされたプロジェクトは、/binディレクトリに.vmファイルを出力します。Jillは`cargo run -- path_to_jill_project_root`または`jillc [path_to_jill_project_root]`を使用してコンパイルできます。

続きを読む
開発

Synergetica:エンドツーエンドの遺伝子回路設計デスクトップアプリ

2025-02-15
Synergetica:エンドツーエンドの遺伝子回路設計デスクトップアプリ

Synergeticaは、遺伝子回路設計のための強力なデスクトップアプリケーションです。回路設計、シミュレーション、DNAシーケンス生成のエンドツーエンドワークフローを単一のプラットフォームで提供します。ノードベースまたはコードベースのインターフェースを使用して遺伝子回路を設計し、タンパク質発現レベルをインタラクティブにシミュレートし、シミュレーションで決定されたパラメーターに基づいてDNAシーケンスを生成できます。ニーズに合った遺伝子部品を追加して回路をカスタマイズし、完全にオフラインで作業して、完全な制御とプライバシーを確保できます。

続きを読む

Kreuzberg:強力なローカルドキュメントテキスト抽出Pythonライブラリ

2025-02-15
Kreuzberg:強力なローカルドキュメントテキスト抽出Pythonライブラリ

Kreuzbergは、様々なドキュメントからテキストを抽出するための強力なPythonライブラリです。PDF、画像、オフィスドキュメントなど、多くの形式をサポートする統一された非同期インターフェースを提供します。このライブラリはローカル処理に重点を置いており、外部APIやクラウドサービスに依存しません。リソース効率が高く、依存関係も少なく、バッチ処理にも対応しています。Kreuzbergは、PDFテキスト抽出に対してスマートなアプローチを採用しており、まず直接テキストの抽出を試み、失敗した場合はOCRに自動的にフォールバックします。非同期/同期のAPI、メタデータ抽出、並列処理などの包括的な機能とエラー処理を提供します。

続きを読む

Goku:フローベースの動画生成基盤モデル

2025-02-15
Goku:フローベースの動画生成基盤モデル

ByteDanceと香港大学の共同チームが、修正フローTransformerに基づく画像と動画の生成モデルファミリーであるGokuを発表しました。Gokuは、綿密なデータキュレーション、高度なモデル設計、フローの定式化により、業界をリードするビジュアル生成パフォーマンスを実現しています。テキストから動画、画像から動画、テキストから画像の生成をサポートし、GenEval、DPG-Bench、VBenchなどの主要なベンチマークでトップスコアを獲得しています。特にGoku-T2VはVBenchで84.85点を獲得し、2024年10月7日時点で2位にランクインしており、いくつかの主要な商用テキストから動画モデルを上回っています。

続きを読む

LLM Debugger:VS CodeにおけるAI支援デバッグ

2025-02-15
LLM Debugger:VS CodeにおけるAI支援デバッグ

LLM Debuggerは、大規模言語モデル(LLM)を用いたアクティブなデバッグを行うVS Code拡張機能です。静的なソースコードのみを分析する従来のLLMベースのデバッグアプローチとは異なり、LLM Debuggerは変数値、関数動作、分岐決定など、リアルタイムのランタイムコンテキストを提供し、LLMによるバグの診断をより迅速かつ正確に行うことができます。この拡張機能は、実行の詳細をキャプチャすることにより合成データも生成し、プログラム動作に関する独自の洞察を提供します。ライブデバッグ情報、自動ブレークポイント管理、ランタイム検査、一般的なデバッグ操作を備えており、すべてサイドバーパネルからアクセスできます。実験的な研究プロジェクトではありますが、LLM Debuggerは、ライブデバッグデータとLLM機能を組み合わせることで、従来のデバッグ手法に革命を起こす可能性を示しています。

続きを読む

Rust製高速視覚的PingツールNping

2025-02-15
Rust製高速視覚的PingツールNping

Rustで書かれた強力なPingツールNpingは、複数のアドレスへの同時Ping、リアルタイムデータの視覚化、ユーザーフレンドリーなインターフェースを提供します。最大、最小、平均レイテンシ、パケットロス率などの主要なメトリクスを表示し、IPv4とIPv6の両方をサポートしています。Npingには、ドメイン名に対応するIPアドレスの詳細を表示するホストサブコマンドもあり、Ping回数と間隔をカスタマイズできます。直感的な設計により、ネットワーク管理者と開発者の両方に役立つツールとなっています。

続きを読む

VimLM:VimのためのローカルLLM搭載コーディングアシスタント

2025-02-15
VimLM:VimのためのローカルLLM搭載コーディングアシスタント

VimLMは、GitHub Copilotを参考に開発された、Vim用のローカルLLM搭載コーディングアシスタントです。コンテキストを理解したコードの理解、要約、AIアシスタンスをVimのワークフローに直接統合します。MLX互換モデルを使用でき、VimネイティブのUX、完全オフライン動作による高いセキュリティを備えています。直感的なキーバインディングで、コード変換、生成、要約などのタスクを実行し、現在のファイル、選択範囲、参照ファイル、プロジェクト構造など、深いコンテキストを理解します。

続きを読む

Yash:究極のPOSIX準拠を目指す新しいシェル

2025-02-15
Yash:究極のPOSIX準拠を目指す新しいシェル

YashはC99で記述された、POSIX準拠を目指すコマンドラインシェルです。グローバルエイリアス、配列、様々なリダイレクト方法、ブレース展開、拡張グロービング、分数演算、コマンド補完、コマンド予測などの機能を備えています。GitHubでメンテナンスされており、POSIX.1-2008のほとんどの要件を満たしており、定期的にメンテナンスアップデートがリリースされます。様々なPOSIX環境でビルドおよび実行でき、現在Fedora、macOS、Cygwinで主にテストされています。インストール後、設定ファイルで環境変数、エイリアス、プロンプトなどをカスタマイズできます。

続きを読む
開発

ブラウザ拡張機能:トランスジェンダーの抹消に反対

2025-02-14
ブラウザ拡張機能:トランスジェンダーの抹消に反対

「Marsha P Johnson」というブラウザ拡張機能は、「LGB」を「LGBTQ+🧱」に置き換えることで、トランスジェンダーの抹消に対抗します。開発者は、米国政府が政府ウェブサイトからトランスジェンダーに関する記述を積極的に削除していること、ストーンウォール国立記念碑のウェブサイトからも「TQ+」が削除されていることを強調しています。この露骨な抹消行為は、この拡張機能によって積極的に対抗され、ユーザーは検閲に気づき、抗議することができます。

続きを読む
その他
1 2 35 36 37 39 41 42 43 50 51