VLM Run Hub:簡素化された視覚データ抽出のための事前定義済みPydanticスキーマ
2025-02-20
VLM Run Hubは、画像、ビデオ、ドキュメントなどの非構造化視覚ドメインから構造化データを抽出するための、事前定義済みのPydanticスキーマの包括的なリポジトリです。ビジョン言語モデル(VLM)向けに設計されており、現実世界のユースケースに合わせて最適化されているため、視覚的ETLをワークフローに統合することが容易になります。請求書メタデータを抽出するための請求書スキーマなど、さまざまな事前定義済みスキーマを提供し、OpenAIのGPT-4oやAnthropicのClaude Visionなど、複数のVLMをサポートしています。Pydanticスキーマを使用することで、正確で信頼性の高いデータ抽出が保証され、下流のワークフローが簡素化されます。
開発