VLM Run Hub:预定义 Pydantic 模式,简化视觉数据提取
2025-02-20
VLM Run Hub是一个综合性的预定义Pydantic模式仓库,用于从图像、视频和文档等非结构化视觉领域提取结构化数据。它专为视觉语言模型(VLM)设计,并针对实际用例进行了优化,简化了视觉ETL与工作流程的集成。该平台提供各种预定义模式,例如用于提取发票元数据的Invoice模式,并支持多种VLM,例如OpenAI的GPT-4o和Anthropic的Claude Vision。通过使用Pydantic模式,可以确保数据提取的准确性和可靠性,并简化后续工作流程。
开发