VLM Run Hub: Esquemas Pydantic predefinidos para una extracción simplificada de datos visuales
2025-02-20
VLM Run Hub es un repositorio completo de esquemas Pydantic predefinidos para extraer datos estructurados de dominios visuales no estructurados como imágenes, videos y documentos. Diseñado para modelos de lenguaje visual (VLMs) y optimizado para casos de uso del mundo real, simplifica la integración de ETL visual en sus flujos de trabajo. Ofrece varios esquemas predefinidos, como un esquema de Factura para extraer metadatos de facturas, y admite varios VLMs, incluidos GPT-4o de OpenAI y Claude Vision de Anthropic. El uso de esquemas Pydantic garantiza la extracción precisa y confiable de datos y simplifica los flujos de trabajo posteriores.
Desarrollo
Modelos de Lenguaje Visual