VLM Run Hub: Esquemas Pydantic pré-definidos para extração simplificada de dados visuais
2025-02-20
O VLM Run Hub é um repositório abrangente de esquemas Pydantic pré-definidos para extrair dados estruturados de domínios visuais não estruturados, como imagens, vídeos e documentos. Projetado para modelos de linguagem visual (VLMs) e otimizado para casos de uso do mundo real, ele simplifica a integração do ETL visual em seus fluxos de trabalho. Oferece vários esquemas predefinidos, como um esquema de Fatura para extrair metadados de faturas, e suporta vários VLMs, incluindo GPT-4o do OpenAI e Claude Vision do Anthropic. O uso de esquemas Pydantic garante a extração precisa e confiável de dados e simplifica os fluxos de trabalho a jusante.
Desenvolvimento
Modelos de Linguagem Visual