VLM Run Hub : Schémas Pydantic prédéfinis pour une extraction simplifiée des données visuelles
2025-02-20
VLM Run Hub est un référentiel complet de schémas Pydantic prédéfinis pour extraire des données structurées à partir de domaines visuels non structurés tels que les images, les vidéos et les documents. Conçu pour les modèles de langage visuel (VLM) et optimisé pour les cas d'utilisation réels, il simplifie l'intégration de l'ETL visuel dans vos workflows. Il offre divers schémas prédéfinis, tels qu'un schéma de facture pour extraire les métadonnées des factures, et prend en charge plusieurs VLM, notamment GPT-4o d'OpenAI et Claude Vision d'Anthropic. L'utilisation de schémas Pydantic garantit une extraction précise et fiable des données et simplifie les workflows en aval.
Développement
Modèles de Langage Visuel