Le nouveau service d'extraction de documents d'Andrew Ng : défis de précision

2025-02-28
Le nouveau service d'extraction de documents d'Andrew Ng : défis de précision

Le nouveau service d'extraction de documents lancé par Andrew Ng est devenu viral sur X, mais les tests de Pulse ont révélé des problèmes importants avec les états financiers complexes, notamment plus de 50 % de valeurs hallucinées, des signes moins et des marqueurs de devises manquants. L'article soutient que ces erreurs peuvent être catastrophiques pour les secteurs qui dépendent de données précises, comme la finance. La solution de Pulse combine la vision par ordinateur traditionnelle avec des modèles de transformateur de tableau propriétaires, obtenant une précision plus élevée et une latence plus faible, en résolvant la nature non déterministe, la faible conscience spatiale et la lenteur du traitement des modèles de langage large (LLMs) dans l'extraction de documents.

Lire plus

Les LLM échouent en OCR complexe : pourquoi les grands modèles de langage ont du mal avec les PDF

2025-02-07
Les LLM échouent en OCR complexe : pourquoi les grands modèles de langage ont du mal avec les PDF

Pulse, une entreprise qui vise à extraire des données de feuilles de calcul et de PDF, a découvert une limitation critique dans l'utilisation de grands modèles de langage (LLM) pour l'OCR. Bien que les LLM excellent dans la génération de texte et la summarisation, ils échouent considérablement lorsqu'ils traitent des PDF et des tableaux complexes. La nature probabiliste des LLM et leur traitement abstrait des images conduisent à des hallucinations, à des pertes de données et à des interprétations incorrectes, ce qui représente des risques importants, notamment pour les données financières et médicales. De plus, les LLM sont vulnérables aux attaques par injection de prompt, soulevant des préoccupations de sécurité et d'éthique. Pulse a finalement abandonné les LLM pour l'OCR et développe une solution personnalisée intégrant des algorithmes traditionnels de vision par ordinateur et des transformateurs de vision.

Lire plus
Développement Extraction de Données