Novo serviço de extração de documentos de Andrew Ng: desafios de precisão

2025-02-28
Novo serviço de extração de documentos de Andrew Ng: desafios de precisão

O novo serviço de extração de documentos lançado por Andrew Ng viralizou no X, mas testes da Pulse revelaram problemas significativos com demonstrações financeiras complexas, incluindo mais de 50% de valores alucinados, sinais de menos e marcadores de moeda ausentes. O artigo argumenta que esses erros podem ser catastróficos para setores que dependem de dados precisos, como o financeiro. A solução da Pulse combina visão computacional tradicional com modelos de transformador de tabela proprietários, alcançando maior precisão e menor latência, resolvendo a natureza não determinística, a baixa consciência espacial e a lentidão do processamento de LLMs na extração de documentos.

Leia mais

LLMs falham em OCR complexo: Por que modelos de linguagem grandes têm dificuldades com PDFs

2025-02-07
LLMs falham em OCR complexo: Por que modelos de linguagem grandes têm dificuldades com PDFs

A Pulse, uma empresa que visa extrair dados de planilhas e PDFs, descobriu uma limitação crítica no uso de Modelos de Linguagem Grandes (LLMs) para OCR. Embora os LLMs se destaquem na geração de texto e resumo, eles falham significativamente ao lidar com PDFs e tabelas complexas. A natureza probabilística dos LLMs e seu processamento abstrato de imagens levam a alucinações, perda de dados e interpretações incorretas, representando riscos significativos, especialmente com dados financeiros e médicos. Além disso, os LLMs são vulneráveis a ataques de injeção de prompt, levantando preocupações de segurança e éticas. A Pulse acabou abandonando os LLMs para OCR e está desenvolvendo uma solução personalizada que integra algoritmos tradicionais de visão computacional e transformadores de visão.

Leia mais
Desenvolvimento Extração de Dados