Andrew Ngs neuer Dokumentenextraktionsservice: Herausforderungen bei der Genauigkeit
Andrew Ngs neu veröffentlichter Dokumentenextraktionsservice wurde auf X viral, aber Tests von Pulse zeigten erhebliche Probleme bei komplexen Finanzberichten, darunter über 50 % halluzinierte Werte, fehlende Minuszeichen und Währungssymbole. Der Artikel argumentiert, dass solche Fehler für Branchen, die auf präzise Daten angewiesen sind, wie z. B. die Finanzbranche, katastrophale Folgen haben können. Die Lösung von Pulse kombiniert traditionelle Computer-Vision-Algorithmen mit proprietären Tabellen-Transformer-Modellen und erreicht so eine höhere Genauigkeit und niedrigere Latenz. Dies behebt die nicht-deterministische Natur, das schlechte räumliche Bewusstsein und die langsame Verarbeitungsgeschwindigkeit von LLMs bei der Dokumentenextraktion.