llama-scan: Conversión de PDF a Texto con Ollama
2025-08-18
llama-scan es una herramienta que aprovecha Ollama para convertir archivos PDF a archivos de texto localmente, eliminando los costos de tokens. Utiliza los modelos multimodales más recientes de Ollama, permitiendo descripciones de texto detalladas de imágenes y diagramas. La instalación es sencilla: instala Ollama y luego llama-scan usando pip o uv. Las características incluyen directorios de salida personalizados, selección de modelos, opciones para conservar los archivos de imagen intermedios, ancho de imagen ajustable y especificación de rangos de páginas para una extracción eficiente de texto de PDF.
Desarrollo