Benchmark de código abierto para OCR y extracción de datos de LLM

2025-04-01
Benchmark de código abierto para OCR y extracción de datos de LLM

Omni es una herramienta de evaluación comparativa de código abierto que compara las capacidades de OCR y extracción de datos de varios modelos multimodales grandes como gpt-4o, evaluando la precisión de la extracción de texto y JSON. Este benchmark proporciona una evaluación exhaustiva de la precisión del OCR en proveedores tradicionales de OCR y LLM. El conjunto de datos y las metodologías son de código abierto, lo que fomenta las contribuciones y la expansión. El benchmark se centra en la extracción de JSON, midiendo la precisión de toda la canalización: Documento ⇒ OCR ⇒ Extracción. Utiliza un json-diff modificado para la precisión de JSON y la distancia de Levenshtein para la similitud de texto. La herramienta admite varios modelos, incluidos OpenAI, Google Gemini y Anthropic, con una interfaz simple de línea de comandos y salida JSON.

Leer más
Desarrollo

TopoSort: Una biblioteca Zig altamente eficiente para ordenación topológica

2025-04-01
TopoSort: Una biblioteca Zig altamente eficiente para ordenación topológica

TopoSort es una biblioteca Zig altamente eficiente para realizar la ordenación topológica en grafos de dependencia. Incluye funciones como la construcción de grafos de dependencia, la ordenación topológica, la generación de subconjuntos sin dependencias para el procesamiento paralelo, la detección e informe de ciclos y el soporte para varios tipos de nodos. Una herramienta de interfaz de línea de comandos, `toposort-cli`, simplifica su uso. El rendimiento se optimiza estableciendo el parámetro `max_range`, lo que puede acelerar la construcción del árbol de dependencias entre 3 y 4 veces. TopoSort tiene licencia MIT.

Leer más

RubyUI: Biblioteca de componentes de IU para Rails ultrarrápida

2025-04-01
RubyUI: Biblioteca de componentes de IU para Rails ultrarrápida

RubyUI (anteriormente PhlexUI) es una biblioteca de componentes de IU para Rails construida con Phlex, ofreciendo velocidades hasta 12 veces más rápidas que las plantillas ERB tradicionales. Ofrece una colección de componentes reutilizables y personalizables que puedes copiar y pegar directamente en tus aplicaciones. RubyUI enfatiza el diseño limpio, los componentes bien organizados y las amplias opciones de personalización, con documentación y ejemplos exhaustivos. Utiliza controladores Stimulus.js personalizados, minimizando las dependencias, lo que permite la creación fácil de interfaces de aplicaciones Rails eficientes y atractivas.

Leer más
Desarrollo

Controla tu teléfono Android con IA: codifica tus comandos

2025-04-01
Controla tu teléfono Android con IA: codifica tus comandos

El proyecto de código abierto `mobile-use` te permite controlar tu teléfono Android usando IA. Simplemente escribe comandos como "Abre Instagram y envía un mensaje", y el proyecto los ejecuta usando tus herramientas SDK de Android instaladas localmente (adb). Admite modelos LLM personalizados y ofrece métodos de entrada de línea de comandos y archivos, lo que te permite enviar instrucciones fácilmente desde la terminal o un archivo. El proyecto está licenciado bajo la Licencia MIT.

Leer más
Desarrollo

Una biblioteca PubSub minimalista de 149 bytes

2025-04-01
Una biblioteca PubSub minimalista de 149 bytes

Este artículo presenta una biblioteca PubSub minimalista con solo 149 bytes, prácticamente sin dependencias. Se compara con competidores como nano-pubsub (194 bytes) y tiny-pubsub (401 bytes), destacando su tamaño extremadamente pequeño. Construida usando EventTarget, el código es claro y conciso, e incluye definiciones de tipo TypeScript. El autor anima a las contribuciones para reducir aún más el tamaño de la biblioteca.

Leer más
Desarrollo biblioteca ligera

KOReader: Un potente lector de libros electrónicos multiplataforma

2025-04-01
KOReader: Un potente lector de libros electrónicos multiplataforma

KOReader es un visor de documentos diseñado principalmente para lectores de tinta electrónica, compatible con numerosos formatos (PDF, EPUB, MOBI, etc.) y dispositivos (Kindle, Kobo, etc.). Ofrece una vista de lectura altamente personalizable, soporte multilingüe, integración con herramientas como Calibre y optimizaciones para tinta electrónica para un volteo de página rápido. Extensible mediante plugins, KOReader está desarrollado y mantenido por una comunidad global de voluntarios.

Leer más

Superalimenta tus pipelines de Airflow con LLMs: el Apache Airflow AI SDK

2025-03-31
Superalimenta tus pipelines de Airflow con LLMs: el Apache Airflow AI SDK

Este SDK de IA de Apache Airflow, basado en Pydantic AI, te permite integrar sin problemas modelos de lenguaje grandes (LLMs) en tus flujos de trabajo de Airflow. Usando tareas basadas en decoradores (@task.llm, @task.llm_branch, @task.agent), simplifica las llamadas a LLM y la orquestación de agentes. El soporte para varios modelos (OpenAI, Anthropic, etc.), el análisis automático de salida y las capacidades de ramificación de DAG hacen que tus pipelines de datos sean más inteligentes y eficientes.

Leer más
Desarrollo

guMCP: Colección de servidores de protocolo de contexto de modelo unificado de código abierto de Gumloop

2025-03-31
guMCP: Colección de servidores de protocolo de contexto de modelo unificado de código abierto de Gumloop

Gumloop ha lanzado guMCP, una colección de código abierto de servidores de Protocolo de Contexto de Modelo (MCP) que se pueden ejecutar tanto local como remotamente. El objetivo es crear la colección más grande de servidores MCP unificados, fomentando una comunidad en torno a las integraciones de IA y el futuro de la IAG. Con soporte para transportes stdio y SSE, guMCP incluye servidores para sistemas de archivos, bases de datos, herramientas de desarrollo, automatización web y mucho más, animando las contribuciones de la comunidad. Licenciado bajo GPL-3.0, la seguridad es la máxima prioridad, con cumplimiento de SOC 2 Tipo II, GDPR e HIPAA.

Leer más
Desarrollo

Controla WhatsApp con Claude: Un servidor WhatsApp MCP

2025-03-31
Controla WhatsApp con Claude: Un servidor WhatsApp MCP

Este proyecto integra WhatsApp con el modelo de lenguaje grande (LLM) Claude. Un puente Go se conecta a la API multidispositivo web de WhatsApp, almacenando mensajes localmente en una base de datos SQLite. Un servidor Python implementa el Protocolo de Contexto del Modelo (MCP), permitiendo que Claude busque mensajes, contactos y envíe mensajes a través de un conjunto de herramientas. Todo el procesamiento es local, priorizando la privacidad del usuario.

Leer más
Desarrollo

¡Instalación de Windows 9x a Velocidad Relámpago: 90 Segundos o Menos!

2025-03-31
¡Instalación de Windows 9x a Velocidad Relámpago: 90 Segundos o Menos!

¿Cansado de las lentas instalaciones de Windows 98? ¡Windows 9x QuickInstall ha llegado! Este proyecto utiliza Linux y un instalador personalizado para empaquetar un sistema Windows 98 ya instalado en una imagen ISO optimizada, permitiendo la instalación en aproximadamente 60-90 segundos. Es compatible con Windows 98, Windows 98 SE y Windows ME, y permite la adición flexible de controladores y herramientas. Si bien la creación de la ISO es más compleja que usar nLite, la mayor capacidad de personalización lo hace perfecto para usuarios que priorizan la velocidad y las instalaciones altamente personalizadas.

Leer más

Ambermoon Advanced: Una Expansión RPG Masivo Lanzada en Episodios

2025-03-31
Ambermoon Advanced: Una Expansión RPG Masivo Lanzada en Episodios

El desarrollador independiente Pyrdacor está lanzando Ambermoon Advanced, una expansión no oficial para el RPG Ambermoon, en episodios. Se planean cinco episodios, con los tres primeros disponibles actualmente, que incluyen contenido como "Misterios del Mar" y "Criaturas Elementales". El juego funciona en Amiga y sistemas modernos, aunque la versión Amiga aún está en desarrollo. El desarrollador señala que el juego está en progreso y puede contener errores y desequilibrios. También se planea un manual físico, que contendrá información del juego y la historia de Ambermoon.

Leer más

Blue95: Una experiencia de escritorio nostálgica de los 90

2025-03-30
Blue95: Una experiencia de escritorio nostálgica de los 90

Blue95 ofrece una experiencia de escritorio ligera que recuerda a la década de 1990, construida sobre Fedora Atomic Xfce con el tema Chicago95. Si bien el instalador incluido todavía está en versión alfa, el método de instalación recomendado es la rebase desde otro escritorio Fedora Atomic, como winblues/vauxite. Blue95 prioriza la usabilidad y accesibilidad sobre la replicación exacta de sistemas operativos antiguos, incorporando mejoras de Universal Blue (códecs, actualizaciones automáticas, etc.) para una mejor experiencia lista para usar. También hay disponible una ISO en vivo para probar sin instalación.

Leer más
Desarrollo Escritorio Retro

El depurador rr recibe una actualización importante: Modo de contadores de software

2025-03-30
El depurador rr recibe una actualización importante: Modo de contadores de software

El depurador rr ahora cuenta con un modo de contadores de software, lo que le permite ejecutarse sin acceso a los contadores de rendimiento de hardware de la CPU, superando las limitaciones en máquinas virtuales en la nube y contenedores. Este modo utiliza instrumentación dinámica y estática ligera para lograr la funcionalidad de grabación y reproducción, simplificando los flujos de trabajo de depuración. La publicación del blog del autor detalla los principios de la tecnología de grabación y reproducción, destaca las ventajas del depurador rr y comparte su trayectoria de desarrollo.

Leer más
Desarrollo

PG-MCP: Servidor mejorado del Protocolo de Contexto de Modelo para PostgreSQL

2025-03-30
PG-MCP: Servidor mejorado del Protocolo de Contexto de Modelo para PostgreSQL

PG-MCP es un servidor de Protocolo de Contexto de Modelo (MCP) para bases de datos PostgreSQL, que ofrece capacidades mejoradas para agentes de IA. Se basa en la implementación de referencia de Postgres MCP, añadiendo soporte para múltiples bases de datos, metadatos enriquecidos que incluyen extensiones PostGIS y pgvector, herramientas de análisis de planes de consulta y una gestión robusta de conexiones. Implementable a través de Docker o un entorno virtual, los desarrolladores pueden interactuar con PG-MCP utilizando el cliente Python proporcionado, e incluso aprovechar modelos de lenguaje grandes como Claude para la conversión de lenguaje natural a SQL.

Leer más
Desarrollo

msgpack23: Una Biblioteca C++ Moderna para MessagePack

2025-03-30
msgpack23: Una Biblioteca C++ Moderna para MessagePack

msgpack23 es una biblioteca C++ ligera y solo de encabezado para serializar y deserializar datos al formato MessagePack. Aprovechando las características modernas de C++ (C++20 y posteriores), ofrece una solución flexible y sin dependencias, que admite varios tipos de datos, incluidos contenedores STL, objetos de punto de tiempo y tipos personalizados. Su API simple, enfoque en el rendimiento y extensibilidad la convierten en una herramienta poderosa para el manejo eficiente de datos.

Leer más
Desarrollo

xan: Herramienta CLI ultrarrápida para el procesamiento de CSV

2025-03-29
xan: Herramienta CLI ultrarrápida para el procesamiento de CSV

xan es una herramienta de línea de comandos escrita en Rust para el procesamiento ultrarrápido de archivos CSV masivos (gigabytes!). Aprovechando el multithreading para el paralelismo, maneja fácilmente tareas como la previsualización, el filtrado, el corte, la agregación, la clasificación y la unión de datos CSV. xan cuenta con un potente lenguaje de expresiones que supera la velocidad de Python, Lua o JavaScript para operaciones complejas. Originalmente bifurcado de xsv, pero reescrito extensamente, xan satisface las necesidades de análisis de datos de las ciencias sociales, incluyendo la lexicometría, la teoría de grafos e incluso el web scraping. La instalación es sencilla a través de cargo, Homebrew, pacman, Nix o binarios precompilados.

Leer más
Desarrollo procesamiento CSV

JobHuntr: Automatiza tus solicitudes de empleo en LinkedIn con IA

2025-03-29
JobHuntr: Automatiza tus solicitudes de empleo en LinkedIn con IA

JobHuntr.fyi es una aplicación de escritorio macOS que utiliza IA con tecnología Ollama para solicitar automáticamente empleos en LinkedIn, 24/7, sin necesidad de una clave de API de OpenAI. Se enfoca en empleos con la opción "Fácil de aplicar" (alrededor del 70% de las ofertas), gestionando hasta 25 solicitudes diarias. La IA rellena inteligentemente las solicitudes basándose en tu currículum y preguntas frecuentes, verificando cuidadosamente la información. Las preguntas inciertas se guardan en tus preguntas frecuentes y las solicitudes se omiten. Diseñado para imitar el comportamiento humano y usando tu dirección IP, minimiza el riesgo de que LinkedIn detecte la automatización.

Leer más

LVGL: Biblioteca gráfica integrada ligera y versátil

2025-03-29
LVGL: Biblioteca gráfica integrada ligera y versátil

LVGL es una biblioteca gráfica integrada de código abierto popular para crear interfaces de usuario atractivas para cualquier MCU, MPU y tipo de pantalla. Cuenta con más de 30 widgets integrados, un potente sistema de estilos, administradores de diseño inspirados en la web y admite varios idiomas. Requiere recursos mínimos (32 kB de RAM y 128 kB de Flash), lo que simplifica el desarrollo de la IU. El equipo de LVGL también ofrece servicios de diseño, implementación y consultoría para ayudar a los desarrolladores a crear interfaces gráficas de usuario de alta calidad.

Leer más

RTABench: Un nuevo benchmark para aplicaciones de análisis en tiempo real

2025-03-29
RTABench: Un nuevo benchmark para aplicaciones de análisis en tiempo real

Los benchmarks de análisis tradicionales a menudo pasan por alto las necesidades de las aplicaciones en tiempo real, como generar información rápida y específica para usuarios, dispositivos o transacciones específicos. RTABench aborda esta brecha proporcionando un benchmark que refleja con precisión el análisis en tiempo real dentro de las aplicaciones, utilizando un esquema normalizado, tamaños de conjuntos de datos realistas y consultas que coinciden con los patrones de uso del mundo real. Incluye 33 consultas que cubren consultas de eventos sin procesar, filtrado selectivo, uniones de varias tablas y consultas preagregadas para evaluar el rendimiento de la base de datos en esquemas normalizados, filtrado selectivo y vistas materializadas incrementales. RTABench admite varias bases de datos y agradece las contribuciones de la comunidad para ampliar su soporte de bases de datos y optimizaciones.

Leer más

vramfs: Convierte tu VRAM de GPU en un sistema de archivos

2025-03-29
vramfs: Convierte tu VRAM de GPU en un sistema de archivos

vramfs es una utilidad que utiliza la biblioteca FUSE para crear un sistema de archivos en la VRAM de tu GPU. Similar a un ramdisk, pero usando memoria de video, no es para uso intensivo, pero funciona sorprendentemente bien en GPUs de consumo con 4 GB o más de VRAM. El desarrollador logró velocidades de lectura de ~2,4 GB/s y de escritura de 2,0 GB/s, aproximadamente 1/3 de un ramdisk. Utiliza OpenCL para la gestión de memoria y FUSE para un desarrollo simplificado. Las mejoras futuras apuntan a alcanzar los límites de ancho de banda PCI-e.

Leer más
Desarrollo Sistema de archivos

Aprende gramática japonesa con TypeScript: Presentamos Typed Japanese

2025-03-29
Aprende gramática japonesa con TypeScript: Presentamos Typed Japanese

Typed Japanese es una biblioteca de TypeScript de nivel de tipo que permite expresar oraciones completas en japonés utilizando el sistema de tipos. Crea un lenguaje específico de dominio (DSL) basado en reglas gramaticales japonesas, permitiendo escribir y verificar lenguaje natural gramaticalmente correcto usando el compilador de TypeScript. El proyecto también explora un formato intermedio para IA en el aprendizaje de idiomas, potencialmente reemplazando JSON con una representación verificada por tipo para mayor precisión. Admite varias conjugaciones de verbos y adjetivos, construcción de frases y oraciones, con el objetivo de crear un sistema de tipos para aprender y verificar la gramática japonesa. Si bien aún se encuentra en etapas iniciales y depende de reglas generadas por LLM, ofrece un enfoque único para el aprendizaje de idiomas y la verificación gramatical.

Leer más

Ajedrez en Tiempo Real: Un Tablero Físico que Elimina los Turnos

2025-03-29
Ajedrez en Tiempo Real: Un Tablero Físico que Elimina los Turnos

¿Cansado de las largas esperas en el ajedrez por turnos? Un desarrollador ha creado un tablero de ajedrez físico en tiempo real que elimina por completo los turnos. Cada pieza tiene un tiempo de espera individual, impuesto por componentes electrónicos y electroimanes, lo que impide hacer trampas. Los diseños de PCB y el firmware del proyecto son de código abierto, pero el autor observa problemas como una distribución de energía inadecuada y tolerancias ajustadas.

Leer más
Hardware

bknd: Backend ligero y completo para desarrollo de aplicaciones simplificado

2025-03-29
bknd: Backend ligero y completo para desarrollo de aplicaciones simplificado

bknd simplifica el desarrollo de aplicaciones proporcionando un backend totalmente funcional para la gestión de bases de datos, la autenticación, los medios y los flujos de trabajo. Construido sobre estándares web, es ligero y se puede implementar en casi cualquier lugar, incluso dentro de su framework de elección. ¡No más implementación de múltiples servicios separados! Ofrece una API REST, un SDK de React y elementos de React para componentes de autenticación y multimedia, junto con una interfaz de usuario de administrador fácil de usar. Si bien todavía está en desarrollo activo (pre-v1.0.0), la compatibilidad total con versiones anteriores aún no está garantizada.

Leer más
Desarrollo desarrollo backend

Temporizador Pomodoro basado en ESP32: Un proyecto DIY de hardware y software

2025-03-29
Temporizador Pomodoro basado en ESP32: Un proyecto DIY de hardware y software

Un ingeniero de software, impulsado por la búsqueda de la mejora de la productividad y el deseo de ayudar a un amigo, diseñó un temporizador Pomodoro basado en ESP32. Este temporizador utiliza una pantalla de tinta electrónica y un codificador rotatorio, priorizando un dispositivo físico, la diversión y la facilidad de uso intuitiva. El proyecto abarca la selección de hardware (ESP32, pantalla de tinta electrónica, codificador rotatorio, LED, etc.), el desarrollo de software (C++, framework Arduino, biblioteca GxEPD2) y el diseño de una caja impresa en 3D. El autor comparte las lecciones aprendidas durante el proceso de diseño, como la selección de la pantalla, el diseño del método de entrada, la implementación del indicador LED y la gestión del código de software. El producto final combina practicidad y diversión, incorporando huevos de Pascua.

Leer más

Punto final PCIe en FPGAs de la serie 7 de Xilinx: Implementación de código abierto

2025-03-29
Punto final PCIe en FPGAs de la serie 7 de Xilinx: Implementación de código abierto

Este proyecto implementa un punto final PCIe en FPGAs de la serie 7 de Xilinx utilizando el bloque duro PCIE_2_1 y transceptores GTP. Evita núcleos IP propietarios de Vivado y es compatible con openXC7. El diseño incluye generación de reloj, transceptores GTP y el bloque duro PCIE_2_1, con soporte para PCIe Gen1 x1 y Gen2 x1. Se ha probado en Alinx AC7100B SoM y Wavelet uSDR. Se proporcionan scripts de compilación y ejecución de Docker, junto con soporte para interrupciones MSI y controladores del kernel. Este proyecto está financiado por NGI0 Entrust.

Leer más
Hardware

Servidor de Lenguaje Postgres: Una Potente Herramienta SQL para Desarrolladores

2025-03-29
Servidor de Lenguaje Postgres: Una Potente Herramienta SQL para Desarrolladores

Este proyecto ofrece una cadena de herramientas completa para el desarrollo de Postgres, construida sobre el analizador propio de Postgres (libpg_query) para garantizar una compatibilidad de sintaxis del 100 %. Utilizando una arquitectura cliente-servidor con un diseño independiente del transporte, proporciona acceso a través de LSP, CLI, API HTTP y WebAssembly. Las funciones actuales incluyen autocompletado, resaltado de sintaxis, comprobación de tipos (utilizando información de EXPLAIN) y un linter. El desarrollo futuro se centra en mejorar estas funciones principales y construir una infraestructura robusta. ¡Se agradecen las contribuciones!

Leer más
Desarrollo

Cómo autohospedar un servidor TURN de código abierto casi gratuito en la nube de Oracle

2025-03-28
Cómo autohospedar un servidor TURN de código abierto casi gratuito en la nube de Oracle

Esta guía detalla cómo configurar un servidor TURN de código abierto casi gratuito en el nivel gratuito de Oracle Cloud, ofreciendo una alternativa a las implementaciones de WebRTC que dependen de servicios de terceros. Se explica paso a paso la creación de subredes, listas de seguridad, configuraciones de instancias, la instalación de Nginx, Certbot, un servidor PeerJS y un servidor Coturn. La guía cubre la configuración de las reglas de iptables y el uso de coturn-credential-api para la autenticación, proporcionando un control completo sobre la comunicación WebRTC y mejorando la privacidad y la seguridad al evitar la dependencia de proveedores grandes como Google.

Leer más
Desarrollo nube de Oracle

Hexi: Una biblioteca C++23 ligera para el manejo seguro de datos binarios

2025-03-28
Hexi: Una biblioteca C++23 ligera para el manejo seguro de datos binarios

Hexi es una biblioteca C++23 ligera, solo con encabezados, para manejar datos binarios de fuentes arbitrarias (principalmente datos de red) de forma segura. Se encuentra entre copiar bytes manualmente desde búferes de red y bibliotecas de serialización completas. Diseñada para la facilidad de uso, la seguridad al tratar con datos no confiables, la flexibilidad y una sobrecarga mínima, Hexi admite contenedores personalizados (incluidos los contenedores no contiguos), el manejo de excepciones y la verificación de límites. Las características adicionales incluyen tipos de búfer para archivos binarios, búferes estáticos/dinámicos y un asignador de bloques de subprocesos locales.

Leer más
Desarrollo Datos Binarios

Un Forth diminuto para el 6502: Menos de 600 bytes

2025-03-28
Un Forth diminuto para el 6502: Menos de 600 bytes

Este artículo detalla una implementación Forth altamente minimizada para la CPU de 8 bits 6502, alcanzando un tamaño inferior a 600 bytes. El autor compara dos modelos de intérpretes: Código de Hilo Directo (DTC) y Código de Hilo Mínimo (MTC), optando por DTC por su menor tamaño. El proyecto se centra en el tamaño en lugar del rendimiento, con el objetivo de verificar el DTC estándar frente a las variaciones de MTC. El Forth resultante incluye primitivas principales y se prueba con `my_hello_world.FORTH`, demostrando su funcionalidad.

Leer más
Desarrollo
1 2 27 28 29 31 33 34 35 50 51