Benchmark de código aberto para OCR e extração de dados de LLMs

2025-04-01
Benchmark de código aberto para OCR e extração de dados de LLMs

Omni é uma ferramenta de benchmarking de código aberto que compara as capacidades de OCR e extração de dados de vários modelos multimodais grandes, como o gpt-4o, avaliando a precisão da extração de texto e JSON. Este benchmark fornece uma avaliação abrangente da precisão do OCR em provedores tradicionais de OCR e LLMs. O conjunto de dados e as metodologias são de código aberto, incentivando contribuições e expansão. O benchmark concentra-se na extração de JSON, medindo a precisão de todo o pipeline: Documento ⇒ OCR ⇒ Extração. Ele usa um json-diff modificado para precisão de JSON e distância de Levenshtein para similaridade de texto. A ferramenta suporta vários modelos, incluindo OpenAI, Google Gemini e Anthropic, com uma interface simples de linha de comando e saída JSON.

Leia mais
Desenvolvimento

TopoSort: Uma biblioteca Zig altamente eficiente para ordenação topológica

2025-04-01
TopoSort: Uma biblioteca Zig altamente eficiente para ordenação topológica

TopoSort é uma biblioteca Zig altamente eficiente para realizar ordenação topológica em grafos de dependência. Ela possui recursos como construção de grafos de dependência, ordenação topológica, geração de subconjuntos sem dependências para processamento paralelo, detecção e relatório de ciclos e suporte para vários tipos de nós. Uma ferramenta de interface de linha de comando, `toposort-cli`, simplifica o uso. O desempenho é otimizado definindo o parâmetro `max_range`, potencialmente acelerando a construção da árvore de dependência em 3 a 4 vezes. TopoSort é licenciado sob MIT.

Leia mais
Desenvolvimento Ordenação Topológica

RubyUI: Biblioteca de componentes de IU Rails ultrarrápida

2025-04-01
RubyUI: Biblioteca de componentes de IU Rails ultrarrápida

RubyUI (anteriormente PhlexUI) é uma biblioteca de componentes de IU Rails construída com Phlex, oferecendo velocidades até 12 vezes mais rápidas do que os modelos ERB tradicionais. Ela oferece uma coleção de componentes reutilizáveis e personalizáveis que você pode copiar e colar diretamente em seus aplicativos. O RubyUI enfatiza design limpo, componentes bem organizados e opções de personalização extensivas, com documentação e exemplos abrangentes. Ele usa controladores Stimulus.js personalizados, minimizando as dependências, permitindo a criação fácil de interfaces de aplicativos Rails eficientes e bonitas.

Leia mais

Controle seu telefone Android com IA: codifique seus comandos

2025-04-01
Controle seu telefone Android com IA: codifique seus comandos

O projeto de código aberto `mobile-use` permite que você controle seu telefone Android usando IA. Basta escrever comandos como "Abra o Instagram e envie uma mensagem", e o projeto os executa usando suas ferramentas SDK do Android instaladas localmente (adb). Ele suporta modelos LLM personalizados e oferece métodos de entrada de linha de comando e arquivo, permitindo que você envie instruções facilmente a partir do terminal ou de um arquivo. O projeto é licenciado sob a Licença MIT.

Leia mais
Desenvolvimento

Uma biblioteca PubSub minimalista de 149 bytes

2025-04-01
Uma biblioteca PubSub minimalista de 149 bytes

Este artigo apresenta uma biblioteca PubSub minimalista com apenas 149 bytes, praticamente sem dependências. Ela é comparada com concorrentes como nano-pubsub (194 bytes) e tiny-pubsub (401 bytes), destacando seu tamanho extremamente pequeno. Construída usando EventTarget, o código é claro e conciso, e inclui definições de tipo TypeScript. O autor incentiva contribuições para reduzir ainda mais o tamanho da biblioteca.

Leia mais
Desenvolvimento biblioteca leve

KOReader: Um Leitor de Livros Eletrônicos Multiplataforma e Potente

2025-04-01
KOReader: Um Leitor de Livros Eletrônicos Multiplataforma e Potente

O KOReader é um visualizador de documentos projetado principalmente para leitores de tinta eletrônica, suportando vários formatos (PDF, EPUB, MOBI, etc.) e dispositivos (Kindle, Kobo, etc.). Ele possui uma visualização de leitura altamente personalizável, suporte multilíngue, integração com ferramentas como o Calibre e otimizações para tinta eletrônica para viradas de página rápidas. Extensível por meio de plug-ins, o KOReader é desenvolvido e mantido por uma comunidade global de voluntários.

Leia mais

Aprimore seus pipelines do Airflow com LLMs: o Apache Airflow AI SDK

2025-03-31
Aprimore seus pipelines do Airflow com LLMs: o Apache Airflow AI SDK

Este SDK Apache Airflow AI, baseado no Pydantic AI, permite que você integre perfeitamente modelos de linguagem grandes (LLMs) em seus fluxos de trabalho do Airflow. Usando tarefas baseadas em decoradores (@task.llm, @task.llm_branch, @task.agent), ele simplifica chamadas de LLM e orquestração de agentes. O suporte para vários modelos (OpenAI, Anthropic, etc.), análise de saída automática e recursos de ramificação de DAG tornam seus pipelines de dados mais inteligentes e eficientes.

Leia mais
Desenvolvimento

guMCP: Coleção Open Source de Servidores de Protocolo de Contexto de Modelo Unificado

2025-03-31
guMCP: Coleção Open Source de Servidores de Protocolo de Contexto de Modelo Unificado

A Gumloop lançou o guMCP, uma coleção open source de servidores de Protocolo de Contexto de Modelo (MCP) que podem ser executados localmente e remotamente. O objetivo é criar a maior coleção de servidores MCP unificados, fomentando uma comunidade em torno de integrações de IA e o futuro da IAG. Com suporte para transportes stdio e SSE, o guMCP inclui servidores para sistemas de arquivos, bancos de dados, ferramentas de desenvolvimento, automação da web e muito mais, incentivando contribuições da comunidade. Licenciado sob GPL-3.0, a segurança é prioridade máxima, com conformidade com SOC 2 Tipo II, GDPR e HIPAA.

Leia mais
Desenvolvimento

Controle o WhatsApp com o Claude: Um servidor WhatsApp MCP

2025-03-31
Controle o WhatsApp com o Claude: Um servidor WhatsApp MCP

Este projeto integra o WhatsApp com o modelo de linguagem grande (LLM) Claude. Uma ponte Go conecta-se à API multidispositivo da Web do WhatsApp, armazenando mensagens localmente em um banco de dados SQLite. Um servidor Python implementa o Protocolo de Contexto do Modelo (MCP), permitindo que o Claude pesquise mensagens, contatos e envie mensagens por meio de um conjunto de ferramentas. Todo o processamento é local, priorizando a privacidade do usuário.

Leia mais
Desenvolvimento

Instalação do Windows 9x em Velocidade Relâmpago: 90 Segundos ou Menos!

2025-03-31
Instalação do Windows 9x em Velocidade Relâmpago: 90 Segundos ou Menos!

Cansado de instalações lentas do Windows 98? O Windows 9x QuickInstall chegou! Este projeto usa o Linux e um instalador personalizado para empacotar um sistema Windows 98 já instalado em uma imagem ISO otimizada, permitindo a instalação em cerca de 60 a 90 segundos. Ele suporta Windows 98, Windows 98 SE e Windows ME e permite a adição flexível de drivers e ferramentas. Embora a criação da ISO seja mais complexa do que usar o nLite, a maior personalização a torna perfeita para usuários que priorizam velocidade e instalações altamente personalizadas.

Leia mais

Ambermoon Advanced: Uma Expansão RPG Massiva Lançada em Episódios

2025-03-31
Ambermoon Advanced: Uma Expansão RPG Massiva Lançada em Episódios

O desenvolvedor independente Pyrdacor está lançando Ambermoon Advanced, uma expansão não oficial para o RPG Ambermoon, em episódios. Cinco episódios estão planejados, com os três primeiros disponíveis atualmente, apresentando conteúdo como "Mistérios do Mar" e "Criaturas Elementais". O jogo roda em Amiga e sistemas modernos, embora a versão Amiga ainda esteja em desenvolvimento. O desenvolvedor observa que o jogo está em andamento e pode conter bugs e desequilíbrios. Um manual físico também está planejado, contendo informações do jogo e lore de Ambermoon.

Leia mais

Blue95: Uma experiência de desktop nostálgica dos anos 90

2025-03-30
Blue95: Uma experiência de desktop nostálgica dos anos 90

O Blue95 oferece uma experiência de desktop leve que lembra a década de 1990, construído no Fedora Atomic Xfce com o tema Chicago95. Embora o instalador incluído ainda esteja na versão alfa, o método de instalação recomendado é a rebase de outro desktop Fedora Atomic, como winblues/vauxite. O Blue95 prioriza a usabilidade e acessibilidade em vez da replicação exata de sistemas operacionais mais antigos, incorporando melhorias do Universal Blue (codecs, atualizações automáticas, etc.) para uma melhor experiência pronta para uso. Uma ISO ao vivo também está disponível para teste sem instalação.

Leia mais
Desenvolvimento Desktop Retro

Depurador rr recebe atualização importante: Modo de Contadores de Software

2025-03-30
Depurador rr recebe atualização importante: Modo de Contadores de Software

O depurador rr agora possui um modo de Contadores de Software, permitindo que ele seja executado sem acesso aos contadores de desempenho de hardware da CPU, superando as limitações em VMs de nuvem e contêineres. Este modo utiliza instrumentação dinâmica e estática leve para alcançar a funcionalidade de gravação e reprodução, simplificando os fluxos de trabalho de depuração. O post do blog do autor detalha os princípios da tecnologia de gravação e reprodução, destaca as vantagens do depurador rr e compartilha sua jornada de desenvolvimento.

Leia mais
Desenvolvimento contadores de software

PG-MCP: Servidor Aprimorado do Protocolo de Contexto de Modelo para PostgreSQL

2025-03-30
PG-MCP: Servidor Aprimorado do Protocolo de Contexto de Modelo para PostgreSQL

O PG-MCP é um servidor de Protocolo de Contexto de Modelo (MCP) para bancos de dados PostgreSQL, oferecendo recursos aprimorados para agentes de IA. Ele se baseia na implementação de referência do Postgres MCP, adicionando suporte para múltiplos bancos de dados, metadados ricos incluindo extensões PostGIS e pgvector, ferramentas de análise de planos de consulta e gerenciamento robusto de conexões. Implementável via Docker ou ambiente virtual, os desenvolvedores podem interagir com o PG-MCP usando o cliente Python fornecido, podendo até mesmo utilizar modelos de linguagem grandes como o Claude para conversão de linguagem natural para SQL.

Leia mais
Desenvolvimento

msgpack23: Uma Biblioteca C++ Moderna para MessagePack

2025-03-30
msgpack23: Uma Biblioteca C++ Moderna para MessagePack

msgpack23 é uma biblioteca C++ leve e somente com cabeçalho para serialização e desserialização de dados para o formato MessagePack. Aproveitando recursos modernos do C++ (C++20 e superior), ela oferece uma solução flexível e sem dependências, suportando vários tipos de dados, incluindo contêineres STL, objetos de ponto de tempo e tipos personalizados. Sua API simples, foco em desempenho e extensibilidade a tornam uma ferramenta poderosa para tratamento eficiente de dados.

Leia mais
Desenvolvimento

xan: Ferramenta CLI ultrarrápida para processamento de CSV

2025-03-29
xan: Ferramenta CLI ultrarrápida para processamento de CSV

xan é uma ferramenta de linha de comando escrita em Rust para o processamento ultrarrápido de arquivos CSV massivos (gigabytes!). Aproveitando o multithreading para paralelismo, ela lida facilmente com tarefas como pré-visualização, filtragem, fatiamento, agregação, classificação e junção de dados CSV. xan possui uma poderosa linguagem de expressão que supera a velocidade de Python, Lua ou JavaScript para operações complexas. Originalmente bifurcado do xsv, mas extensivamente reescrito, xan atende às necessidades de análise de dados de ciências sociais, incluindo lexicometria, teoria de grafos e até mesmo web scraping. A instalação é simples através do cargo, Homebrew, pacman, Nix ou binários pré-compilados.

Leia mais
Desenvolvimento processamento CSV

JobHuntr: Automatize suas candidaturas a empregos no LinkedIn com IA

2025-03-29
JobHuntr: Automatize suas candidaturas a empregos no LinkedIn com IA

JobHuntr.fyi é um aplicativo de desktop macOS que utiliza IA com tecnologia Ollama para se candidatar automaticamente a empregos no LinkedIn, 24 horas por dia, 7 dias por semana, sem precisar de uma chave de API OpenAI. Ele visa empregos com a opção "Aplicação Fácil" (cerca de 70% das vagas), processando até 25 candidaturas diariamente. A IA preenche inteligentemente os formulários com base em seu currículo e FAQ, verificando cuidadosamente as informações. Perguntas incertas são salvas em sua FAQ e as candidaturas são ignoradas. Projetado para imitar o comportamento humano e usando seu endereço IP, ele minimiza o risco de detecção de automação pelo LinkedIn.

Leia mais
Desenvolvimento Candidaturas a Empregos

LVGL: Biblioteca de gráficos embarcados leve e versátil

2025-03-29
LVGL: Biblioteca de gráficos embarcados leve e versátil

LVGL é uma biblioteca gráfica embarcada de código aberto popular para criar interfaces de usuário bonitas para qualquer MCU, MPU e tipo de display. Possui mais de 30 widgets integrados, um sistema de estilo poderoso, gerenciadores de layout inspirados na web e suporta vários idiomas. Requerendo recursos mínimos (32kB de RAM e 128kB de Flash), o LVGL simplifica o desenvolvimento da IU. A equipe LVGL também oferece serviços de design, implementação e consultoria para ajudar os desenvolvedores a criar interfaces gráficas de usuário de alta qualidade.

Leia mais

RTABench: Um novo benchmark para aplicativos de análise em tempo real

2025-03-29
RTABench: Um novo benchmark para aplicativos de análise em tempo real

Benchmarks de análise tradicionais geralmente ignoram as necessidades de aplicativos em tempo real, como gerar insights rápidos e direcionados para usuários, dispositivos ou transações específicos. O RTABench preenche essa lacuna fornecendo um benchmark que reflete com precisão a análise em tempo real dentro de aplicativos, usando um esquema normalizado, tamanhos de conjuntos de dados realistas e consultas que correspondem aos padrões de uso do mundo real. Ele inclui 33 consultas cobrindo consultas de eventos brutos, filtragem seletiva, junções de várias tabelas e consultas pré-agregadas para avaliar o desempenho do banco de dados em esquemas normalizados, filtragem seletiva e visualizações materializadas incrementais. O RTABench suporta vários bancos de dados e dá as boas-vindas às contribuições da comunidade para expandir seu suporte a bancos de dados e otimizações.

Leia mais

vramfs: Transforme sua VRAM de GPU em um sistema de arquivos

2025-03-29
vramfs: Transforme sua VRAM de GPU em um sistema de arquivos

vramfs é um utilitário que usa a biblioteca FUSE para criar um sistema de arquivos na VRAM da sua GPU. Semelhante a um ramdisk, mas usando memória de vídeo, não é para uso intensivo, mas funciona surpreendentemente bem em GPUs de consumo com 4 GB ou mais de VRAM. O desenvolvedor alcançou velocidades de leitura de ~2,4 GB/s e de escrita de 2,0 GB/s, cerca de 1/3 de um ramdisk. Ele usa OpenCL para gerenciamento de memória e FUSE para desenvolvimento simplificado. Melhorias futuras visam atingir os limites de largura de banda PCI-e.

Leia mais
Desenvolvimento Sistema de arquivos

Aprenda gramática japonesa com TypeScript: Apresentando o Typed Japanese

2025-03-29
Aprenda gramática japonesa com TypeScript: Apresentando o Typed Japanese

Typed Japanese é uma biblioteca de nível de tipo TypeScript que permite expressar frases completas em japonês usando o sistema de tipos. Ele cria uma linguagem específica de domínio (DSL) com base em regras gramaticais japonesas, permitindo a escrita e verificação de linguagem natural gramaticalmente correta usando o compilador do TypeScript. O projeto também explora um formato intermediário para IA no aprendizado de idiomas, potencialmente substituindo JSON por uma representação verificada por tipo para maior precisão. Ele suporta várias conjugações de verbos e adjetivos, construção de frases e sentenças, com o objetivo de criar um sistema de tipos para aprender e verificar a gramática japonesa. Embora ainda esteja em estágios iniciais e dependa de regras geradas por LLM, oferece uma abordagem única para aprendizagem de idiomas e verificação gramatical.

Leia mais

Xadrez em Tempo Real: Um Tabuleiro Físico que Elimina Turnos

2025-03-29
Xadrez em Tempo Real: Um Tabuleiro Físico que Elimina Turnos

Cansado das longas esperas no xadrez por turnos? Um desenvolvedor criou um tabuleiro de xadrez físico em tempo real que elimina completamente os turnos. Cada peça tem um tempo de espera individual, imposto por eletrônicos e eletroímãs, impedindo trapaças. Os designs de PCB e o firmware do projeto são de código aberto, mas o autor observa problemas como distribuição de energia inadequada e tolerâncias apertadas.

Leia mais
Hardware

bknd: Backend leve e completo para desenvolvimento de aplicativos simplificado

2025-03-29
bknd: Backend leve e completo para desenvolvimento de aplicativos simplificado

O bknd simplifica o desenvolvimento de aplicativos fornecendo um backend totalmente funcional para gerenciamento de banco de dados, autenticação, mídia e fluxos de trabalho. Construído em padrões da web, é leve e pode ser implantado em quase qualquer lugar, incluindo dentro da sua estrutura de escolha. Sem mais implantação de vários serviços separados! Ele oferece uma API REST, SDK React e elementos React para componentes de autenticação e mídia, juntamente com uma interface de usuário de administrador fácil de usar. Embora ainda esteja em desenvolvimento ativo (pré-v1.0.0), a compatibilidade total com versões anteriores ainda não é garantida.

Leia mais
Desenvolvimento desenvolvimento backend

Cronômetro Pomodoro baseado em ESP32: Um projeto DIY de hardware e software

2025-03-29
Cronômetro Pomodoro baseado em ESP32: Um projeto DIY de hardware e software

Um engenheiro de software, movido pela busca por aprimoramento de produtividade e pelo desejo de ajudar um amigo, projetou um cronômetro Pomodoro baseado em ESP32. Este cronômetro usa um display de tinta eletrônica e um encoder rotativo, priorizando um dispositivo físico, diversão e usabilidade intuitiva. O projeto abrange a seleção de hardware (ESP32, display de tinta eletrônica, encoder rotativo, LED etc.), desenvolvimento de software (C++, framework Arduino, biblioteca GxEPD2) e design de caixa impresso em 3D. O autor compartilha lições aprendidas durante o processo de design, como a seleção do display, o design do método de entrada, a implementação do indicador LED e a gestão do código de software. O produto final combina praticidade e diversão, incorporando ovos de Páscoa.

Leia mais

Ponto final PCIe em FPGAs da série 7 da Xilinx: Implementação de código aberto

2025-03-29
Ponto final PCIe em FPGAs da série 7 da Xilinx: Implementação de código aberto

Este projeto implementa um endpoint PCIe em FPGAs da série 7 da Xilinx usando o bloco rígido PCIE_2_1 e transceptores GTP. Ele evita núcleos IP proprietários do Vivado e é compatível com o openXC7. O projeto inclui geração de clock, transceptores GTP e o bloco rígido PCIE_2_1, suportando PCIe Gen1 x1 e Gen2 x1. Foi testado em Alinx AC7100B SoM e Wavelet uSDR. Scripts de compilação e execução do Docker são fornecidos, juntamente com suporte para interrupção MSI e driver do kernel. Este projeto é financiado pelo NGI0 Entrust.

Leia mais
Hardware

Servidor de Linguagem Postgres: Uma Ferramenta SQL Poderosa para Desenvolvedores

2025-03-29
Servidor de Linguagem Postgres: Uma Ferramenta SQL Poderosa para Desenvolvedores

Este projeto oferece uma cadeia de ferramentas completa para desenvolvimento Postgres, construída sobre o analisador próprio do Postgres (libpg_query) para garantir 100% de compatibilidade de sintaxe. Usando uma arquitetura cliente-servidor com design independente de transporte, ele fornece acesso via LSP, CLI, APIs HTTP e WebAssembly. Os recursos atuais incluem autocompletar, realce de sintaxe, verificação de tipo (usando insights do EXPLAIN) e um linter. O desenvolvimento futuro se concentra em aprimorar esses recursos principais e construir uma infraestrutura robusta. Contribuições são bem-vindas!

Leia mais
Desenvolvimento

Como auto-hospedar um servidor TURN de código aberto quase gratuito na nuvem Oracle

2025-03-28
Como auto-hospedar um servidor TURN de código aberto quase gratuito na nuvem Oracle

Este guia detalha como configurar um servidor TURN de código aberto quase gratuito na camada gratuita do Oracle Cloud, oferecendo uma alternativa às implementações WebRTC que dependem de serviços de terceiros. Ele percorre a criação de sub-redes, listas de segurança, configurações de instâncias, instalação do Nginx, Certbot, de um servidor PeerJS e de um servidor Coturn. O guia abrange a configuração de regras iptables e o uso do coturn-credential-api para autenticação, fornecendo controle completo sobre a comunicação WebRTC e melhorando a privacidade e a segurança, evitando a dependência de provedores grandes como o Google.

Leia mais
Desenvolvimento servidor TURN nuvem Oracle

Hexi: Uma biblioteca C++23 leve para manipulação segura de dados binários

2025-03-28
Hexi: Uma biblioteca C++23 leve para manipulação segura de dados binários

Hexi é uma biblioteca C++23 leve e somente com cabeçalho para lidar com segurança com dados binários de fontes arbitrárias (principalmente dados de rede). Ela fica em algum lugar entre copiar bytes manualmente de buffers de rede e bibliotecas de serialização completas. Projetada para facilidade de uso, segurança ao lidar com dados não confiáveis, flexibilidade e sobrecarga mínima, Hexi suporta contêineres personalizados (incluindo contêineres não contíguos), tratamento de exceções e verificação de limites. Recursos adicionais incluem tipos de buffer para arquivos binários, buffers estáticos/dinâmicos e um alocador de bloco de thread local.

Leia mais
Desenvolvimento Dados Binários

Um Forth minúsculo para o 6502: Menos de 600 bytes

2025-03-28
Um Forth minúsculo para o 6502: Menos de 600 bytes

Este artigo detalha uma implementação Forth altamente minimizada para a CPU de 8 bits 6502, atingindo um tamanho inferior a 600 bytes. O autor compara dois modelos de interpretadores: Código de Thread Direto (DTC) e Código de Thread Mínimo (MTC), optando pelo DTC por seu tamanho menor. O projeto se concentra no tamanho em vez do desempenho, com o objetivo de verificar o DTC padrão em relação às variações do MTC. O Forth resultante inclui primitivas principais e é testado com `my_hello_world.FORTH`, demonstrando sua funcionalidade.

Leia mais
Desenvolvimento
1 2 27 28 29 31 33 34 35 50 51