Pong com IA: narração em tempo real com LLM

2025-05-04
Pong com IA: narração em tempo real com LLM

xPong é um jogo de Pong com um diferencial: comentários de IA em tempo real, com tecnologia LLM. Após cinco anos de desenvolvimento, o criador usou o gpt-4o-mini-tts da OpenAI para tornar essa visão realidade. O jogo simula 15 anos de torneios, apresenta jogadores de IA com níveis de habilidade variados e possui um sistema de comentários em três camadas (abertura, durante o jogo e encerramento) que se adapta dinamicamente aos eventos da partida. Ele até mesmo faz paralelos com jogos anteriores e adiciona elementos humorísticos. xPong demonstra o potencial empolgante dos LLMs nos jogos.

Leia mais
Jogos

Conjunto de dados de rejeição de chave de código aberto: uma solução robusta de rejeição

2025-05-04
Conjunto de dados de rejeição de chave de código aberto: uma solução robusta de rejeição

Este projeto de código aberto fornece uma coleção de traços de osciloscópio que ilustram o comportamento de rejeição de chave. Inclui vários tipos de chave (chave de balancim, botões, etc.) testados sob diferentes forças e velocidades de acionamento. Os dados estão disponíveis nos formatos CSV e PWL para uso no projeto e simulação de algoritmos de rejeição para circuitos e firmware. O conjunto de dados inclui descrições detalhadas da metodologia de teste e equipamentos, tornando-o um recurso valioso para engenheiros.

Leia mais

Elvish: Uma poderosa linguagem de script estaticamente linkada

2025-05-04
Elvish: Uma poderosa linguagem de script estaticamente linkada

Elvish é uma poderosa linguagem de script com recursos interativos de shell. Está disponível como um binário estaticamente linkado para Linux, BSDs, macOS e Windows. Embora seja anterior à versão 1.0, o que significa que ainda podem ocorrer mudanças que quebram a compatibilidade, é estável o suficiente para uso em scripts e interativo. A documentação do usuário, incluindo instalação, tutoriais e notícias, está hospedada em elv.sh. A documentação de desenvolvimento está localizada em ./docs. Também existe um ecossistema crescente de pacotes e ferramentas Elvish.

Leia mais
Desenvolvimento

Criando ROMs de SNES com C# usando DotnetSnes

2025-05-04
Criando ROMs de SNES com C# usando DotnetSnes

O DotnetSnes é um projeto revolucionário que permite a criação de ROMs funcionais do SNES usando C#! Ele faz isso fornecendo uma biblioteca .NET que abstrai as funções e variáveis globais do desenvolvimento de jogos SNES. DLLs compiladas são transpiladas para C e, em seguida, compiladas em uma ROM usando o SDK PvSnesLib. Embora as limitações do SNES (como a falta de alocação dinâmica de memória) exijam compensações na sintaxe idiomática do C#, jogos totalmente funcionais são possíveis. O artigo detalha o processo de desenvolvimento, a instalação de dependências, a configuração do projeto e as etapas de construção, mostrando dois exemplos: HelloWorld (saída de texto básica) e LikeMario (um jogo baseado em mapa mais complexo).

Leia mais

Melhore seu bootloader GRUB: Uma lista selecionada de temas e guia de personalização

2025-05-04
Melhore seu bootloader GRUB: Uma lista selecionada de temas e guia de personalização

Cansado do mesmo bootloader GRUB de sempre? Este post oferece uma lista selecionada de temas GRUB de alta qualidade e um guia sobre como personalizá-los facilmente. De mudar imagens de fundo e fontes a ajustar esquemas de cores e até criar um fundo cíclico, você pode personalizar sua experiência de inicialização. Ferramentas úteis também são recomendadas, como para baixar arquivos do GitHub e ajustar as configurações do GRUB.

Leia mais

Um Tour de Força pela Linguagem de Programação J

2025-05-03
Um Tour de Força pela Linguagem de Programação J

Esta introdução concisa à linguagem de programação J é direcionada a programadores com alguma experiência. Ela abrange conceitos essenciais, como tipos de dados, funções, modificadores, matrizes, estruturas de controle e tratamento de erros, com foco na aplicação prática. Os leitores são incentivados a executar os exemplos fornecidos e ler os comentários. Links e recursos essenciais são incluídos para auxiliar na aprendizagem rápida.

Leia mais
Desenvolvimento programação de matrizes

Resolver DNS sem servidor: serverless-dns decola

2025-05-03
Resolver DNS sem servidor: serverless-dns decola

O serverless-dns é um resolvedor DNS stub sem servidor, semelhante ao Pi-Hole, que suporta DNS-over-HTTPS (DoH) e DNS-over-TLS (DoT). Ele roda em plataformas como Cloudflare Workers, Deno Deploy, Fastly Compute@Edge e Fly.io, aproveitando os níveis gratuitos para casos de uso com baixo tráfego. Com tempos de resposta de milissegundos, ele gerencia eficientemente ~13 milhões de entradas de mais de 190 listas de bloqueio usando uma trie de radix sucinta. O projeto de código aberto permite configurações personalizadas, upload de logs e oferece uma solução DNS leve e de alto desempenho.

Leia mais

ANEMLL: Acelerando LLMs no Neural Engine da Apple

2025-05-03
ANEMLL: Acelerando LLMs no Neural Engine da Apple

ANEMLL é um projeto de código aberto focado em acelerar modelos de linguagem grandes (LLMs) para processadores de tensor, começando com o Apple Neural Engine (ANE). Ele fornece um pipeline de código aberto completo, da conversão do modelo (a partir do Hugging Face) à inferência no ANE, permitindo inferência perfeita no dispositivo para aplicativos de borda de baixa potência, maximizando a privacidade e a segurança. Atualmente suporta modelos como LLaMA 3.1, e oferece exemplos de código Swift e Python, juntamente com aplicativos iOS/macOS. Esta é uma versão alfa, portanto, espere melhorias na quantização.

Leia mais
Desenvolvimento

Lançamento do código-fonte: QModem 4.51, um programa clássico de comunicações MS-DOS

2025-05-03
Lançamento do código-fonte: QModem 4.51, um programa clássico de comunicações MS-DOS

O código-fonte do QModem 4.51, um programa de telecomunicações MS-DOS criado por John Friel III (1960-2024), foi lançado. Esta edição 'Test-Drive' de 1992 possui recursos como suporte para vários protocolos de modem, scripts, personalização, configuração automática e até mesmo um Modo Host. Um artefato histórico valioso para entusiastas de telecomunicações, entusiastas de retrocomputação e qualquer pessoa interessada em software clássico DOS. No entanto, a compilação requer Turbo Pascal 5.x/6.0 e várias dependências, além de lidar com a gestão de sobreposições - uma tarefa desafiadora.

Leia mais
Desenvolvimento

pipask: Instalação Segura de Pacotes Python

2025-05-03
pipask: Instalação Segura de Pacotes Python

O pipask é uma alternativa mais segura ao pip, adicionando verificações de segurança antes de instalar pacotes Python. Ele prioriza o uso de metadados do PyPI, evitando o download e a execução de código sempre que possível. Se a execução de código de terceiros for necessária, o pipask solicita o consentimento do usuário. Após executar as verificações, incluindo a popularidade do repositório, a idade do pacote, vulnerabilidades conhecidas, contagens de downloads do PyPI e verificação de metadados, ele apresenta um relatório formatado e solicita aprovação. Após a aprovação, ele repassa a instalação para o pip padrão.

Leia mais
Desenvolvimento

Proxy LLM Remoto como Modelo Local em Kotlin: Uma Benção para o Assistente de IA do JetBrains

2025-05-03
Proxy LLM Remoto como Modelo Local em Kotlin: Uma Benção para o Assistente de IA do JetBrains

Devido à cota gratuita limitada do Assistente de IA do JetBrains, o autor desenvolveu um aplicativo Kotlin/Ktor que funciona como proxy para várias APIs de LLM, como OpenAI, Claude e Gemini, como APIs do LM Studio e Ollama, permitindo seu uso em IDEs do JetBrains. Aproveitando recursos sem reflexão, ele é construído como uma imagem nativa do GraalVM para compatibilidade multiplataforma e inicialização rápida. Suporta bate-papo em streaming, possui configuração fácil e recarregamento a quente.

Leia mais

Emulador Commodore 64 de ciclo exato em microcontroladores baratos

2025-05-03
Emulador Commodore 64 de ciclo exato em microcontroladores baratos

O Connomore64 é um projeto que realiza emulação de ciclo exato do Commodore 64 usando múltiplos microcontroladores RP2040/RP2350 baratos e paralelos. Inicialmente um projeto de férias para explorar as capacidades dos PIOs do RP2040, ele evoluiu para um emulador preciso que executa a maioria dos jogos e parte das demos, e até interage com hardware original do C64, como drives de disquete. Embora ainda esteja em desenvolvimento, ele demonstra o potencial de executar software de uso intensivo de computação em hardware de baixo custo e fornece uma estrutura para emulação paralela usando múltiplos RP2040/RP2350s.

Leia mais
Hardware

Treinando Robôs com Pi0, Lerobot e Rerun: Uma Abordagem de Retargeting de Movimento de Pose Humana

2025-05-02
Treinando Robôs com Pi0, Lerobot e Rerun: Uma Abordagem de Retargeting de Movimento de Pose Humana

Este projeto explora o treinamento de robôs usando Pi0, Lerobot e Rerun. Ele suporta Linux e utiliza o gerenciador de pacotes Pixi. O projeto envolve calibração de câmera, análise de pose e cinemática humana e extração de posições e ângulos de juntas 3D a partir de imagens multivisuais. O objetivo final é converter filmagens multi-câmera sincronizadas em parâmetros de junta ângulo-eixo e posições 3D utilizáveis por robôs para redirecionamento de movimento e aprendizado de habilidades motoras finas. Tutoriais do Jupyter Notebook são fornecidos, cobrindo pose e cinemática humana, redirecionamento de pose de corpo e mão e aprendizado por imitação e teleoperação.

Leia mais

BLAST: Um motor de serviço de alto desempenho para IA de navegação na web

2025-05-02
BLAST: Um motor de serviço de alto desempenho para IA de navegação na web

BLAST é um motor de serviço de alto desempenho para IA de navegação na web, oferecendo uma API compatível com OpenAI com concorrência e streaming integrados. Ele armazena em cache e paralisa automaticamente as tarefas para reduzir custos e permitir latências interativas. Um simples `pip install blastai && blastai serve` inicia o uso localmente, sem se preocupar com orçamento ou consumo excessivo de memória. Sua API compatível com OpenAI facilita a integração, transmitindo a saída do LLM aprimorada pelo navegador em tempo real.

Leia mais
Desenvolvimento

Demo de inferência GPT-2 no navegador usando WebGL2

2025-05-02
Demo de inferência GPT-2 no navegador usando WebGL2

Este projeto impressionante traz a passagem completa para frente do modelo GPT-2 pequeno (117M de parâmetros) para o navegador usando WebGL2. Aproveitando os shaders WebGL2 para computação na GPU e js-tiktoken para tokenização BPE (sem necessidade de WASM), ele executa o GPT-2 diretamente no navegador. Um script Python baixa os pesos pré-treinados, e o front-end é construído com Vite para substituição de módulos a quente. Este é um exemplo fantástico de trazer modelos avançados de IA para o navegador, mostrando as capacidades de ponta das tecnologias web.

Leia mais
IA

OSle: Um Sistema Operacional de 510 Bytes para o Setor de Boot

2025-05-02
OSle: Um Sistema Operacional de 510 Bytes para o Setor de Boot

OSle é um minúsculo sistema operacional (510 bytes) em modo real, que reside inteiramente no setor de boot. Escrito em assembly x86, ele surpreendentemente inclui um shell, sistema de arquivos, gerenciamento de processos, softwares pré-construídos e um SDK para desenvolver seus próprios programas. O artigo fornece instruções detalhadas para instalação, construção, execução do OSle localmente (usando Bochs ou QEMU) e até mesmo execução em um dispositivo real (com um forte aviso!). Uma demonstração online e um tutorial também estão disponíveis. Este é um projeto fascinante para aqueles interessados em sistemas operacionais e programação de baixo nível.

Leia mais
Desenvolvimento assembly x86

Kubetail: Painel de Logs em Tempo Real para Kubernetes

2025-05-01
Kubetail: Painel de Logs em Tempo Real para Kubernetes

Kubetail é um painel de logs em tempo real para Kubernetes, otimizado para acompanhar logs de cargas de trabalho multicôntainer. Com o Kubetail, você pode visualizar logs de todos os contêineres em uma carga de trabalho (por exemplo, Deployment ou DaemonSet) mesclados em uma única linha do tempo cronológica, entregue ao seu navegador ou terminal. O ponto de entrada principal para o Kubetail é a ferramenta de linha de comando kubetail, que pode iniciar um painel web local na sua área de trabalho ou transmitir logs brutos diretamente para seu terminal. Por trás dos panos, o Kubetail usa a API do Kubernetes do seu cluster para buscar logs diretamente do seu cluster, para que funcione imediatamente sem precisar encaminhar seus logs para um serviço externo primeiro. O Kubetail também usa sua API do Kubernetes para rastrear eventos do ciclo de vida do contêiner para manter sua linha do tempo de log sincronizada à medida que os contêineres são iniciados, parados ou substituídos. Isso facilita o acompanhamento contínuo dos logs à medida que as solicitações do usuário passam de um contêiner efêmero para outro em diferentes serviços.

Leia mais

Changesets: Simplificando o Gerenciamento de Versões e Logs de Mudanças para Repositórios Multipacote

2025-05-01
Changesets: Simplificando o Gerenciamento de Versões e Logs de Mudanças para Repositórios Multipacote

Changesets é uma ferramenta projetada para simplificar o gerenciamento de versões e logs de mudanças, especialmente para repositórios multipacote. Permite que os contribuidores declarem como suas alterações devem ser lançadas, automatizando a atualização das versões dos pacotes, logs de mudanças e publicação de novas versões com base nessas informações. Changesets se destaca ao resolver as complexidades do gerenciamento de versões em repositórios multipacote, mantendo pacotes interdependentes atualizados e simplificando as alterações em grupos de pacotes. Usa arquivos changeset para definir intenções de lançamento, e uma ferramenta de linha de comando combina vários changesets em um único lançamento, lidando com dependências internas, atualizando logs de mudanças e lançando todos os pacotes atualizados de um monorepositório com um único comando. Documentação abrangente, recomendações de integração de CI e uma ação do GitHub para automatizar pull requests de versionamento e publicação também são fornecidas.

Leia mais

ART: Melhores resultados de LLMs com mudanças mínimas de código via RL

2025-04-30
ART: Melhores resultados de LLMs com mudanças mínimas de código via RL

O Agent Reinforcement Trainer (ART) é uma biblioteca de aprendizado por reforço de código aberto projetada para aumentar o desempenho de modelos de linguagem grandes (LLMs) em fluxos de trabalho de agentes. Utilizando o poderoso algoritmo GRPO, o ART treina modelos a partir de suas próprias experiências. Ao contrário da maioria das bibliotecas de RL, o ART se integra perfeitamente em bases de código existentes, descarregando a complexidade do loop de treinamento de RL para seu backend. O ART consiste em um cliente (para interagir com seu código) e um servidor (lidando com inferência e treinamento). O loop de treinamento envolve inferência (coleta de dados e atribuição de recompensas) e treinamento (usando GRPO para treinar o modelo e atualizar LoRAs). O ART suporta a maioria dos modelos de linguagem causal compatíveis com vLLM/HuggingFace Transformers. Atualmente em alfa, o ART aceita contribuições.

Leia mais
Desenvolvimento

DeepSeek-Prover-V2: Aprimorando o raciocínio matemático formal por meio de aprendizado por reforço

2025-04-30
DeepSeek-Prover-V2: Aprimorando o raciocínio matemático formal por meio de aprendizado por reforço

DeepSeek-Prover-V2 é um modelo de linguagem grande de código aberto projetado para prova de teoremas formais em Lean 4. Ele utiliza um pipeline de prova de teoremas recursivo alimentado pelo DeepSeek-V3 e aprendizado por reforço para integrar o raciocínio matemático formal e informal. O modelo começa decompondo problemas complexos em subobjetivos usando o DeepSeek-V3, sintetizando provas desses subobjetivos para criar dados iniciais para o aprendizado por reforço. O DeepSeek-Prover-V2-671B alcança desempenho de ponta, atingindo uma taxa de aprovação de 88,9% no MiniF2F-test e resolvendo 49 problemas do PutnamBench. Um novo conjunto de dados de referência, ProverBench, contendo 325 problemas formalizados de competições do ensino médio e livros didáticos, também é introduzido.

Leia mais

Raven: O ecossistema OCaml para Machine Learning

2025-04-30
Raven: O ecossistema OCaml para Machine Learning

Raven é um ecossistema abrangente que traz aprendizado de máquina e ciência de dados para OCaml. Ele oferece bibliotecas que espelham ferramentas populares do Python, como NumPy (com Ndarray), Jupyter (com Quill) e JAX (com Rune), buscando a facilidade de uso do Python, enquanto aproveita a segurança de tipo e o desempenho do OCaml. Atualmente em pré-alfa, Raven possui um conjunto crescente de ferramentas para computação numérica, visualização (Hugin) e muito mais, prometendo uma alternativa convincente para cientistas de dados que buscam uma linguagem mais segura e rápida.

Leia mais
Desenvolvimento

A Arte de Dizer Não: Uma API Leve para Rejeições Elegantes

2025-04-30
A Arte de Dizer Não: Uma API Leve para Rejeições Elegantes

Cansado de lutar para recusar educadamente pedidos? Esta API leve, "No as a Service", oferece milhares de razões criativas e divertidas para rejeição em qualquer situação. Fácil de integrar em aplicativos, bots, páginas de destino e muito mais, ela até ajuda a criar cartas de rejeição espirituosas. O código aberto é simples de executar, tornando-o uma ferramenta divertida e eficiente para dizer "não" com estilo.

Leia mais
Desenvolvimento Razões de Rejeição Leve

MiMo-7B: Modelo de Linguagem de 7B Parâmetros para Raciocínio Supera Modelos de 32B

2025-04-30
MiMo-7B: Modelo de Linguagem de 7B Parâmetros para Raciocínio Supera Modelos de 32B

A Xiaomi apresenta o MiMo-7B, um modelo de linguagem de 7 bilhões de parâmetros projetado para raciocínio. Por meio de dados e estratégias de pré-treinamento otimizados, juntamente com técnicas inovadoras de aprendizado por reforço, o MiMo-7B demonstra desempenho excepcional em tarefas de raciocínio matemático e de código, superando até mesmo modelos de 32B parâmetros maiores. O modelo de código aberto inclui pontos de verificação para o modelo base, modelo SFT e modelos treinados por RL, oferecendo recursos valiosos para o desenvolvimento de LLMs de raciocínio poderosos.

Leia mais

Executando Linux no Excel: Uma Brincadeira Divertida

2025-04-30
Executando Linux no Excel: Uma Brincadeira Divertida

Um desenvolvedor conseguiu executar um sistema Linux dentro do Microsoft Excel! Usando um emulador leve chamado mini-rv32ima, compilado como um DLL e chamado por meio de macros VBA, o desenvolvedor conseguiu exibir a saída do Linux diretamente nas células do Excel. Embora o projeto seja considerado com bugs e o autor admita ter usado um DLL externo em vez de reescrever o emulador em VBA ou fórmulas do Excel, é um experimento criativo e divertido que demonstra engenhosidade e habilidade de programação.

Leia mais
Desenvolvimento

AgenticSeek: Uma Alternativa Privada e Local ao Manus AI

2025-04-29
AgenticSeek: Uma Alternativa Privada e Local ao Manus AI

O AgenticSeek é um assistente de IA totalmente local e habilitado por voz que navega na web, escreve código e planeja tarefas de forma autônoma, mantendo todos os dados no seu dispositivo. Projetado para modelos de raciocínio local, ele garante privacidade completa e nenhuma dependência da nuvem. Ele suporta várias linguagens de programação e seleciona automaticamente o melhor agente de IA para cada tarefa. O projeto é de código aberto e está ativamente procurando contribuidores.

Leia mais
IA

Neurox: Simplificando o monitoramento de cargas de trabalho de IA com um gráfico Helm

2025-04-29
Neurox: Simplificando o monitoramento de cargas de trabalho de IA com um gráfico Helm

Neurox simplifica o monitoramento de cargas de trabalho de IA em seu cluster Kubernetes GPU. Seu gráfico Helm automatiza a instalação, provisionando um subdomínio, credenciais do registro de imagens, IdP e certificados TLS. Painéis e relatórios pré-construídos combinam métricas e dados em tempo real do runtime do Kubernetes para administradores, desenvolvedores, pesquisadores e auditores. Gratuito para até 64 GPUs (somente GPUs NVIDIA), com licenciamento empresarial disponível. Pré-requisitos incluem um cluster Kubernetes, cert-manager, ingress-nginx, o operador NVIDIA GPU e o Kube Prometheus Stack.

Leia mais

Beatsync: Um reprodutor de áudio web de alta precisão para múltiplos dispositivos

2025-04-29
Beatsync: Um reprodutor de áudio web de alta precisão para múltiplos dispositivos

Beatsync é um reprodutor de áudio web de alta precisão projetado para reprodução em vários dispositivos. Ele apresenta sincronização precisa em milissegundos usando primitivas inspiradas em NTP, compatibilidade multiplataforma (Chrome recomendado), recursos de áudio espacial para efeitos sonoros exclusivos por meio de fontes de audição virtuais e uma interface polida. Também é auto-hostável com configuração mínima. Atualmente em desenvolvimento inicial, o suporte total é limitado a navegadores Chrome para desktop, enquanto a sincronização móvel é experimental e pode ser instável.

Leia mais

CoRT: Fazendo a IA Pensar Recursivamente para Desempenho Superior

2025-04-29
CoRT: Fazendo a IA Pensar Recursivamente para Desempenho Superior

CoRT (Chain of Recursive Thoughts) aumenta significativamente o desempenho da IA, forçando o modelo a refinar repetidamente suas respostas. O modelo gera várias respostas alternativas, as avalia e seleciona a melhor, imitando a autodúvida e a melhoria iterativa. Testes com o Mistral 3.1 24B mostraram uma melhoria dramática em tarefas de programação. A mágica reside na autoavaliação, geração de alternativas competitivas, refinamento iterativo e profundidade de pensamento dinâmica. O projeto é de código aberto e aceita contribuições.

Leia mais

ArkFlow: Motor de processamento de stream do Rust de alto desempenho

2025-04-29
ArkFlow: Motor de processamento de stream do Rust de alto desempenho

ArkFlow é um motor de processamento de stream de alto desempenho construído em Rust e Tokio, oferecendo recursos poderosos de processamento de stream de dados. Ele suporta várias fontes de entrada/saída (Kafka, MQTT, HTTP, arquivos, etc.) e processadores (JSON, SQL, Protobuf, etc.), com uma configuração YAML flexível. Recursos integrados incluem consultas SQL, processamento JSON e codificação/decodificação Protobuf. ArkFlow é altamente extensível e inclui buffer para lidar com backpressure e diversas opções de saída de erro. Comece clonando o repositório e seguindo as instruções simples de construção e execução.

Leia mais
Desenvolvimento

ROSplat: Visualizador Online Baseado em ROS2 e Gaussian Splatting

2025-04-29
ROSplat: Visualizador Online Baseado em ROS2 e Gaussian Splatting

ROSplat é o primeiro visualizador online baseado em ROS2 que utiliza o Gaussian splatting para renderizar cenas 3D complexas em tempo real. Ele processa eficientemente milhões de Gaussianas usando mensagens ROS2 personalizadas e técnicas de classificação e renderização aceleradas por GPU. Suporta carregamento de dados de arquivos PLY e integra-se com ferramentas ROS2, como gravação de bags. Uma GPU NVIDIA é recomendada para melhor desempenho. Opções de instalação incluem pip ou Docker. Desenvolvido por Shady Gmira com agradecimentos a Qihao Yuan e Kailai Li pela orientação.

Leia mais
Desenvolvimento
1 2 20 21 22 24 26 27 28 50 51