ANEMLL: Acelerando LLMs no Neural Engine da Apple

2025-05-03
ANEMLL: Acelerando LLMs no Neural Engine da Apple

ANEMLL é um projeto de código aberto focado em acelerar modelos de linguagem grandes (LLMs) para processadores de tensor, começando com o Apple Neural Engine (ANE). Ele fornece um pipeline de código aberto completo, da conversão do modelo (a partir do Hugging Face) à inferência no ANE, permitindo inferência perfeita no dispositivo para aplicativos de borda de baixa potência, maximizando a privacidade e a segurança. Atualmente suporta modelos como LLaMA 3.1, e oferece exemplos de código Swift e Python, juntamente com aplicativos iOS/macOS. Esta é uma versão alfa, portanto, espere melhorias na quantização.

Leia mais
Desenvolvimento

Lançamento do código-fonte: QModem 4.51, um programa clássico de comunicações MS-DOS

2025-05-03
Lançamento do código-fonte: QModem 4.51, um programa clássico de comunicações MS-DOS

O código-fonte do QModem 4.51, um programa de telecomunicações MS-DOS criado por John Friel III (1960-2024), foi lançado. Esta edição 'Test-Drive' de 1992 possui recursos como suporte para vários protocolos de modem, scripts, personalização, configuração automática e até mesmo um Modo Host. Um artefato histórico valioso para entusiastas de telecomunicações, entusiastas de retrocomputação e qualquer pessoa interessada em software clássico DOS. No entanto, a compilação requer Turbo Pascal 5.x/6.0 e várias dependências, além de lidar com a gestão de sobreposições - uma tarefa desafiadora.

Leia mais
Desenvolvimento

pipask: Instalação Segura de Pacotes Python

2025-05-03
pipask: Instalação Segura de Pacotes Python

O pipask é uma alternativa mais segura ao pip, adicionando verificações de segurança antes de instalar pacotes Python. Ele prioriza o uso de metadados do PyPI, evitando o download e a execução de código sempre que possível. Se a execução de código de terceiros for necessária, o pipask solicita o consentimento do usuário. Após executar as verificações, incluindo a popularidade do repositório, a idade do pacote, vulnerabilidades conhecidas, contagens de downloads do PyPI e verificação de metadados, ele apresenta um relatório formatado e solicita aprovação. Após a aprovação, ele repassa a instalação para o pip padrão.

Leia mais
Desenvolvimento

Proxy LLM Remoto como Modelo Local em Kotlin: Uma Benção para o Assistente de IA do JetBrains

2025-05-03
Proxy LLM Remoto como Modelo Local em Kotlin: Uma Benção para o Assistente de IA do JetBrains

Devido à cota gratuita limitada do Assistente de IA do JetBrains, o autor desenvolveu um aplicativo Kotlin/Ktor que funciona como proxy para várias APIs de LLM, como OpenAI, Claude e Gemini, como APIs do LM Studio e Ollama, permitindo seu uso em IDEs do JetBrains. Aproveitando recursos sem reflexão, ele é construído como uma imagem nativa do GraalVM para compatibilidade multiplataforma e inicialização rápida. Suporta bate-papo em streaming, possui configuração fácil e recarregamento a quente.

Leia mais

Emulador Commodore 64 de ciclo exato em microcontroladores baratos

2025-05-03
Emulador Commodore 64 de ciclo exato em microcontroladores baratos

O Connomore64 é um projeto que realiza emulação de ciclo exato do Commodore 64 usando múltiplos microcontroladores RP2040/RP2350 baratos e paralelos. Inicialmente um projeto de férias para explorar as capacidades dos PIOs do RP2040, ele evoluiu para um emulador preciso que executa a maioria dos jogos e parte das demos, e até interage com hardware original do C64, como drives de disquete. Embora ainda esteja em desenvolvimento, ele demonstra o potencial de executar software de uso intensivo de computação em hardware de baixo custo e fornece uma estrutura para emulação paralela usando múltiplos RP2040/RP2350s.

Leia mais
Hardware

Treinando Robôs com Pi0, Lerobot e Rerun: Uma Abordagem de Retargeting de Movimento de Pose Humana

2025-05-02
Treinando Robôs com Pi0, Lerobot e Rerun: Uma Abordagem de Retargeting de Movimento de Pose Humana

Este projeto explora o treinamento de robôs usando Pi0, Lerobot e Rerun. Ele suporta Linux e utiliza o gerenciador de pacotes Pixi. O projeto envolve calibração de câmera, análise de pose e cinemática humana e extração de posições e ângulos de juntas 3D a partir de imagens multivisuais. O objetivo final é converter filmagens multi-câmera sincronizadas em parâmetros de junta ângulo-eixo e posições 3D utilizáveis por robôs para redirecionamento de movimento e aprendizado de habilidades motoras finas. Tutoriais do Jupyter Notebook são fornecidos, cobrindo pose e cinemática humana, redirecionamento de pose de corpo e mão e aprendizado por imitação e teleoperação.

Leia mais

BLAST: Um motor de serviço de alto desempenho para IA de navegação na web

2025-05-02
BLAST: Um motor de serviço de alto desempenho para IA de navegação na web

BLAST é um motor de serviço de alto desempenho para IA de navegação na web, oferecendo uma API compatível com OpenAI com concorrência e streaming integrados. Ele armazena em cache e paralisa automaticamente as tarefas para reduzir custos e permitir latências interativas. Um simples `pip install blastai && blastai serve` inicia o uso localmente, sem se preocupar com orçamento ou consumo excessivo de memória. Sua API compatível com OpenAI facilita a integração, transmitindo a saída do LLM aprimorada pelo navegador em tempo real.

Leia mais
Desenvolvimento

Demo de inferência GPT-2 no navegador usando WebGL2

2025-05-02
Demo de inferência GPT-2 no navegador usando WebGL2

Este projeto impressionante traz a passagem completa para frente do modelo GPT-2 pequeno (117M de parâmetros) para o navegador usando WebGL2. Aproveitando os shaders WebGL2 para computação na GPU e js-tiktoken para tokenização BPE (sem necessidade de WASM), ele executa o GPT-2 diretamente no navegador. Um script Python baixa os pesos pré-treinados, e o front-end é construído com Vite para substituição de módulos a quente. Este é um exemplo fantástico de trazer modelos avançados de IA para o navegador, mostrando as capacidades de ponta das tecnologias web.

Leia mais
IA

OSle: Um Sistema Operacional de 510 Bytes para o Setor de Boot

2025-05-02
OSle: Um Sistema Operacional de 510 Bytes para o Setor de Boot

OSle é um minúsculo sistema operacional (510 bytes) em modo real, que reside inteiramente no setor de boot. Escrito em assembly x86, ele surpreendentemente inclui um shell, sistema de arquivos, gerenciamento de processos, softwares pré-construídos e um SDK para desenvolver seus próprios programas. O artigo fornece instruções detalhadas para instalação, construção, execução do OSle localmente (usando Bochs ou QEMU) e até mesmo execução em um dispositivo real (com um forte aviso!). Uma demonstração online e um tutorial também estão disponíveis. Este é um projeto fascinante para aqueles interessados em sistemas operacionais e programação de baixo nível.

Leia mais
Desenvolvimento assembly x86

Kubetail: Painel de Logs em Tempo Real para Kubernetes

2025-05-01
Kubetail: Painel de Logs em Tempo Real para Kubernetes

Kubetail é um painel de logs em tempo real para Kubernetes, otimizado para acompanhar logs de cargas de trabalho multicôntainer. Com o Kubetail, você pode visualizar logs de todos os contêineres em uma carga de trabalho (por exemplo, Deployment ou DaemonSet) mesclados em uma única linha do tempo cronológica, entregue ao seu navegador ou terminal. O ponto de entrada principal para o Kubetail é a ferramenta de linha de comando kubetail, que pode iniciar um painel web local na sua área de trabalho ou transmitir logs brutos diretamente para seu terminal. Por trás dos panos, o Kubetail usa a API do Kubernetes do seu cluster para buscar logs diretamente do seu cluster, para que funcione imediatamente sem precisar encaminhar seus logs para um serviço externo primeiro. O Kubetail também usa sua API do Kubernetes para rastrear eventos do ciclo de vida do contêiner para manter sua linha do tempo de log sincronizada à medida que os contêineres são iniciados, parados ou substituídos. Isso facilita o acompanhamento contínuo dos logs à medida que as solicitações do usuário passam de um contêiner efêmero para outro em diferentes serviços.

Leia mais

Changesets: Simplificando o Gerenciamento de Versões e Logs de Mudanças para Repositórios Multipacote

2025-05-01
Changesets: Simplificando o Gerenciamento de Versões e Logs de Mudanças para Repositórios Multipacote

Changesets é uma ferramenta projetada para simplificar o gerenciamento de versões e logs de mudanças, especialmente para repositórios multipacote. Permite que os contribuidores declarem como suas alterações devem ser lançadas, automatizando a atualização das versões dos pacotes, logs de mudanças e publicação de novas versões com base nessas informações. Changesets se destaca ao resolver as complexidades do gerenciamento de versões em repositórios multipacote, mantendo pacotes interdependentes atualizados e simplificando as alterações em grupos de pacotes. Usa arquivos changeset para definir intenções de lançamento, e uma ferramenta de linha de comando combina vários changesets em um único lançamento, lidando com dependências internas, atualizando logs de mudanças e lançando todos os pacotes atualizados de um monorepositório com um único comando. Documentação abrangente, recomendações de integração de CI e uma ação do GitHub para automatizar pull requests de versionamento e publicação também são fornecidas.

Leia mais

ART: Melhores resultados de LLMs com mudanças mínimas de código via RL

2025-04-30
ART: Melhores resultados de LLMs com mudanças mínimas de código via RL

O Agent Reinforcement Trainer (ART) é uma biblioteca de aprendizado por reforço de código aberto projetada para aumentar o desempenho de modelos de linguagem grandes (LLMs) em fluxos de trabalho de agentes. Utilizando o poderoso algoritmo GRPO, o ART treina modelos a partir de suas próprias experiências. Ao contrário da maioria das bibliotecas de RL, o ART se integra perfeitamente em bases de código existentes, descarregando a complexidade do loop de treinamento de RL para seu backend. O ART consiste em um cliente (para interagir com seu código) e um servidor (lidando com inferência e treinamento). O loop de treinamento envolve inferência (coleta de dados e atribuição de recompensas) e treinamento (usando GRPO para treinar o modelo e atualizar LoRAs). O ART suporta a maioria dos modelos de linguagem causal compatíveis com vLLM/HuggingFace Transformers. Atualmente em alfa, o ART aceita contribuições.

Leia mais
Desenvolvimento

DeepSeek-Prover-V2: Aprimorando o raciocínio matemático formal por meio de aprendizado por reforço

2025-04-30
DeepSeek-Prover-V2: Aprimorando o raciocínio matemático formal por meio de aprendizado por reforço

DeepSeek-Prover-V2 é um modelo de linguagem grande de código aberto projetado para prova de teoremas formais em Lean 4. Ele utiliza um pipeline de prova de teoremas recursivo alimentado pelo DeepSeek-V3 e aprendizado por reforço para integrar o raciocínio matemático formal e informal. O modelo começa decompondo problemas complexos em subobjetivos usando o DeepSeek-V3, sintetizando provas desses subobjetivos para criar dados iniciais para o aprendizado por reforço. O DeepSeek-Prover-V2-671B alcança desempenho de ponta, atingindo uma taxa de aprovação de 88,9% no MiniF2F-test e resolvendo 49 problemas do PutnamBench. Um novo conjunto de dados de referência, ProverBench, contendo 325 problemas formalizados de competições do ensino médio e livros didáticos, também é introduzido.

Leia mais

Raven: O ecossistema OCaml para Machine Learning

2025-04-30
Raven: O ecossistema OCaml para Machine Learning

Raven é um ecossistema abrangente que traz aprendizado de máquina e ciência de dados para OCaml. Ele oferece bibliotecas que espelham ferramentas populares do Python, como NumPy (com Ndarray), Jupyter (com Quill) e JAX (com Rune), buscando a facilidade de uso do Python, enquanto aproveita a segurança de tipo e o desempenho do OCaml. Atualmente em pré-alfa, Raven possui um conjunto crescente de ferramentas para computação numérica, visualização (Hugin) e muito mais, prometendo uma alternativa convincente para cientistas de dados que buscam uma linguagem mais segura e rápida.

Leia mais
Desenvolvimento

A Arte de Dizer Não: Uma API Leve para Rejeições Elegantes

2025-04-30
A Arte de Dizer Não: Uma API Leve para Rejeições Elegantes

Cansado de lutar para recusar educadamente pedidos? Esta API leve, "No as a Service", oferece milhares de razões criativas e divertidas para rejeição em qualquer situação. Fácil de integrar em aplicativos, bots, páginas de destino e muito mais, ela até ajuda a criar cartas de rejeição espirituosas. O código aberto é simples de executar, tornando-o uma ferramenta divertida e eficiente para dizer "não" com estilo.

Leia mais
Desenvolvimento Razões de Rejeição Leve

MiMo-7B: Modelo de Linguagem de 7B Parâmetros para Raciocínio Supera Modelos de 32B

2025-04-30
MiMo-7B: Modelo de Linguagem de 7B Parâmetros para Raciocínio Supera Modelos de 32B

A Xiaomi apresenta o MiMo-7B, um modelo de linguagem de 7 bilhões de parâmetros projetado para raciocínio. Por meio de dados e estratégias de pré-treinamento otimizados, juntamente com técnicas inovadoras de aprendizado por reforço, o MiMo-7B demonstra desempenho excepcional em tarefas de raciocínio matemático e de código, superando até mesmo modelos de 32B parâmetros maiores. O modelo de código aberto inclui pontos de verificação para o modelo base, modelo SFT e modelos treinados por RL, oferecendo recursos valiosos para o desenvolvimento de LLMs de raciocínio poderosos.

Leia mais

Executando Linux no Excel: Uma Brincadeira Divertida

2025-04-30
Executando Linux no Excel: Uma Brincadeira Divertida

Um desenvolvedor conseguiu executar um sistema Linux dentro do Microsoft Excel! Usando um emulador leve chamado mini-rv32ima, compilado como um DLL e chamado por meio de macros VBA, o desenvolvedor conseguiu exibir a saída do Linux diretamente nas células do Excel. Embora o projeto seja considerado com bugs e o autor admita ter usado um DLL externo em vez de reescrever o emulador em VBA ou fórmulas do Excel, é um experimento criativo e divertido que demonstra engenhosidade e habilidade de programação.

Leia mais
Desenvolvimento

AgenticSeek: Uma Alternativa Privada e Local ao Manus AI

2025-04-29
AgenticSeek: Uma Alternativa Privada e Local ao Manus AI

O AgenticSeek é um assistente de IA totalmente local e habilitado por voz que navega na web, escreve código e planeja tarefas de forma autônoma, mantendo todos os dados no seu dispositivo. Projetado para modelos de raciocínio local, ele garante privacidade completa e nenhuma dependência da nuvem. Ele suporta várias linguagens de programação e seleciona automaticamente o melhor agente de IA para cada tarefa. O projeto é de código aberto e está ativamente procurando contribuidores.

Leia mais
IA

Neurox: Simplificando o monitoramento de cargas de trabalho de IA com um gráfico Helm

2025-04-29
Neurox: Simplificando o monitoramento de cargas de trabalho de IA com um gráfico Helm

Neurox simplifica o monitoramento de cargas de trabalho de IA em seu cluster Kubernetes GPU. Seu gráfico Helm automatiza a instalação, provisionando um subdomínio, credenciais do registro de imagens, IdP e certificados TLS. Painéis e relatórios pré-construídos combinam métricas e dados em tempo real do runtime do Kubernetes para administradores, desenvolvedores, pesquisadores e auditores. Gratuito para até 64 GPUs (somente GPUs NVIDIA), com licenciamento empresarial disponível. Pré-requisitos incluem um cluster Kubernetes, cert-manager, ingress-nginx, o operador NVIDIA GPU e o Kube Prometheus Stack.

Leia mais

Beatsync: Um reprodutor de áudio web de alta precisão para múltiplos dispositivos

2025-04-29
Beatsync: Um reprodutor de áudio web de alta precisão para múltiplos dispositivos

Beatsync é um reprodutor de áudio web de alta precisão projetado para reprodução em vários dispositivos. Ele apresenta sincronização precisa em milissegundos usando primitivas inspiradas em NTP, compatibilidade multiplataforma (Chrome recomendado), recursos de áudio espacial para efeitos sonoros exclusivos por meio de fontes de audição virtuais e uma interface polida. Também é auto-hostável com configuração mínima. Atualmente em desenvolvimento inicial, o suporte total é limitado a navegadores Chrome para desktop, enquanto a sincronização móvel é experimental e pode ser instável.

Leia mais

CoRT: Fazendo a IA Pensar Recursivamente para Desempenho Superior

2025-04-29
CoRT: Fazendo a IA Pensar Recursivamente para Desempenho Superior

CoRT (Chain of Recursive Thoughts) aumenta significativamente o desempenho da IA, forçando o modelo a refinar repetidamente suas respostas. O modelo gera várias respostas alternativas, as avalia e seleciona a melhor, imitando a autodúvida e a melhoria iterativa. Testes com o Mistral 3.1 24B mostraram uma melhoria dramática em tarefas de programação. A mágica reside na autoavaliação, geração de alternativas competitivas, refinamento iterativo e profundidade de pensamento dinâmica. O projeto é de código aberto e aceita contribuições.

Leia mais

ArkFlow: Motor de processamento de stream do Rust de alto desempenho

2025-04-29
ArkFlow: Motor de processamento de stream do Rust de alto desempenho

ArkFlow é um motor de processamento de stream de alto desempenho construído em Rust e Tokio, oferecendo recursos poderosos de processamento de stream de dados. Ele suporta várias fontes de entrada/saída (Kafka, MQTT, HTTP, arquivos, etc.) e processadores (JSON, SQL, Protobuf, etc.), com uma configuração YAML flexível. Recursos integrados incluem consultas SQL, processamento JSON e codificação/decodificação Protobuf. ArkFlow é altamente extensível e inclui buffer para lidar com backpressure e diversas opções de saída de erro. Comece clonando o repositório e seguindo as instruções simples de construção e execução.

Leia mais
Desenvolvimento

ROSplat: Visualizador Online Baseado em ROS2 e Gaussian Splatting

2025-04-29
ROSplat: Visualizador Online Baseado em ROS2 e Gaussian Splatting

ROSplat é o primeiro visualizador online baseado em ROS2 que utiliza o Gaussian splatting para renderizar cenas 3D complexas em tempo real. Ele processa eficientemente milhões de Gaussianas usando mensagens ROS2 personalizadas e técnicas de classificação e renderização aceleradas por GPU. Suporta carregamento de dados de arquivos PLY e integra-se com ferramentas ROS2, como gravação de bags. Uma GPU NVIDIA é recomendada para melhor desempenho. Opções de instalação incluem pip ou Docker. Desenvolvido por Shady Gmira com agradecimentos a Qihao Yuan e Kailai Li pela orientação.

Leia mais
Desenvolvimento

Repositório de código-fonte do Homebrew Channel revela violação massiva de direitos autorais

2025-04-29
Repositório de código-fonte do Homebrew Channel revela violação massiva de direitos autorais

O repositório de código-fonte para o software homebrew do Wii, The Homebrew Channel, foi lançado, mas sua biblioteca principal, libogc, foi exposta por violação massiva de direitos autorais. Os desenvolvedores da libogc não apenas roubaram código proprietário da Nintendo, mas também um RTOS de código aberto, RTEMS, removendo todas as informações de atribuição e direitos autorais. Os desenvolvedores ignoraram perguntas, recorrendo até mesmo a abusos e a exclusão de comentários para evitar a responsabilização. Devido à gravidade dos problemas de direitos autorais, o projeto foi arquivado e o desenvolvimento posterior é desencorajado. O incidente destaca a importância de respeitar os direitos autorais e de cumprir as leis e regulamentos.

Leia mais
Desenvolvimento

Desempenho de construção de contêineres Go: Nix nem sempre é mais rápido

2025-04-28
Desempenho de construção de contêineres Go: Nix nem sempre é mais rápido

Este artigo compara diferentes métodos para construir contêineres Go, utilizando Docker e Nix. O autor usa um programa Go simples com métricas do Prometheus para medir os tempos de construção e os tamanhos das imagens. O cache do Docker melhorou significativamente a velocidade de construção, enquanto o Nix, apesar de sua reprodutibilidade, não foi mais rápido. Imagens baseadas em scratch produziram contêineres muito menores do que distroless. A compressão UPX reduziu ainda mais o tamanho das imagens. O cache de proxy Athens e Squid também foram testados. O autor fornece dicas práticas para construir contêineres Go mais rápido, incluindo o uso de um arquivo .dockerignore para excluir a pasta .git.

Leia mais

Sim Studio: Plataforma poderosa para fluxos de trabalho agentivos

2025-04-28
Sim Studio: Plataforma poderosa para fluxos de trabalho agentivos

O Sim Studio é uma plataforma poderosa e amigável para construir, testar e otimizar fluxos de trabalho agentivos. Ele oferece versões hospedadas em nuvem e opções de auto-hospedagem. A auto-hospedagem é suportada por meio do Docker, com instruções detalhadas fornecidas para configuração usando o Docker Compose. A plataforma também se integra a modelos locais, oferecendo opções para uso de CPU e GPU. O desenvolvimento é otimizado com Contêineres Remotos do VS Code e npm. O projeto é de código aberto sob a Licença Apache 2.0 e aceita contribuições.

Leia mais

operative.sh: Depuração Automática de Aplicativos Web com o Servidor MCP

2025-04-28
operative.sh: Depuração Automática de Aplicativos Web com o Servidor MCP

operative.sh apresenta o Servidor MCP, uma ferramenta que utiliza um agente baseado em navegador para depurar aplicativos web autonomamente diretamente no seu editor de código. O 'agente Cursor' executa e depura o código, fornecendo relatórios detalhados, incluindo tráfego de rede, logs do console e um cronograma cronológico. Após a instalação e a obtenção de uma chave de API gratuita, os desenvolvedores podem automatizar seu fluxo de trabalho de depuração, aumentando significativamente a eficiência. Suporta macOS, Linux e Windows.

Leia mais

Autarkie: Fuzzing instantâneo de gramática usando macros Rust

2025-04-28
Autarkie: Fuzzing instantâneo de gramática usando macros Rust

Autarkie é um fuzzer de gramática nativo construído em Rust. Usando macros procedimentais, ele cria (quase completamente) automaticamente um fuzzer de gramática. Ele suporta AFL ++ (Forkserver) e cargo-fuzz (Inprocess) e pode ser usado para fuzzing de projetos C/C++ e Rust. Autarkie se destaca por sua gramática sem manutenção, cobertura de gramática exaustiva, corpus reutilizável e capacidade de aprendizado de outros fuzzers (em desenvolvimento). Dois exemplos demonstram como fazer fuzzing em SQLite3 e no interpretador sbpf do Solana, destacando sua facilidade de uso e eficiência. Atualmente está em beta e requer um compilador Rust nightly.

Leia mais
Desenvolvimento gramática

tiny-llm: Servindo LLMs em uma Semana - Um Tutorial Prático

2025-04-28
tiny-llm: Servindo LLMs em uma Semana - Um Tutorial Prático

tiny-llm é um tutorial que o guia na construção de uma infraestrutura de serviço LLM em uma semana. Ele se concentra no uso das APIs de matriz/array do MLX, evitando APIs de rede neural de alto nível para construir do zero e entender as otimizações. O tutorial abrange conceitos essenciais como mecanismos de atenção, RoPE e atenção de consulta agrupada, progredindo para o carregamento do modelo e a geração de respostas. Atualmente, atenção, RoPE e carregamento do modelo estão completos. Capítulos futuros abordarão o armazenamento em cache KV, multiplicação de matrizes quantizadas, Flash Attention e outras otimizações, visando um serviço LLM eficiente para modelos como Qwen2.

Leia mais
Desenvolvimento Serviço de Modelo

CleverBee: Assistente de pesquisa com IA avançado

2025-04-28
CleverBee: Assistente de pesquisa com IA avançado

CleverBee é um poderoso agente de pesquisa baseado em Python que utiliza modelos de linguagem grandes (LLMs) como Claude e Gemini, Playwright para navegação na web e Chainlit para uma interface de usuário interativa. Ele realiza pesquisas navegando na web, extraindo conteúdo, limpando dados e resumindo as descobertas com base nos tópicos de pesquisa do usuário. Possui suporte para vários LLMs, navegação web automatizada, processamento de conteúdo, rastreamento de tokens, alta configurabilidade e cache de LLM. É totalmente compatível com macOS e Linux.

Leia mais
1 2 18 19 20 22 24 25 26 48 49