Novos modelos da OpenAI apresentam mais alucinações: maior não é sempre melhor

2025-04-18
Novos modelos da OpenAI apresentam mais alucinações: maior não é sempre melhor

Os modelos o3 e o4-mini, recentemente lançados pela OpenAI, embora estejam na vanguarda em muitos aspectos, apresentam um aumento preocupante em alucinações em comparação com seus antecessores. Testes internos revelam taxas de alucinação significativamente maiores do que os modelos de raciocínio anteriores (o1, o1-mini e o3-mini) e até mesmo modelos não-raciocínio tradicionais como o GPT-4o. A OpenAI não tem certeza da causa, o que representa um desafio para os setores que exigem precisão. Testes de terceiros confirmam esse problema, com o o3 fabricando etapas em seu processo de raciocínio. Embora se destaque em codificação e matemática, a maior taxa de alucinação limita a aplicabilidade. Abordar as alucinações do modelo é uma área fundamental da pesquisa em IA, com a concessão de recursos de pesquisa na web aos modelos emergindo como uma abordagem promissora.

Leia mais

A Ascensão da Equipe de Limpeza de IA: Humanos Consertando a Bagunça da IA

2025-09-24
A Ascensão da Equipe de Limpeza de IA: Humanos Consertando a Bagunça da IA

O aumento de ferramentas de IA como o ChatGPT levou a um aumento no conteúdo de baixa qualidade, apelidado de "lodo de IA". Isso inclui conteúdo impreciso, desoriginal e irreal em várias mídias. Ironicamente, enquanto a IA desloca empregos humanos, ela simultaneamente cria uma nova indústria: "zeladores digitais" que corrigem os erros da IA. Isso destaca as limitações da IA no trabalho criativo e o papel insubstituível dos humanos em garantir qualidade e autenticidade. Precisamos repensar a relação entre IA e criatividade humana para evitar a proliferação de lodo de IA e construir um mundo digital mais autêntico e sustentável.

Leia mais

SkunkHTML: Gerador de Sites Estáticos para GitHub Pages

2024-12-27
SkunkHTML: Gerador de Sites Estáticos para GitHub Pages

SkunkHTML é um gerador de sites estáticos alimentado pelo GitHub Actions, permitindo que os usuários criem e implantem rapidamente blogs pessoais ou sites no GitHub Pages usando arquivos Markdown. Basta enviar seus arquivos Markdown para a pasta `/markdown-blog/`, e o GitHub Actions automaticamente cria e implanta o site atualizado. O SkunkHTML suporta o sistema de comentários Giscus e fornece documentação e exemplos detalhados. O projeto é totalmente de código aberto e pode ser bifurcado diretamente no GitHub sem necessidade de download local.

Leia mais
Desenvolvimento gerador de sites estáticos

Nova API ASN.1 do PyCA Cryptography: Velocidade e Segurança

2025-04-18

A equipe do PyCA Cryptography está desenvolvendo uma nova API ASN.1 usando um analisador puro em Rust para desempenho significativamente melhorado e riscos de segurança reduzidos provenientes de diferenças com outros analisadores ASN.1. A nova API também apresenta uma interface de estilo dataclasses declarativa para melhor legibilidade e manutenção do código. Isso aborda as deficiências nas bibliotecas ASN.1 existentes em Python em relação ao desempenho e segurança, e oferece suporte melhor a ecossistemas emergentes como o Sigstore.

Leia mais
Desenvolvimento

Onyx: Plataforma GenAI de código aberto contrata Engenheiro de IA/ML

2025-04-22
Onyx: Plataforma GenAI de código aberto contrata Engenheiro de IA/ML

A Onyx, uma plataforma GenAI de código aberto popular com centenas de milhares de usuários, está contratando um Engenheiro de IA/ML em São Francisco. A vaga exige 3+ anos de experiência na construção de aplicativos de IA/ML do mundo real, profundo conhecimento de PyTorch/TensorFlow, modelos de PNL e algoritmos de ML padrão, e familiaridade com os mais recentes LLMs, RAG e estruturas de agentes. As responsabilidades incluem melhorar as capacidades de agente e recuperação de conhecimento da Onyx, aprimorar o QA de múltiplos saltos e a pesquisa precisa e melhorar a experiência do usuário da plataforma. A Onyx recebeu US$ 10 milhões em investimento seed e conta com clientes como Netflix e Ramp.

Leia mais
IA

Experiência do Agente (AX): Projetando para a Ascensão dos Agentes de IA

2025-02-07
Experiência do Agente (AX): Projetando para a Ascensão dos Agentes de IA

Agentes de IA como o ChatGPT estão revolucionando a maneira como interagimos com aplicativos. Este artigo argumenta que precisamos mudar de foco, deixando de lado apenas a Experiência do Usuário (UX) para a Experiência do Agente (AX), enfatizando o acesso seguro, transparente e com consentimento do usuário a dados e ações de máquina. O OAuth é apresentado como a chave para o acesso seguro e controlado do agente, oferecendo permissões granulares e revogação. Elementos-chave para uma ótima AX incluem APIs limpas, integração fácil, operações de agente sem atrito e autenticação em camadas. O artigo conclui defendendo que todos os aplicativos se tornem provedores de OAuth, construindo um ecossistema AX aberto para uma vantagem competitiva.

Leia mais

EUA proíbe veículos chineses, afetando Polestar e outros

2025-01-15
EUA proíbe veículos chineses, afetando Polestar e outros

Os EUA finalizaram uma regra que efetivamente proíbe a importação de veículos conectados fabricados na China, mesmo aqueles fabricados nos EUA, citando preocupações com a segurança nacional. Isso afeta grandes fabricantes de automóveis como Ford e GM, empresas menores como Polestar e até mesmo a Waymo. A proibição abrange tecnologias como Bluetooth e Wi-Fi, com o objetivo de evitar a coleta de dados pela China. Ela entrará em vigor em 2027 para software e 2030 para hardware, com exceções para veículos com mais de 10.000 libras. A indústria automobilística se opõe fortemente à proibição; a Polestar declarou que isso impediria a empresa de vender carros nos EUA. Isso representa uma escalada nas tensões comerciais entre EUA e China e destaca as crescentes preocupações com a segurança de dados e a segurança nacional.

Leia mais

IA desenha todas as estradas de uma cidade de uma só vez

2024-12-21
IA desenha todas as estradas de uma cidade de uma só vez

Imagine desenhar todas as estradas de uma cidade com um único clique! Essa tecnologia, que antes parecia saída de um filme de ficção científica, agora é realidade graças à IA. Algoritmos avançados e análise de dados em massa permitem que a IA mapeie rápida e precisamente toda a rede viária de uma cidade, fornecendo uma ferramenta eficiente para planejamento urbano, gestão de tráfego e desenvolvimento de infraestrutura. Essa tecnologia não apenas melhora a eficiência, mas também abre novas possibilidades para uma gestão mais refinada da cidade, inaugurando uma nova era de planejamento urbano inteligente.

Leia mais

Quebec para de subsidiar a fabricante de veículos elétricos Lion Electric

2025-05-02
Quebec para de subsidiar a fabricante de veículos elétricos Lion Electric

O governo de Quebec anunciou que não fornecerá mais fundos para a Lion Electric, fabricante de veículos elétricos em dificuldades financeiras e que busca proteção de credores. Apesar do passado da Lion Electric como carro-chefe nas ambições de veículos elétricos de Quebec, o governo considerou o investimento irresponsável devido à mudança na política dos EUA e falhas no próprio programa de subsídios de Quebec. Essa decisão coloca em risco os esforços de reestruturação da empresa e deixa os operadores de ônibus escolares de Quebec em uma posição difícil, enfrentando mandatos para ônibus elétricos. O governo está reavaliando seu plano de eletrificação e explorando soluções alternativas para atingir suas metas de veículos elétricos.

Leia mais
Tecnologia

A Armadilha do Prazer na Era da Abundância: A Natureza do Vício

2025-04-08
A Armadilha do Prazer na Era da Abundância: A Natureza do Vício

Naval argumenta que todo prazer traz consigo dor compensatória e medo de perda. Na era atual da abundância, a busca do prazer por si só leva facilmente ao vício. Ele cita a frase de Miyamoto Musashi: "Não busque o prazer pelo prazer em si", destacando que as tentações modernas facilmente disponíveis – alimentos processados, pornografia na internet, drogas e mídia social – criam caminhos fáceis para o vício. Essas dependências são essencialmente 'trabalho falso' e 'diversão falsa', proporcionando prazer passageiro, enquanto entorpecem e deixam a pessoa vulnerável à miséria de sua ausência. O desafio moderno reside em resistir a essas dependências 'armadas' e reconstruir conexões com a sociedade, a religião e a cultura.

Leia mais
(nav.al)

Crise de Reprodutibilidade em Pesquisa Biomédica Brasileira: Metade dos Experimentos Falha em se Replicar

2025-04-25
Crise de Reprodutibilidade em Pesquisa Biomédica Brasileira: Metade dos Experimentos Falha em se Replicar

Um estudo em larga escala envolvendo mais de 50 equipes de pesquisa brasileiras descobriu que mais da metade dos experimentos biomédicos não conseguiram ser reproduzidos. As equipes selecionaram três métodos biomédicos comuns e replicaram experimentos de artigos publicados entre 1998 e 2017. Os resultados mostraram que apenas 21% dos experimentos atenderam aos critérios de reprodutibilidade, com os artigos originais relatando tamanhos de efeito em média 60% maiores do que as replicações. Isso destaca problemas de reprodutibilidade na pesquisa biomédica brasileira e fornece evidências cruciais para melhorar as práticas e políticas de pesquisa.

Leia mais

Calculadora Simples em Tempo Real usando Tree-sitter e Cranelift JIT

2024-12-27
Calculadora Simples em Tempo Real usando Tree-sitter e Cranelift JIT

Este projeto GitHub demonstra uma calculadora simples em tempo real construída com Tree-sitter e Cranelift JIT. O código principal é altamente integrado para facilitar a compreensão. O projeto inclui a gramática, uma interface REPL, testes de estresse e benchmarks. Modificar a gramática atualiza automaticamente o binário principal. A realce de sintaxe é usada como um exemplo das capacidades do Tree-sitter.

Leia mais
Desenvolvimento Calculadora em Tempo Real

OpenVox 8.11: Fork do Puppet de código aberto lançado pela comunidade!

2025-01-22

O OpenVox 8.11, uma implementação de código aberto do Puppet mantida pela comunidade, foi lançado! Funcionalmente equivalente ao Puppet, ele foi projetado como uma substituição direta, embora ainda não seja tão testado. A migração é simples — basta substituir os pacotes —, mas atualmente usa os repositórios apt|yum.overlookinfratech.com. Não recomendado para ambientes de produção críticos ainda. A Overlook InfraTech oferece um serviço de migração pago e planeja estabelecer um Comitê Diretor de Padrões Puppet™️ para orientar o futuro do OpenVox. O OpenVox visa: modernizar a base de código e o ecossistema; dar suporte aos sistemas operacionais e versões do Ruby atuais; focar nas necessidades da comunidade; democratizar o suporte à plataforma; e manter uma comunidade de código aberto ativa.

Leia mais
Desenvolvimento

Zev: Encontre comandos de terminal com linguagem natural

2025-04-24
Zev: Encontre comandos de terminal com linguagem natural

Zev é uma ferramenta construída sobre a API OpenAI que permite que você encontre ou lembre comandos de terminal usando linguagem natural. Por exemplo, você pode digitar 'mostrar todos os processos Python em execução' para encontrar o comando relevante. Zev suporta várias operações, incluindo operações de arquivo, informações do sistema, comandos de rede e operações Git. Você também pode usar Ollama como uma alternativa local para evitar depender da API OpenAI. O projeto é de código aberto e contribuições são bem-vindas.

Leia mais

Adolescente se entrega em caso de ciberataque em cassinos de Las Vegas de 2023

2025-09-21
Adolescente se entrega em caso de ciberataque em cassinos de Las Vegas de 2023

Um adolescente se entregou às autoridades de Las Vegas em conexão com os ciberataques de 2023 que afetaram a MGM Resorts International e a Caesars Entertainment. Os ataques, usando vishing, resultaram em centenas de milhões de dólares em perdas. O suspeito enfrenta seis acusações de crime e os promotores estão buscando julgá-lo como adulto. A prisão faz parte de uma investigação maior do FBI que já indiciou outras quatro pessoas. Enquanto a MGM recusou uma exigência de resgate, sofrendo aproximadamente US$ 100 milhões em perdas, a Caesars teria pago parte de uma exigência de resgate e experimentou menos interrupções.

Leia mais
Tecnologia

Instant SQL: Diga adeus à construção tediosa de consultas

2025-04-24
Instant SQL: Diga adeus à construção tediosa de consultas

A MotherDuck apresenta o Instant SQL, uma abordagem revolucionária para escrever SQL. Este novo recurso fornece atualizações em tempo real do conjunto de resultados enquanto você digita, acelerando drasticamente a construção e a depuração de consultas. Sem mais esperas para a execução de consultas; o Instant SQL oferece feedback com latência zero. Ele aborda o antigo problema de escrita de SQL lenta e tediosa, permitindo visualizações em tempo real dos resultados, inspeção e edição de CTEs e decomposição sem esforço de expressões de colunas complexas. Ele suporta todas as fontes de dados pesquisáveis pelo DuckDB e integra-se perfeitamente com sugestões alimentadas por IA. Essa inovação aproveita a velocidade do DuckDB, análise de AST, mapeamento preciso do cursor e cache inteligente.

Leia mais
Desenvolvimento

Implementação de Modem DMR de Código Aberto com GNU Radio e Codec2

2025-04-19

Este artigo descreve uma implementação de modem de Rádio Móvel Digital (DMR) de código aberto usando Rádio Definido por Software (SDR), GNU Radio e Codec2. Este modem, um protótipo funcional para chamadas de voz, utiliza o GNU Radio para a camada física, o MMDVMHost para as camadas de enlace de dados e parcialmente a camada de controle de chamadas, e o Codec2 como codec de voz. O desenvolvimento futuro visa incorporar mais recursos do padrão DMR, incluindo mensagens de dados, funcionalidade de Nível III e transporte IPv4. Testado com um LimeSDR-mini, o projeto enfrenta desafios como latência e precisão de temporização TDMA.

Leia mais
Desenvolvimento

Centros de Mesa e Conjuntos de Almoço de Crochê de 1915: Um Guia Detalhado

2025-04-19
Centros de Mesa e Conjuntos de Almoço de Crochê de 1915: Um Guia Detalhado

Publicado em 1915 por Anne Orr por 25 centavos, "Peças Centrais e Conjuntos de Almoço" é um guia abrangente para crochetar vários centros de mesa e guardanapos. O livro apresenta instruções detalhadas e ilustrações para criar peças que variam em complexidade, desde simples trabalhos de crochê até designs elaborados incorporando abacaxis e trevos. Completo com explicações de pontos de crochê e abreviações, é um tesouro vintage para entusiastas de artesanato.

Leia mais

Pare de fazer softwares agirem como vendedores irritantes!

2025-04-23

Este artigo critica as empresas de tecnologia por projetar softwares para se comportarem como vendedores manipuladores com motivos ocultos, em vez de máquinas precisas. Exemplos como a recomendação persistente de shorts indesejados do YouTube demonstram essa experiência frustrante do usuário. O autor argumenta que isso prejudica a compreensão das pessoas sobre computadores, especialmente as gerações mais jovens que acreditam que o software deve ser persuasivo em vez de obediente a instruções claras. O apelo à ação é um retorno ao comportamento de software preciso e previsível, não à imitação humana.

Leia mais
Design

GCC 15.1 Lançado: Atualização Principal para o Coleção de Compiladores GNU

2025-04-25

Os desenvolvedores do GCC têm o prazer de anunciar o lançamento do GCC 15.1, uma versão principal com novos recursos e melhorias significativas em relação ao GCC 14.x. O GCC, que já foi o GNU C Compiler, agora representa o GNU Compiler Collection, suportando várias linguagens de programação. Este lançamento é um testemunho dos numerosos contribuidores que forneceram novos recursos, correções de bugs e melhorias. Para obter mais informações, visite o site do projeto GCC ou entre em contato com a lista de discussão de desenvolvimento do GCC.

Leia mais
Desenvolvimento Atualização de Software

arXivLabs: Projetos experimentais com colaboradores da comunidade

2025-04-21
arXivLabs: Projetos experimentais com colaboradores da comunidade

arXivLabs é uma estrutura que permite que colaboradores desenvolvam e compartilhem novos recursos do arXiv diretamente em nosso site. Indivíduos e organizações que trabalham com o arXivLabs adotaram e aceitaram nossos valores de abertura, comunidade, excelência e privacidade de dados do usuário. O arXiv está comprometido com esses valores e trabalha apenas com parceiros que os respeitam. Tem uma ideia para um projeto que agregará valor à comunidade do arXiv? Saiba mais sobre o arXivLabs.

Leia mais
Desenvolvimento

ClickHouse abraça Rust: Uma jornada de integração desafiadora

2025-04-09
ClickHouse abraça Rust: Uma jornada de integração desafiadora

O ClickHouse, originalmente escrito em C++, embarcou em uma jornada para integrar o Rust a fim de atrair mais desenvolvedores e expandir suas capacidades. O artigo detalha esse processo, desde a escolha inicial da função de hash BLAKE3 como projeto piloto até a integração da linguagem de consulta PRQL e da biblioteca Delta Lake. A jornada encontrou vários desafios, incluindo a integração do sistema de construção, gerenciamento de memória, tratamento de erros e problemas de compilação cruzada. Apesar de problemas como bugs em bibliotecas Rust, nomes de símbolos excessivamente grandes e problemas de interoperabilidade com o código C++, a equipe do ClickHouse superou esses obstáculos, integrando com sucesso o Rust ao projeto e abrindo caminho para o desenvolvimento futuro.

Leia mais
Desenvolvimento

RNNs aceleradas por GPU: Uma implementação CUDA de minGRU e minLSTM

2025-09-21

Este post de blog detalha um projeto final para o curso CS179: Programação de GPU do Caltech, que verifica as afirmações do artigo de Feng et al., “Were RNNs All We Needed?”. O projeto implementou modelos simplificados minGRU e minLSTM e um algoritmo de varredura paralela CUDA personalizado. Os resultados mostraram acelerações significativas da GPU para sequências longas, validando a descoberta principal do artigo de que a recorrência RNN pode ser paralelizada. No entanto, para sequências curtas, a sobrecarga de inicialização do kernel CUDA anulou alguns ganhos de desempenho. O perfil do kernel da GPU revelou a camada de projeção final como o principal gargalo, sugerindo otimização adicional por meio de uma única chamada cuBLAS GEMM.

Leia mais
Desenvolvimento algoritmos paralelos

Bruin: Construa pipelines de dados com SQL e Python

2024-12-17
Bruin: Construa pipelines de dados com SQL e Python

Bruin é uma poderosa ferramenta de pipeline de dados que combina ingestão de dados, transformação de dados com SQL e Python e verificações de qualidade de dados em uma única estrutura. Funciona com as principais plataformas de dados e é executado em sua máquina local, em uma instância EC2 ou em GitHub Actions. Recursos importantes incluem ingestão de dados, transformações SQL e Python, verificações de qualidade de dados, modelos Jinja, validação de ponta a ponta e suporte para vários ambientes. Os pipelines são facilmente definidos usando um simples arquivo pipeline.yml.

Leia mais
Desenvolvimento pipeline de dados

Marco histórico para energia renovável nos EUA: Solar e eólica ultrapassam o carvão

2025-04-21
Marco histórico para energia renovável nos EUA: Solar e eólica ultrapassam o carvão

Um marco foi alcançado no setor elétrico dos EUA: a geração de energia solar e eólica ultrapassou a do carvão pela primeira vez, representando juntas 17% da matriz elétrica americana. Na última década, a geração de energia solar aumentou mais de nove vezes, atingindo 9,2%, e prevê-se que represente mais da metade da nova capacidade de geração dos EUA em 2025. Essa mudança marca uma transformação significativa na paisagem energética dos EUA, mostrando a ascensão imparável da energia limpa.

Leia mais
Tecnologia

A Diferença Entre Engenheiros Fortes e Fracos

2024-12-27

Este artigo explora as capacidades que diferenciam engenheiros fortes de engenheiros médios. Engenheiros fortes conseguem realizar tarefas que engenheiros mais fracos não conseguem, como resolver bugs complexos, melhorar códigos legados e realizar grandes reformulações arquitetônicas. Engenheiros mais fracos lutam com essas tarefas mesmo com tempo suficiente. O artigo destaca que engenheiros fortes não são simplesmente mais eficientes, mas possuem a capacidade de resolver problemas complexos, enquanto engenheiros mais fracos são praticamente incapazes de concluir a maioria das tarefas de engenharia. O artigo também oferece conselhos sobre como colaborar com engenheiros seniores mais fracos, enfatizando a necessidade de ser gentil, mas proteger seu tempo, evitando demandas excessivas.

Leia mais
Desenvolvimento capacidades do engenheiro

Apache Cloudberry: Banco de Dados MPP de código aberto, alternativa ao Greenplum

2024-12-21
Apache Cloudberry: Banco de Dados MPP de código aberto, alternativa ao Greenplum

O Apache Cloudberry, criado pelos desenvolvedores originais do Greenplum Database, é um banco de dados MPP (Massive Parallel Processing) de código aberto avançado e maduro. Ele possui um kernel PostgreSQL mais recente e recursos avançados para empresas, servindo como um data warehouse e suportando análises em larga escala e cargas de trabalho de IA/ML. Os usuários podem construir a partir da fonte ou utilizar um sandbox baseado em Docker para testes rápidos. Uma comunidade vibrante oferece suporte e incentiva contribuições que vão desde melhorias de código até aprimoramentos de documentação.

Leia mais

Erica Synths libera código-fonte de seus módulos Eurorack DIY

2025-04-06
Erica Synths libera código-fonte de seus módulos Eurorack DIY

Após descontinuar seus projetos DIY Eurorack legados, a Erica Synths decidiu liberá-los como código aberto. Eles forneceram arquivos Gerber para painéis frontais feitos em PCB e fizeram pequenas alterações no design do módulo para eliminar componentes personalizados e raros (embora alguns módulos ainda requeiram CIs raros disponíveis em www.ericasynths.lv). Cada pasta contém informações e arquivos completos para construir um módulo: esquemas, arquivos Gerber para o painel frontal, arquivos Gerber para PCBs, listas de materiais (BOMs), colocação de componentes com valores e designadores e manuais de montagem (observe que alguns manuais são para versões mais antigas do módulo). A Erica Synths permite o uso de terceiros para fins pessoais, educacionais ou comerciais, mas não fornecerá suporte; consulte os fóruns (www.muffwiggler.com) para detalhes de construção, solução de problemas, disponibilidade de peças e alternativas. Os módulos de código aberto incluem: Bassline, BBD delay/flanger, Delay, Dual VCA, Envelope, MIDI-CV, Mixer, Modulator, Output, Polivoks VCF, Swamp e VCO3.

Leia mais
Hardware Sintetizador

Terapia sonora de um minuto pode aliviar enjoos

2025-04-19
Terapia sonora de um minuto pode aliviar enjoos

Pesquisadores da Universidade de Nagoya descobriram que uma tecnologia única de estimulação sonora, chamada 'sound spice®', pode aliviar significativamente os sintomas de cinetose em apenas um minuto. O som de 100 Hz estimula o ouvido interno, ativando o sistema vestibular e melhorando o equilíbrio, reduzindo náuseas e tonturas. Testes usando simuladores de direção e outros métodos indutores de movimento, combinados com controle postural, leituras de ECG e questionários, mostraram que a terapia é segura e eficaz. Esse tratamento simples e não invasivo é promissor para aliviar a cinetose em várias situações de viagem.

Leia mais

EdgeBit: Agentes de IA de disparo único para correção automática eficiente de dependências

2025-04-18

O EdgeBit é uma plataforma de segurança que ajuda as equipes de engenharia de aplicativos a encontrar e corrigir vulnerabilidades de segurança. Seu recurso de correção automática de dependências contém um mecanismo de alcance extremamente preciso para identificar o impacto em seu aplicativo. A maioria das atualizações não tem impacto, portanto, os engenheiros que usam o EdgeBit podem dedicar esforços a atualizações impactantes. Isso se traduz em mais tempo gasto “em missão” em vez de gerenciar dependências. Esta publicação abordará como identificar áreas que podem 1) usar ferramentas focadas, 2) lidar com erros de forma inteligente e 3) aproveitar a persistência de um agente de IA para desbloquear ganhos de eficiência maciços, como fizemos para a correção automática de dependências, com alguns dados para comprovar isso.

Leia mais
Desenvolvimento
1 2 11 12 13 15 17 18 19 595 596