Teste de Aleatoriedade de LLMs Revela Viés Inesperado

2025-04-30

Este experimento testou a aleatoriedade de vários Modelos de Linguagem Grandes (LLMs) da OpenAI e Anthropic. Ao fazer com que os modelos jogassem uma moeda e previssem números aleatórios entre 0 e 10, os pesquisadores descobriram um viés significativo em suas saídas, revelando que eles não são realmente aleatórios. Por exemplo, no experimento de jogar moeda, todos os modelos mostraram preferência por 'cara', com o GPT-o1 exibindo o viés mais extremo em 49%. Na previsão de números pares/ímpares, a maioria dos modelos favoreceu números ímpares, com o Claude 3.7 Sonnet exibindo o viés mais forte em 47%. As descobertas destacam que mesmo LLMs avançados podem exibir padrões inesperados influenciados por suas distribuições de dados de treinamento.

Leia mais

Talanoa: Uma Visão de Década, Finalmente Realizada

2025-04-30
Talanoa: Uma Visão de Década, Finalmente Realizada

John Martin, um engenheiro web, concebeu a ideia do Talanoa, um aplicativo de e-mail projetado como uma conversa, em 2014. Revisando a ideia anualmente, ele finalmente o lançou após perceber que nenhum produto semelhante existia no mercado. Essa história destaca a dedicação e persistência necessárias para dar vida a uma visão e preencher uma lacuna no mercado.

Leia mais
Desenvolvimento

dataframely: Uma biblioteca de validação de DataFrames nativa do Polars

2025-04-30

O esforço da QuantCo para modernizar uma base de código antiga revelou uma falha crítica no processamento de seus DataFrames: falta de validação. A migração do pandas para o Polars, buscando ganhos de desempenho, destacou esse problema. Bibliotecas existentes como pandera e patito se mostraram insuficientes. Para resolver isso, eles desenvolveram o dataframely, uma biblioteca nativa do Polars que permite a validação declarativa de DataFrames. O dataframely define esquemas, valida o conteúdo do DataFrame, suporta validação entre DataFrames e oferece validação suave, melhorando significativamente a robustez e a legibilidade dos pipelines. Já está em uso em várias equipes e projetos.

Leia mais
Desenvolvimento validação de dados

HP webOS 'Eel': Um Sistema Operacional Inovador Que Nunca Foi

2025-04-30
HP webOS 'Eel': Um Sistema Operacional Inovador Que Nunca Foi

Enquanto a maioria dos planos de tablets e telefones da HP eram decepcionantes, sua equipe de software estava desenvolvendo designs verdadeiramente inovadores. Com o nome de código 'Eel', a próxima versão principal do webOS visava expandir a metáfora de 'cartão' introduzida no Palm Pre original. Ele combinava 'pilhas de cartões' e 'painéis responsivos', permitindo que os usuários abrissem links em novos cartões separados à esquerda, deslizassem ou 'cortassem' para pilhas diferentes. Isso oferecia dimensionamento e agrupamento de janelas flexíveis, gerenciando bem em telefones e tablets. Representou uma tentativa inovadora de aumentar a produtividade, mas, por fim, o projeto nunca atingiu seu potencial máximo.

Leia mais
Desenvolvimento

Missão Impossível: Gerenciando Agentes de IA no Mundo Real

2025-04-30
Missão Impossível: Gerenciando Agentes de IA no Mundo Real

Este artigo aborda os desafios e estratégias para controlar eficazmente agentes de IA em vários campos, especialmente o desenvolvimento de software. O autor compartilha lições aprendidas com dificuldade, enfatizando o planejamento meticuloso e a restrição do contexto do que os agentes de IA podem fazer. Ele se aprofunda na escolha de ferramentas, no planejamento de tarefas, na criação e revisão de planos, nos testes desses planos e na identificação de problemas arquitetônicos maiores. Aspectos-chave como regras, retorno de desempenho, seleção de modelos e controle de custos também são abordados. O autor detalha sua experiência usando ferramentas como Cursor para criar planos reutilizáveis, refinando-os e testando-os iterativamente para melhorar a confiabilidade, levando em última análise a um desenvolvimento de software eficiente.

Leia mais
Desenvolvimento gestão de planos

Analisando o Conjunto de Dados Completo do Hacker News com DuckDB

2025-04-30
Analisando o Conjunto de Dados Completo do Hacker News com DuckDB

O autor baixou o conjunto de dados completo do Hacker News — um arquivo JSON de 20 GB contendo tudo o que já foi postado no site — e o analisou usando o banco de dados DuckDB. O post detalha o processo de download e usa consultas SQL para calcular médias móveis de 12 semanas da frequência de menções para linguagens de programação específicas (Python, JavaScript, Java, Ruby, Rust). O autor elogia a facilidade de uso e a velocidade do DuckDB, sugerindo humoristicamente possibilidades futuras, como o treinamento de LLMs no conjunto de dados.

Leia mais
Desenvolvimento

Executando Linux no Excel: Uma Brincadeira Divertida

2025-04-30
Executando Linux no Excel: Uma Brincadeira Divertida

Um desenvolvedor conseguiu executar um sistema Linux dentro do Microsoft Excel! Usando um emulador leve chamado mini-rv32ima, compilado como um DLL e chamado por meio de macros VBA, o desenvolvedor conseguiu exibir a saída do Linux diretamente nas células do Excel. Embora o projeto seja considerado com bugs e o autor admita ter usado um DLL externo em vez de reescrever o emulador em VBA ou fórmulas do Excel, é um experimento criativo e divertido que demonstra engenhosidade e habilidade de programação.

Leia mais
Desenvolvimento

Fornecedores de segurança cibernética sob ataque: a luta real da SentinelOne

2025-04-30
Fornecedores de segurança cibernética sob ataque: a luta real da SentinelOne

A SentinelOne, uma empresa de segurança cibernética, divulgou publicamente uma série de ataques direcionados à sua infraestrutura e à de seus parceiros. Esses ataques vieram de várias fontes, incluindo trabalhadores de TI da Coreia do Norte se passando por candidatos a empregos, operadores de ransomware procurando vulnerabilidades e atores patrocinados pelo estado chinês. A SentinelOne destaca a vulnerabilidade dos próprios fornecedores de segurança e compartilha suas experiências no combate a essas ameaças, enfatizando a colaboração interna, a defesa impulsionada por inteligência e a necessidade de maior cooperação do setor para fortalecer a segurança geral.

Leia mais
Tecnologia ataques APT

O Segredo do Meu Fermento Mãe de 11 Anos: Ciência Cidadã Revela Diversidade Microbiana

2025-04-30
O Segredo do Meu Fermento Mãe de 11 Anos: Ciência Cidadã Revela Diversidade Microbiana

O autor participou de um projeto de ciência cidadã, enviando uma amostra de seu fermento mãe de 11 anos (Stinkie) para análise. Os resultados revelaram uma forte similaridade entre o Stinkie e fermentos de Suíça, Grécia e Finlândia. Apresenta maior acidez e contagem de células de levedura acima da média, mas seu perfil bacteriano é dominado pelo Lactobacillus brevis, enquanto a levedura é puramente Saccharomyces Cerevisiae. Isso sugere que a monocultura de longo prazo, embora garanta resultados consistentes, pode limitar a diversidade de sabores. Os pesquisadores forneceram um assistente de IA chamado Dough-Pro (na verdade, ChatGPT) para ajudar a interpretar os dados.

Leia mais
Diversos fermento mãe

Salário mínimo federal dos EUA abaixo da linha da pobreza

2025-04-30
Salário mínimo federal dos EUA abaixo da linha da pobreza

Em 2025, o salário mínimo federal dos EUA está oficialmente abaixo da linha da pobreza. Os ganhos anuais de um adulto que trabalha em tempo integral durante todo o ano com US$ 7,25 por hora agora ficam abaixo do limite de pobreza de US$ 15.650 (estabelecido pelas diretrizes do Departamento de Saúde e Serviços Humanos). O artigo argumenta que a forma como o governo federal calcula a pobreza subestima o quanto o salário mínimo está longe da segurança econômica para os trabalhadores e suas famílias. Aumentar o salário mínimo é uma ferramenta eficaz para melhorar a segurança econômica dos trabalhadores de baixa renda e reduzir a pobreza, mas os republicanos do Congresso estão pressionando por políticas como a imposição de requisitos de trabalho em programas de segurança social e cortes no Medicaid. O artigo compara as medidas oficiais e suplementares de pobreza, revelando uma taxa de pobreza significativamente maior entre os trabalhadores usando a última. Muitos estados aumentaram seus salários mínimos acima do nível federal, mas os estados do sul, com seus baixos salários mínimos, apresentam ganhos mais baixos para os trabalhadores e maior pobreza. Aumentar o salário mínimo aumenta os ganhos e reduz a pobreza, enquanto as políticas republicanas exacerbam o problema.

Leia mais

Geração de Imagens por IA: Dez Cenários Diversificados

2025-04-30

Usando uma série de prompts de texto, a IA gerou com sucesso dez imagens diversas, que vão de uma sala de estar moderna e minimalista a uma rua cyberpunk futurista e à paisagem vermelha e desolada de Marte, mostrando a poderosa capacidade de geração de imagens da IA. Essas imagens abrangem vários estilos, incluindo fotorealismo, desenho animado e pixel art, demonstrando a versatilidade da IA em diferentes estilos artísticos e abrindo novas possibilidades para a criação de arte por IA.

Leia mais
IA

Google Play Store sofre purga maciça de aplicativos: um mal necessário?

2025-04-30
Google Play Store sofre purga maciça de aplicativos: um mal necessário?

O número de aplicativos na Google Play Store caiu de aproximadamente 3,4 milhões no início de 2024 para cerca de 1,8 milhão hoje, uma queda de quase 50%. Essa não é uma tendência global; a App Store da Apple viu um leve aumento. O Google atribui a queda a padrões de qualidade de aplicativos mais rigorosos implementados em julho, direcionados a aplicativos de baixa qualidade e fraudulentos. Eles também investiram em detecção de ameaças de IA, políticas de privacidade mais rígidas e ferramentas para desenvolvedores, proibindo vários aplicativos e contas de desenvolvedores que violavam as políticas. Embora as novas regras de status de comerciante da UE possam ter desempenhado um papel, a queda começou antes de sua implementação. Apesar da redução, novos lançamentos de aplicativos no Google Play ainda estão em alta em comparação com o ano anterior.

Leia mais

Diferenciação Esparsa Automática: Domando Hessianas de Alta Dimensão

2025-04-30

Computar matrizes hessianas de alta dimensão é um grande gargalo no aprendizado de máquina. Esta postagem apresenta a Diferenciação Esparsa Automática (ASD), uma técnica que utiliza a esparsidade da matriz para acelerar os cálculos de hessianas e jacobianas. A ASD usa detecção de padrão de esparsidade e coloração de matriz para combinar várias colunas (ou linhas) ortogonais estruturais em um único vetor para computação, reduzindo assim o custo computacional e os requisitos de memória. O artigo detalha o funcionamento da ASD, cobrindo diferenciação automática de modo direto e inverso, representações de matrizes esparsas, algoritmos de coloração e muito mais. Um exemplo de código Julia demonstra sua aplicação e benefícios de desempenho, concluindo que a ASD oferece vantagens significativas em aplicações que exigem cálculos de jacobianas ou hessianas esparsas, como o método de Newton e outros algoritmos de otimização.

Leia mais

Intel Lunar Lake: Um Experimento Único?

2025-04-30
Intel Lunar Lake: Um Experimento Único?

Os chips para laptops Intel Core Ultra 200V, codinome Lunar Lake, parecem ser um experimento único, improvável de ser replicado em futuros processadores para laptops Intel. Eles são únicos por sua memória integrada no pacote, unidade de processamento neural que atende aos requisitos do Microsoft Copilot+ e inclusão das GPUs integradas de melhor desempenho da Intel, as Arc 130V e 140V. A Intel lançou recentemente uma atualização de driver (versão 32.0.101.6734) que aumenta o desempenho dessas GPUs integradas, oferecendo um aumento de desempenho bem-vindo para usuários de jogos de nível básico. A atualização afirma aumentar as taxas de quadros médias em cerca de 10% e '1% de FPS baixo' em até 25%, resultando em jogabilidade mais suave e redução de travamentos.

Leia mais
Hardware GPU Integrada

Desafiando os Limites da Física: Como a Consciência Pode Influenciar a Realidade

2025-04-30

Quase três décadas de experimentos sugerem que fenômenos físicos anômalos em estudos PEAR correlacionam-se significativamente com variáveis subjetivas como intenção, significado, ressonância e incerteza. Isso contradiz fortemente a física e a psicologia estabelecidas, exigindo novos modelos teóricos. O artigo explora vários deles, incluindo a aplicação dos princípios da mecânica quântica à consciência e a influência na realidade por meio da interação subconsciente com processos materiais. Esses modelos destacam o papel proativo da consciência na formação da realidade, oferecendo uma estrutura para uma "ciência do subjetivo" que desafia nossa compreensão da realidade.

Leia mais

PATH do Linux: O Segredo do Shell

2025-04-29

Já se perguntou como o Linux encontra os comandos que você executa? A resposta: ele depende do shell, não do kernel! Este artigo mergulha na mecânica da variável de ambiente PATH, revelando como shells (como o dash) usam funções como `padvance` para procurar executáveis dentro do PATH, enquanto a chamada de sistema `execve` do kernel na verdade recebe o caminho completo. Linguagens de programação como Python, Go e Rust também implementam sua própria pesquisa no PATH em suas bibliotecas de subprocessos, no final das contas, contando com funções subjacentes como `execvp`. O artigo também explica por que shebangs exigem caminhos absolutos e o papel inteligente do `/usr/bin/env`.

Leia mais
Desenvolvimento

Toyota e Waymo se unem para acelerar a condução autônoma

2025-04-29
Toyota e Waymo se unem para acelerar a condução autônoma

A Toyota e a Waymo chegaram a um acordo preliminar para colaborar na aceleração do desenvolvimento e implantação de tecnologias de direção autônoma. A parceria visa combinar a experiência da Waymo em direção autônoma com a perícia da Toyota em fabricação de veículos para criar uma nova plataforma de veículos autônomos e melhorar os veículos particulares de próxima geração (POVs). Essa colaboração destaca o compromisso de ambas as empresas em melhorar a segurança viária e aumentar a mobilidade para todos.

Leia mais
Tecnologia

LG encerra atualizações do Android para todos os telefones em 30 de junho

2025-04-29
LG encerra atualizações do Android para todos os telefones em 30 de junho

A LG desligará seus servidores de atualização do Android em 30 de junho de 2025. Isso significa que não haverá mais atualizações por meio de over-the-air ou pelo aplicativo LG Bridge para nenhum telefone Android LG. Embora provavelmente poucos usuários ainda existam, os proprietários de dispositivos LG mais antigos devem atualizá-los antes do prazo.

Leia mais

Minimização da Ação com Gradiente Descendente: Uma Nova Perspectiva na Física

2025-04-29

Esta publicação apresenta uma perspectiva única sobre a física: vê-la como um problema de otimização. O autor resolve o problema da queda livre minimizando a ação usando descida de gradiente, em vez dos métodos analíticos ou numéricos tradicionais. A publicação compara abordagens analíticas, numéricas e de minimização de ação, implementando esta última com PyTorch. Os resultados correspondem às soluções analíticas e numéricas, oferecendo uma nova perspectiva sobre a mecânica clássica e abrindo caminho para explorar sistemas físicos mais complexos.

Leia mais
Tecnologia

Isenção de Tarifas Exclusiva para Tesla: Mudança Significativa na Política Automobilística dos EUA

2025-04-29
Isenção de Tarifas Exclusiva para Tesla: Mudança Significativa na Política Automobilística dos EUA

O Departamento de Comércio dos EUA anunciou que veículos com 85% ou mais de conteúdo doméstico serão totalmente isentos de novas tarifas automotivas. Atualmente, apenas a Tesla se qualifica, com algumas variantes dos modelos 3 e Y recebendo isenção total de tarifas. Essa medida gerou controvérsia, com acusações de favoritismo para a Tesla. Embora as regras de conteúdo doméstico pareçam neutras no papel, o efeito no mundo real cria uma vantagem significativa para a Tesla. Essa mudança de política pode estar relacionada às recentes e frequentes interações de Elon Musk com a Casa Branca. Outras montadoras, como Ford e Honda, embora possuam alguns veículos com alto conteúdo doméstico, não atendem ao limite de isenção e enfrentarão tarifas mais altas.

Leia mais
Tecnologia Tarifas Automotivas

Ficção Científica: Dos Sonhos Lunares a Futuros Cheios de Esperança

2025-04-29
Ficção Científica: Dos Sonhos Lunares a Futuros Cheios de Esperança

A ficção científica já nos inspirou a alcançar a Lua. Agora, dominada por visões distópicas e apocalípticas, ela fomenta o pessimismo em relação ao futuro. Este artigo argumenta que a ficção científica deve retomar seu espírito otimista, mostrando futuros mais brilhantes e inspirando a criação de uma realidade melhor. O autor conclama os escritores de ficção científica a criarem narrativas cheias de esperança, oferecendo novas perspectivas e possibilidades para construir uma sociedade mais ideal, evitando a falta de preparação diante de crises do mundo real.

Leia mais
Tecnologia futuro otimismo

OIN: 20 anos defendendo o código aberto de trolls de patentes

2025-04-29
OIN: 20 anos defendendo o código aberto de trolls de patentes

Na metade dos anos 2000, o Linux enfrentou ameaças existenciais de litígios de patentes. Para combater isso, gigantes da indústria como IBM, Novell e Red Hat formaram a Open Invention Network (OIN). Por meio de um acordo de licença cruzada isento de royalties, a OIN criou uma poderosa defesa contra trolls de patentes que visavam o Linux e outras tecnologias de código aberto. Ao longo de 20 anos, a OIN cresceu para mais de 4.000 membros, detendo milhões de patentes e neutralizando ativamente ameaças de patentes. A contribuição da Microsoft de seu vasto portfólio de patentes solidificou ainda mais a força da OIN. Hoje, a proteção da OIN se estende ao Android, Kubernetes e além, protegendo o código aberto em setores cruciais como IA e automobilístico.

Leia mais
Tecnologia Patentes

Grima: Uma Arte Marcial Colombiana Luta pela Sobrevivência

2025-04-29
Grima: Uma Arte Marcial Colombiana Luta pela Sobrevivência

Em Puerto Tejada, Colômbia, um punhado de mestres preserva a Grima, uma arte marcial tradicional afro-colombiana que utiliza machetes e bastões. Enraizada na resistência da era colonial, a Grima enfrenta um futuro incerto à medida que as gerações mais jovens migram para os centros urbanos. Os mestres buscam reconhecimento nacional e internacional para salvaguardar essa herança cultural, esperando o financiamento e a publicidade que vêm com ele. No entanto, eles também se preocupam com a possível comercialização prejudicando a tradição. Apesar dos desafios, a Grima permanece uma expressão vibrante da identidade afro-colombiana, com seus praticantes dedicados a transmiti-la às gerações futuras.

Leia mais

Clusters Multi-AZ do Amazon RDS para PostgreSQL Falham na Isolação de Instantâneo

2025-04-29

Testes da Jepsen revelam que os clusters Multi-AZ do Amazon RDS para PostgreSQL não garantem totalmente o isolamento de instantâneo. Anomalias como ciclos G-não adjacentes, violando as regras de isolamento de instantâneo, foram observadas. Essas incluíam Long Fork, sugerindo que o RDS para PostgreSQL pode oferecer o isolamento de instantâneo paralelo, mais fraco. Isso significa que transações de leitura podem discordar sobre a ordem de execução em alta concorrência. Os usuários devem estar cientes das estruturas de transação, evitar Long Fork ou usar apenas o endpoint de gravação para recuperar o isolamento de instantâneo.

Leia mais
Desenvolvimento isolamento de instantâneo

Modelos de Linguagem Grandes Alucinam Pacotes de Software Inexistentes: Uma Vulnerabilidade na Cadeia de Suprimentos

2025-04-29
Modelos de Linguagem Grandes Alucinam Pacotes de Software Inexistentes: Uma Vulnerabilidade na Cadeia de Suprimentos

Pesquisadores descobriram uma vulnerabilidade preocupante em grandes modelos de linguagem (LLMs): a alucinação de pacotes de software inexistentes durante a geração de código. Isso não é aleatório; nomes específicos de pacotes inexistentes são gerados repetidamente, criando um padrão repetível. Atacadores poderiam explorar isso publicando malware sob esses nomes alucinados, esperando que os desenvolvedores acessem eles, lançando assim um ataque à cadeia de suprimentos. LLMs de código aberto exibiram uma taxa maior dessa “alucinação de pacotes” do que modelos comerciais, e o código Python mostrou menos instâncias do que o JavaScript.

Leia mais

EA demite 300 funcionários, incluindo cortes na Respawn

2025-04-29
EA demite 300 funcionários, incluindo cortes na Respawn

A Electronic Arts (EA) anunciou hoje demissões significativas, afetando aproximadamente 300 funcionários em toda a empresa. Isso inclui os 100 cortes de empregos relatados anteriormente na Respawn Entertainment. Os cortes afetaram principalmente a equipe de Experiências da EA, abrangendo suporte ao cliente, atendimento a fãs e funções de marketing, com reduções em outros departamentos também. Os funcionários afetados terão a oportunidade de se candidatar a vagas internas antes da demissão. A EA declarou que a reestruturação visa realinhar equipes e recursos para impulsionar o crescimento futuro. As demissões na Respawn incluíram desenvolvedores, editores e testadores de QA em Apex Legends, e equipes menores trabalhando na equipe Jedi e em dois projetos cancelados - um relatado anteriormente, o outro supostamente um novo jogo Titanfall. Isso segue as demissões anteriores na EA nos últimos anos.

Leia mais
Jogos

AgenticSeek: Uma Alternativa Privada e Local ao Manus AI

2025-04-29
AgenticSeek: Uma Alternativa Privada e Local ao Manus AI

O AgenticSeek é um assistente de IA totalmente local e habilitado por voz que navega na web, escreve código e planeja tarefas de forma autônoma, mantendo todos os dados no seu dispositivo. Projetado para modelos de raciocínio local, ele garante privacidade completa e nenhuma dependência da nuvem. Ele suporta várias linguagens de programação e seleciona automaticamente o melhor agente de IA para cada tarefa. O projeto é de código aberto e está ativamente procurando contribuidores.

Leia mais
IA

Pare de se preocupar com o impacto ambiental do ChatGPT

2025-04-29

Preocupações sobre a pegada ambiental do ChatGPT são generalizadas. No entanto, a análise de Andy Masley demonstra que essa preocupação é amplamente infundada. Mesmo usando estimativas de consumo de energia por prompt mais altas, o impacto é minúsculo, comparável a encurtar um banho em alguns segundos. Ganhos ambientais muito maiores podem ser alcançados reduzindo viagens aéreas ou outras atividades de alto impacto. Concentrar esforços em ações impactantes, em vez do uso individual do ChatGPT, é a abordagem mais eficaz.

Leia mais
Tecnologia

Neurox: Simplificando o monitoramento de cargas de trabalho de IA com um gráfico Helm

2025-04-29
Neurox: Simplificando o monitoramento de cargas de trabalho de IA com um gráfico Helm

Neurox simplifica o monitoramento de cargas de trabalho de IA em seu cluster Kubernetes GPU. Seu gráfico Helm automatiza a instalação, provisionando um subdomínio, credenciais do registro de imagens, IdP e certificados TLS. Painéis e relatórios pré-construídos combinam métricas e dados em tempo real do runtime do Kubernetes para administradores, desenvolvedores, pesquisadores e auditores. Gratuito para até 64 GPUs (somente GPUs NVIDIA), com licenciamento empresarial disponível. Pré-requisitos incluem um cluster Kubernetes, cert-manager, ingress-nginx, o operador NVIDIA GPU e o Kube Prometheus Stack.

Leia mais

Vulnerabilidades Críticas no AirPlay Permitem Execução Remota de Código em Zero Cliques

2025-04-29
Vulnerabilidades Críticas no AirPlay Permitem Execução Remota de Código em Zero Cliques

A Oligo Security Research descobriu vulnerabilidades críticas (AirBorne) no protocolo e SDK do AirPlay da Apple, permitindo a execução remota de código (RCE) em zero ou um clique. Os atacantes podem contornar listas de controle de acesso (ACLs) e interação do usuário, potencialmente permitindo a propagação semelhante a um verme. Isso afeta macOS, dispositivos habilitados para SDK do AirPlay e CarPlay, com consequências que vão desde roubo de dados confidenciais até implantação de ransomware. A Apple lançou correções; os usuários devem atualizar imediatamente e considerar desabilitar ou restringir o acesso ao AirPlay.

Leia mais
1 2 271 272 273 275 277 278 279 595 596