RLVR Melhora o Raciocínio, Mas a Que Custo?

2025-04-22

Experimentos em matemática, codificação e raciocínio visual avaliaram o impacto do RLVR (Aprendizado por Reforço a partir de Feedback Humano) em modelos de linguagem grandes base e treinados com RLVR. Os resultados mostraram que o RLVR melhorou a precisão em valores baixos de k, mas diminuiu a cobertura de problemas em valores mais altos de k. Isso sugere que o RLVR aprimora a precisão determinística, mas limita a diversidade de exploração. Os modelos base mantiveram uma cobertura de raciocínio mais ampla, apesar dos ganhos iniciais de precisão do RL. As descobertas consistentes em diferentes domínios indicam que o RLVR aprimora o raciocínio sem alterar fundamentalmente a abordagem de resolução de problemas.

Leia mais

A 'Academia Antiga' do Programador: Rejeitando o Autocompletar de IA, Abraçando a Pura Alegria da Programação

2025-04-22
A 'Academia Antiga' do Programador: Rejeitando o Autocompletar de IA, Abraçando a Pura Alegria da Programação

O CEO da Shopify defende a codificação assistida por IA, mas o autor toma um caminho diferente, escolhendo retornar à "academia antiga" – focando na codificação manual e desfrutando do desafio e da satisfação da resolução de problemas. O autor acredita que a IA se destaca em tarefas repetitivas, mas o pensamento de programação central, o design e as decisões de arquitetura ainda exigem entrada humana para um verdadeiro aprimoramento de habilidades, evitando tornar-se um mero "trabalhador qualificado" dependente de ferramentas. O artigo incentiva os programadores a manterem o pensamento independente na era da IA, usando a IA como uma ferramenta de suporte em vez de uma substituta, crescendo por meio da resolução de problemas e, finalmente, tornando-se engenheiros melhores. É sobre preservar o ofício da codificação, não rejeitar o progresso.

Leia mais
Desenvolvimento Codificação

GiveCampus Contrata Engenheiro de Software Sênior (Remoto)

2025-04-22
GiveCampus Contrata Engenheiro de Software Sênior (Remoto)

O GiveCampus, uma plataforma líder de arrecadação de fundos para instituições educacionais sem fins lucrativos, está contratando um Engenheiro de Software Sênior. Apoiado pelo Y Combinator e com seis anos de lucratividade e crescimento impressionante, o GiveCampus oferece uma oportunidade remota com compensação e benefícios competitivos. O candidato ideal terá mais de 8 anos de experiência em full-stack, proficiência em Ruby, Python ou Javascript/Node.js, familiaridade com vários bancos de dados e frameworks e excelentes habilidades de trabalho em equipe. A função envolve trabalhar em projetos de grande escala e contribuir significativamente para o futuro da plataforma.

Leia mais
Desenvolvimento

FreeDOS 1.4 Lançado: Uma Experiência DOS Renovada

2025-04-22

O FreeDOS 1.4 chegou! Esta versão inclui várias atualizações de programas, incluindo correções de bugs e melhorias para utilitários de linha de comando como FreeCOM, Xcopy, Move e Fdisk, além de confiabilidade aprimorada para mTCP. O sistema FDHelp foi totalmente reescrito e agora inclui traduções para vários idiomas. Para uma experiência simplificada, algumas interfaces gráficas redundantes foram removidas, e o visualizador de imagens DOSVIEW, mais poderoso, substitui o BMP2PNG. O empacotamento aprimorado reduziu significativamente o tamanho do CD Live e do CD Bônus do FreeDOS 1.4, resultando em um processo de instalação mais suave.

Leia mais
Desenvolvimento

Estudo associa uso de cannabis a maior risco de demência

2025-04-22
Estudo associa uso de cannabis a maior risco de demência

Um grande estudo com mais de 6 milhões de pessoas revela uma associação significativa entre o uso regular de cannabis e um maior risco de demência. Indivíduos hospitalizados devido à cannabis apresentaram um risco 23% maior de demência em cinco anos e um risco 72% maior em comparação com a população em geral. Embora não prove causalidade definitiva, as descobertas se somam às crescentes preocupações e justificam mais investigações. O estudo destaca o aumento da potência da cannabis moderna, contribuindo para o aumento das taxas de vício. Os especialistas enfatizam que a cannabis é uma substância psicotrópica e os usuários devem ser transparentes com seus médicos sobre seu uso.

Leia mais
Tecnologia demência

Denunciante do NLRB alega que equipe DOGE de Musk exfiltrou dados confidenciais

2025-04-22

Um arquiteto de segurança da Junta Nacional de Relações Trabalhistas (NLRB) alega que funcionários do Departamento de Eficiência do Governo (DOGE) de Elon Musk transferiram gigabytes de dados confidenciais de arquivos de casos da agência no início de março, usando contas de curta duração projetadas para deixar rastros mínimos de atividade na rede. O denunciante, Daniel J. Berulis, afirma que isso coincidiu com tentativas de login bloqueadas de um endereço IP russo usando credenciais válidas para uma conta DOGE recém-criada. Berulis também relata ter recebido ameaças e ter sido privado de seu acesso à NLRB. Embora a NLRB negue uma violação, as alegações de Berulis levantam preocupações sérias sobre o acesso aos dados do DOGE e as práticas de segurança da NLRB.

Leia mais
Tecnologia

Perfil RISC-V RVA23 Ratificado, Impulsionando o Crescimento do Ecossistema

2025-04-22

O Summit RISC-V 2024 da América do Norte marcou um marco significativo para a comunidade RISC-V com a ratificação do Perfil RVA23. Este perfil garante a compatibilidade entre processadores de aplicativos RISC-V de 64 bits que executam distribuições de sistemas operacionais binários padrão, promovendo a portabilidade de software e evitando o travamento de fornecedores. É um grande passo para o RISC-V se tornar uma força dominante em processadores de aplicativos.

Leia mais
Tecnologia

Grande Colisor de Hádrons do CERN: Visão Geral do Sistema

2025-04-22

Esta lista detalha vários subsistemas e experimentos do Grande Colisor de Hádrons (LHC) no CERN, incluindo os detectores do LHC (ATLAS, CMS, LHCf), a cadeia de aceleradores (Linac 3, Linac 4, PSB, SPS, LEIR, ELENA) e sistemas de monitoramento e controle associados (por exemplo, BLM, CPS). A quantidade de entradas destaca a imensa complexidade do projeto LHC e seu papel crucial na pesquisa de física de alta energia.

Leia mais
Tecnologia

Redes de Back-end de IA: Além do Balanceamento de Carga ECMP Tradicional

2025-04-22
Redes de Back-end de IA: Além do Balanceamento de Carga ECMP Tradicional

O balanceamento de carga ECMP tradicional baseado em fluxo tem dificuldades com os enormes fluxos gerados pela comunicação GPU-GPU em redes de back-end de IA baseadas em RoCEv2. Este artigo apresenta duas alternativas: balanceamento de carga baseado em flowlet com roteamento adaptativo, que redireciona dinamicamente o tráfego para caminhos menos congestionados, e balanceamento de carga baseado em pacotes com pulverização de pacotes, que distribui pacotes individuais em vários caminhos, mas requer a operação RDMA Write Only para operação confiável. Os switches Cisco Nexus agora oferecem suporte à configuração de balanceamento de carga dinâmico (DLB), permitindo o balanceamento de carga baseado em flowlet e por pacote.

Leia mais

Programador de Quarto Desbanca PNG com o Formato QOI de Compressão de Imagem

2025-04-22
Programador de Quarto Desbanca PNG com o Formato QOI de Compressão de Imagem

Um único programador, trabalhando em seu quarto, desenvolveu o Formato de Imagem Quite Okay (QOI) em apenas um ano, alcançando desempenho de compressão que rivaliza ou supera o avanço de décadas do PNG. Isso desafia a sabedoria convencional na compressão de dados: mais complexo nem sempre significa melhor. A palestra compara PNG, JPEG e QOI, aprofundando-se em conceitos fundamentais de compressão de dados e matemática, mostrando o apelo único do QOI como uma alternativa de baixa complexidade.

Leia mais
Tecnologia

Geometria de Biofilmes: Como Interações Locais Moldam Estruturas Macroscópicas

2025-04-22
Geometria de Biofilmes: Como Interações Locais Moldam Estruturas Macroscópicas

Uma nova pesquisa revela os segredos geométricos do crescimento de biofilmes bacterianos. Os pesquisadores descobriram que o ângulo de contato das células na borda do biofilme dita os padrões de crescimento, impactando a aptidão geral. Um ângulo de contato alto leva ao aumento do crescimento vertical, enquanto um ângulo de contato baixo promove a propagação horizontal. Essas interações locais célula-célula moldam em última análise a estrutura macroscópica de todo o biofilme, oferecendo insights sobre como coletivos celulares formam indivíduos multicelulares.

Leia mais

Moon Bugs: Um jogo de tiro retro de 50KB para DOS

2025-04-22

Moon Bugs é um jogo de tiro retrô que roda em DOS, com um código notavelmente pequeno de 50KB, livre de dependências de jogos modernos. Ele usa um modo único de 160x100, 16 cores, obtido manipulando a altura dos caracteres. Abater OVNIs rende pontos, atingir certas pontuações concede vidas extras, enquanto alguns OVNIs subtraem pontos. O artigo detalha bugs do jogo e explica como modificar o arquivo do jogo para ajustar o nível inicial, vidas e dificuldade. O autor elogia a simplicidade e o charme retrô do jogo.

Leia mais
Jogos jogo DOS

Fujitsu e RIKEN criam computador quântico supercondutor de 256 qubits

2025-04-22
Fujitsu e RIKEN criam computador quântico supercondutor de 256 qubits

A Fujitsu e o RIKEN anunciaram o desenvolvimento de um computador quântico supercondutor de 256 qubits, líder mundial. Este novo computador quântico, baseado na tecnologia do sistema de 64 qubits lançado em outubro de 2023, utiliza técnicas de implementação de alta densidade recém-desenvolvidas. A plataforma será oferecida a empresas e instituições de pesquisa em todo o mundo a partir do primeiro trimestre do ano fiscal de 2025. Os planos futuros incluem um computador de 1000 qubits até 2026.

Leia mais

arXivLabs: Projetos Experimentais com Colaboradores da Comunidade

2025-04-22
arXivLabs: Projetos Experimentais com Colaboradores da Comunidade

arXivLabs é uma estrutura que permite que colaboradores desenvolvam e compartilhem novos recursos do arXiv diretamente em nosso site. Indivíduos e organizações que trabalham com o arXivLabs adotaram e aceitaram nossos valores de abertura, comunidade, excelência e privacidade de dados do usuário. O arXiv está comprometido com esses valores e trabalha apenas com parceiros que os respeitam. Tem uma ideia para um projeto que agregará valor à comunidade do arXiv? Saiba mais sobre o arXivLabs.

Leia mais
Desenvolvimento

Terapia com células iPS para doença de Parkinson: um ensaio clínico seguro e eficaz

2025-04-22
Terapia com células iPS para doença de Parkinson: um ensaio clínico seguro e eficaz

Um ensaio clínico para a doença de Parkinson utilizou células progenitoras de dopamina derivadas de células-tronco pluripotentes induzidas (iPSCs) em transplante putaminal bilateral. Os resultados mostraram que a terapia é segura e eficaz, sem eventos adversos graves e com melhora nos sintomas motores e aumento da captação de dopamina em alguns pacientes. Embora existam limitações, incluindo potenciais efeitos placebo e viés do observador, e sejam necessárias mais pesquisas para definir os critérios de seleção ideais do paciente, o ensaio fornece evidências para a segurança e eficácia das células progenitoras de dopamina derivadas de iPSCs como terapia regenerativa para a doença de Parkinson.

Leia mais

Contaminação por IA: A Incorporação Permanente do Termo Sem Sentido 'Microscopia Eletrônica Vegetativa'

2025-04-22
Contaminação por IA: A Incorporação Permanente do Termo Sem Sentido 'Microscopia Eletrônica Vegetativa'

Um estudo revela como o termo sem sentido 'microscopia eletrônica vegetativa' se tornou permanentemente incorporado em sistemas de IA. Originário de erros durante a digitalização de artigos científicos da década de 1950 e amplificado por erros de tradução, essa frase foi aprendida e gerada por grandes modelos de linguagem. Isso destaca a falta de transparência nos dados de treinamento de modelos de IA, a dificuldade de corrigir erros e os desafios à integridade do conhecimento. Os pesquisadores pedem maior transparência nos dados de treinamento de IA, processos de revisão por pares aprimorados e novas maneiras de avaliar informações na era da desinformação gerada por IA.

Leia mais
Tecnologia

Verus: Uma ferramenta de análise estática para verificar a correção de código Rust

2025-04-22
Verus: Uma ferramenta de análise estática para verificar a correção de código Rust

Verus é uma ferramenta de análise estática para verificar a correção de código escrito em Rust. Os desenvolvedores escrevem especificações do que seu código deve fazer, e o Verus verifica estaticamente se o código Rust executável sempre satisfará as especificações para todas as execuções possíveis do código. Em vez de verificações em tempo de execução, o Verus usa solucionadores poderosos para provar que o código está correto. Atualmente, o Verus suporta um subconjunto de Rust (que estamos trabalhando para expandir), e em alguns casos, permite que os desenvolvedores ultrapassem o sistema de tipos Rust padrão e verifiquem estaticamente a correção de código que, por exemplo, manipula ponteiros brutos. O Verus está em desenvolvimento ativo; recursos podem estar quebrados e/ou faltando, e a documentação ainda está incompleta.

Leia mais
Desenvolvimento Verificação de Código

Hackeando a Caldeira do Meu Senhorio: Um Ataque de Replay

2025-04-22
Hackeando a Caldeira do Meu Senhorio: Um Ataque de Replay

Frustrado com o sistema de aquecimento ineficiente e desigual do seu apartamento, o autor criou uma solução inteligente usando um ataque de replay. Utilizando SDRs de baixo custo (um RTL-SDR e um clone do HackRF), ele interceptou e replicou os sinais de rádio de 868MHz entre o termostato existente e a caldeira. Isso permitiu que ele controlasse remotamente o estado ligado/desligado da caldeira. Apesar de desafios significativos, ele integrou com sucesso isso ao Home Assistant, criando automações personalizadas e usando sensores para atingir um controle de temperatura confortável.

Leia mais
Hardware

Crescimento exponencial da IA: A AGI está próxima?

2025-04-22
Crescimento exponencial da IA: A AGI está próxima?

Uma pesquisa da METR mostra que as capacidades da IA estão crescendo exponencialmente, com modelos recentes dominando tarefas de engenharia de software em meses que antes levavam horas ou dias. Isso alimenta especulações sobre a chegada iminente da IAG (Inteligência Artificial Geral). No entanto, o autor Peter Wildeford aponta que o estudo da METR se concentra em tarefas específicas de engenharia de software, negligenciando as complexidades dos problemas do mundo real e a capacidade de aprendizado humano. Embora a IA se destaque em áreas de nicho, ela ainda luta com muitas tarefas cotidianas. Ele constrói um modelo incorporando os dados da METR e incertezas, prevendo que a IAG pode chegar no primeiro trimestre de 2030, mas com grande incerteza.

Leia mais

arXivLabs: Experimentos com Colaboração da Comunidade

2025-04-22
arXivLabs: Experimentos com Colaboração da Comunidade

arXivLabs é uma plataforma que permite a colaboradores desenvolverem e compartilharem novos recursos do arXiv diretamente no site. Os participantes devem aderir aos valores do arXiv de abertura, comunidade, excelência e privacidade de dados do usuário. Tem uma ideia para melhorar a comunidade arXiv? Saiba mais sobre arXivLabs!

Leia mais
Desenvolvimento

Synology trava a seus NAS a unidades de disco rígido proprietárias: um movimento prejudicial ao usuário?

2025-04-22
Synology trava a seus NAS a unidades de disco rígido proprietárias: um movimento prejudicial ao usuário?

Os próximos dispositivos NAS da série Synology 2025 Plus irão, segundo relatos, travar os usuários em seus próprios discos rígidos de marca registrada, gerando controvérsia. Essa medida limita a escolha do usuário, aumenta os custos e potencialmente torna as substituições de unidades difíceis. Em comparação com concorrentes como QNAP e TrueNAS, o hardware da Synology parece desatualizado, e essa estratégia de travamento de unidades enfraquece ainda mais sua competitividade. O autor argumenta que essa é uma decisão impulsionada pelo lucro que sacrifica a experiência do usuário, prejudicando em última análise a marca e a participação de mercado da Synology.

Leia mais

Inserções OB de baixo custo do programa Cilla

2025-04-22

Esta nova série de Cilla apresentava inserções OB produzidas a baixo custo, muitas vezes aproveitando outras transmissões externas, geralmente de eventos esportivos, em locais próximos. Por exemplo, a equipe filmou um evento esportivo em Worcester e, em seguida, filmou imediatamente inserções do Cilla no mesmo local. Cilla anunciava ao vivo que as câmeras estavam em uma rua específica, convidando os moradores a saírem e dizerem olá. O resultado foi uma rua iluminada, sistema de som e entrevistas ao vivo, tudo alcançado com um orçamento notavelmente baixo.

Leia mais

Pahole: Evolução de uma faca suíça para informações de depuração do kernel Linux

2025-04-22

Pahole, uma ferramenta poderosa para explorar e editar informações de depuração, desempenha um papel crucial no desenvolvimento do kernel Linux. Atualmente, ele lida com a conversão de informações de depuração geradas pelo compilador para o formato BTF utilizável pelo verificador BPF. Este artigo detalha os avanços recentes no Pahole, incluindo um novo co-mantenedor, tratamento de BTF aprimorado, suporte para matrizes flexíveis e bpf_fastcall, e suporte aprimorado para Rust. No futuro, espera-se que o papel do Pahole na conversão de DWARF para BTF diminua à medida que o suporte do GCC para a opção -gbtf amadurecer, levando a tempos de compilação do kernel mais rápidos.

Leia mais

Maldivas combate a subida do nível do mar com tecnologia de ilhas automontadas

2025-04-22
Maldivas combate a subida do nível do mar com tecnologia de ilhas automontadas

Na costa de Malé, pesquisadores estão testando uma nova abordagem para combater a subida do nível do mar: o crescimento de ilhas. O projeto 'Ilhas em Crescimento' utiliza tecnologia de automontagem, implantando uma estrutura chamada 'Anel de Rampa' — seis grandes bolsas de geotêxtil que capturam passivamente areia durante todo o ano. Ao contrário de experimentos anteriores limitados pelas correntes sazonais, o design omnidirecional do Anel de Rampa permite o acúmulo contínuo de areia, oferecendo uma solução promissora para a construção de ilhas e restauração de praias. Essa tecnologia tem potencial para aplicação global em ambientes costeiros semelhantes.

Leia mais

As Lições de Lincoln e a Mobocracia Digital

2025-04-22
As Lições de Lincoln e a Mobocracia Digital

Esta palestra utiliza o discurso de Lincoln no Lyceum de 1838 como trampolim para discutir a fragilidade das instituições políticas americanas e como as tecnologias modernas de comunicação alimentam a 'mobocracia'. O palestrante argumenta que Trump usou várias mídias para incitar o sentimento público, minar a razão e corroer as restrições legais. Ele destaca como as estruturas de incentivo das mídias sociais, os efeitos de amplificação e a facilidade de formação de multidões exacerbam a divisão social e ameaçam a democracia. A palestra conclui com um apelo para a reconstrução da cultura democrática, promovendo a reverência pela lei e resistindo à disseminação da 'mobocracia'.

Leia mais
Diversos mobocracia

O Labirinto da Villa Pisani: Um Enigma Histórico Que Desafiou Napoleão

2025-04-22
O Labirinto da Villa Pisani: Um Enigma Histórico Que Desafiou Napoleão

A Villa Pisani em Stra, Itália, possui um dos maiores e mais intrincados labirintos da Europa, famoso por sua aparição no romance 'A Chama' de Gabriele D'Annunzio e seu design desafiador. Construída no século XVIII para a família Pisani, a villa e seu labirinto têm uma rica história, passando pelas mãos de Napoleão, dos Habsburgos e da dinastia Savoy antes de se tornar um museu. O único caminho do labirinto para o centro, cheio de becos sem saída, é notoriamente difícil, tendo supostamente até mesmo enganado Napoleão e Mussolini. Hoje, os visitantes podem experimentar o charme histórico e o desafio intrigante deste labirinto notável.

Leia mais

Microsoft endurece políticas de gestão de desempenho para lidar com funcionários de baixo desempenho

2025-04-22
Microsoft endurece políticas de gestão de desempenho para lidar com funcionários de baixo desempenho

A Microsoft está implementando novas políticas de gestão de desempenho para aumentar a pressão sobre os funcionários e lidar com aqueles que não estão atendendo às expectativas. Isso inclui uma proibição de recontratação de dois anos para funcionários de baixo desempenho, refletindo uma tendência mais ampla na indústria de tecnologia para expectativas de desempenho mais rigorosas. As novas políticas também incluem um processo de melhoria de desempenho aprimorado e opções para demissão de funcionários de baixo desempenho, com foco em transparência e responsabilização.

Leia mais

Airbnb agora mostra o preço total antecipadamente: acabou com taxas ocultas

2025-04-22
Airbnb agora mostra o preço total antecipadamente: acabou com taxas ocultas

O Airbnb está lançando globalmente uma atualização em sua função de pesquisa, exibindo o preço total, incluindo taxas de limpeza, antecipadamente. Essa mudança visa aumentar a transparência e evitar surpresas no checkout. A alteração segue o escrutínio da União Europeia sobre suas práticas de exibição de taxas, inicialmente implementada em alguns locais em 2019. Posteriormente, um recurso de alternância foi introduzido nos EUA e em centenas de outros países para mostrar o custo total da estadia. Quase 17 milhões de pessoas usaram esse recurso desde seu lançamento em 2022. Agora, os usuários não precisarão ativá-lo; um banner com a inscrição "Os preços incluem todas as taxas" aparecerá no topo dos resultados da pesquisa.

Leia mais
Diversos Taxas de reserva

Descoberta de Pinheiro Jeffrey em Alta Altitude Desafia Modelos de Mudança Climática

2025-04-22
Descoberta de Pinheiro Jeffrey em Alta Altitude Desafia Modelos de Mudança Climática

O professor Hugh Safford da UC Davis descobriu um pinheiro Jeffrey a uma altitude recorde de 12.657 pés na Serra Alta da Califórnia, 1.860 pés acima do recorde anterior. Publicada em Madroño, essa descoberta fortuita sugere que a mudança climática está impulsionando os pinheiros Jeffrey para altitudes mais elevadas, desafiando modelos existentes que preveem o ritmo da migração de espécies. Os pesquisadores suspeitam que os quebra-nozes de Clark podem estar ajudando nessa migração carregando sementes. A descoberta destaca a importância do trabalho de campo na pesquisa sobre mudança climática e pede mais pesquisas em campo para avaliar com precisão o impacto da mudança climática em ecossistemas de alta altitude.

Leia mais

Relíquia do Passado: Um Catálogo de Jogos BASIC dos Anos 80

2025-04-22
Relíquia do Passado: Um Catálogo de Jogos BASIC dos Anos 80

Este artigo apresenta uma lista fascinante de jogos BASIC dos anos 1980, abrangendo vários sistemas de computadores como BASIC-PLUS, EduSystem, DECsystem 10 e HP. De jogos simples de adivinhação de números (Acey-Ducey, Bagles) a jogos de estratégia complexos (Gomoko, Guerra Civil) e simulações (HMRABI, KING), a variedade demonstra a criatividade e a engenhosidade da programação daquela época. Esses jogos, simples, mas envolventes, certamente evocarão nostalgia em muitos.

Leia mais
1 2 289 290 291 293 295 296 297 595 596