Ajustando Finamente o GPT-2 para Geração de Sentimento Positivo usando RLHF

2025-07-06
Ajustando Finamente o GPT-2 para Geração de Sentimento Positivo usando RLHF

Este projeto fornece uma implementação de referência para o ajuste fino de um modelo GPT-2 pré-treinado para gerar frases que expressam sentimento positivo usando Aprendizado por Reforço a partir de Feedback Humano (RLHF). O processo envolve três etapas: 1. Ajuste Fino Supervisionado (SFT): Ajuste fino do GPT-2 no conjunto de dados stanfordnlp/sst2; 2. Treinamento do Modelo de Recompensa: Treinamento de um modelo GPT-2 com uma cabeça de recompensa para prever o sentimento; 3. Aprendizado por Reforço via Proximal Policy Optimization (PPO): Otimização do modelo SFT para gerar frases que o modelo de recompensa avalia positivamente. Essas três etapas são implementadas em três notebooks Jupyter, permitindo uma abordagem passo a passo. Um token de acesso Hugging Face é necessário para baixar o modelo GPT-2 pré-treinado.

Leia mais

Linux Kernel 6.16 corrige vulnerabilidades de despejo de núcleo: Adeus à API 'estúpida'

2025-06-14

A versão 6.16 do kernel do Linux melhora significativamente o tratamento de despejos de núcleo, resolvendo vulnerabilidades de segurança de longa data. Os designs anteriores da API apresentavam falhas, como manipuladores de despejo de núcleo rodando com privilégios de root, tornando-os alvos atraentes para ataques, e condições de corrida levando a vulnerabilidades. As novas melhorias introduzem pidfd para garantir que os manipuladores operem no processo com falha correto e permitem que os manipuladores se vinculem a uma socket para receber despejos de núcleo, reduzindo os riscos de escalada de privilégios e prevenindo eficazmente ataques.

Leia mais
Desenvolvimento despejo de núcleo

Google Family Link permitirá que crianças acessem o Gemini AI

2025-05-03
Google Family Link permitirá que crianças acessem o Gemini AI

O Google está disponibilizando acesso aos seus aplicativos Gemini AI para crianças por meio de seus controles parentais Family Link em dispositivos Android. Embora o Gemini possa ajudar com a lição de casa e contar histórias, o Google alerta os pais de que a IA pode cometer erros e as crianças podem encontrar conteúdo inadequado. O Google garante que os dados das crianças não serão usados para treinar a IA. Os pais são aconselhados a conversar com seus filhos para explicar que o Gemini não é humano e para evitar compartilhar informações sensíveis. Os pais mantêm o controle por meio do Family Link, recebendo notificações no primeiro acesso do filho ao Gemini e mantendo a capacidade de desativar o acesso completamente.

Leia mais

Quebrando a Barreira do Tempo Linear: A Ascensão dos Algoritmos de Tempo Sublinear

2025-02-24

Algoritmos de tempo linear foram considerados por muito tempo o padrão ouro para resolução de problemas. No entanto, com a prevalência de conjuntos de dados massivos, algoritmos de tempo sublinear estão ganhando cada vez mais atenção. Algoritmos de tempo sublinear lêem apenas uma fração minúscula da entrada, um feito aparentemente impossível. Embora algoritmos de tempo sublinear determinísticos existam para alguns problemas, a maioria requer aleatoriedade e fornece soluções aproximadas. Avanços recentes foram feitos em vários problemas, incluindo problemas clássicos de otimização e teste de propriedades. Técnicas como o Lema de Regularidade de Szemerédi e aproximações de matrizes de baixo posto estão se mostrando úteis no projeto de algoritmos de tempo sublinear, mas ainda há muito a ser compreendido sobre seu escopo e limitações.

Leia mais

FreeBSD: Não está morto, apenas alimentando silenciosamente a internet

2025-05-26

Discussões recentes questionaram se o FreeBSD está morrendo. Ao analisar dados do Google Trends, o autor mostra uma tendência ascendente constante para as pesquisas do FreeBSD, contrastando com uma linha reta para o Linux. Essa ideia equivocada, argumenta o autor, decorre da heurística da disponibilidade; as pessoas se concentram no Linux, mais discutido, ignorando o poder silencioso do FreeBSD por trás de inúmeros serviços de internet. A licença BSD permissiva do FreeBSD, embora o torne uma ótima base para produtos comerciais, desestimula as empresas a contribuir. O autor conclama os usuários do FreeBSD a compartilhar suas experiências e desafios, permitindo que a Fundação FreeBSD preencha a lacuna entre a indústria e os fornecedores de software/hardware, promovendo o crescimento do FreeBSD.

Leia mais
Desenvolvimento licença BSD

Tribunais europeus ordenam bloqueio de sites piratas; provedores de DNS reagem de forma diferente

2025-05-11

Tribunais europeus emitiram recentemente ordens para que resolvedores de DNS como OpenDNS, Cloudflare e Google bloqueiem sites piratas, levando a respostas variadas dessas gigantes da tecnologia. O OpenDNS tomou medidas drásticas, retirando-se da França e da Bélgica; o Cloudflare utilizou "mecanismos alternativos" para cumprir, notificando os usuários com um erro HTTP 451; o Google silenciosamente recusou consultas de DNS sem explicação. Essa falta de transparência confunde os usuários e potencialmente viola os requisitos judiciais para explicações detalhadas. Há preocupações crescentes sobre projetos de lei semelhantes nos EUA, destacando a importância da transparência no combate a questões de direitos autorais online.

Leia mais

Iluminação Volumétrica no React Three Fiber: Raymarching com Pós-Processamento

2025-06-14
Iluminação Volumétrica no React Three Fiber: Raymarching com Pós-Processamento

Este artigo mergulha na criação de efeitos de iluminação volumétrica realistas no React Three Fiber combinando pós-processamento e raymarching volumétrico. O autor explica meticulosamente as transformações de sistemas de coordenadas, reconstruindo raios 3D do espaço de tela e utilizando buffers de profundidade para otimização de desempenho. Técnicas avançadas como modelagem de luz usando SDFs, mapeamento de sombras e espalhamento de luz são abordadas, culminando em um efeito de iluminação volumétrica dinâmica com sombras e névoa. Múltiplas demonstrações mostram a técnica em arcos e cenas espaciais, enquanto também exploram múltiplas fontes de luz e sombreamento omnidirecional.

Leia mais
Desenvolvimento iluminação volumétrica

Autoestradas pós-Segunda Guerra: Desvendando Mitos e Revelando a Verdade

2024-12-17
Autoestradas pós-Segunda Guerra: Desvendando Mitos e Revelando a Verdade

Este artigo explora eventos-chave e equívocos em torno do desenvolvimento de rodovias após a Segunda Guerra Mundial. Esclarece que a Autobahn alemã não foi inicialmente projetada para fins militares, mas sim para estimular a economia e melhorar o prestígio nacional. Embora as forças aliadas tenham utilizado a Autobahn nas fases posteriores da Segunda Guerra Mundial, este não era o seu objetivo inicial. O artigo desmascara o mito de que o sistema de rodovias interestaduais dos EUA foi projetado com um quilômetro em cada cinco sendo reto e nivelado para pousos de bombardeiros de emergência, explicando que seu verdadeiro propósito era o benefício civil e o desenvolvimento econômico, embora também atendesse às necessidades militares, como movimentação de tropas e produção industrial. Finalmente, o artigo analisa as tentativas e exercícios pós-Segunda Guerra Mundial por vários militares para utilizar rodovias como pistas de pouso de emergência para aeronaves, destacando suas limitações e substituição final por campos de aviação dedicados.

Leia mais

Experimento de alimentação eficiente de um engenheiro (US$ 2,50 por dia)

2025-01-06

Um engenheiro realizou um experimento de 46 dias com o objetivo de gastar menos de US$ 2,50 por dia em comida. O blog detalha suas refeições diárias, custos, ciência culinária e a diversão do desafio. De sopa de tomate e sanduíche de queijo grelhado a bolinhos de repolho caseiros, salmão, tacos de porco, ramen, sopa de ervilha e batata e frango frito, ele demonstrou habilidades de culinária impressionantes e paixão pela comida. Ele compartilhou receitas, técnicas e enfatizou o planejamento, a economia e a redução de desperdício. O experimento demonstrou com sucesso que uma alimentação deliciosa e saudável é alcançável com um orçamento muito limitado.

Leia mais

Pesquisadores chineses desenvolvem algoritmo de design de materiais 800 vezes mais rápido

2025-02-02
Pesquisadores chineses desenvolvem algoritmo de design de materiais 800 vezes mais rápido

Pesquisadores da Universidade MSU-BIT de Shenzhen desenvolveram um algoritmo de alto desempenho que acelera drasticamente as simulações de design de materiais em GPUs de nível consumidor. O algoritmo aumenta a eficiência computacional da peridinâmica (PD), uma teoria não-local para modelar o comportamento complexo de materiais, como rachaduras e fraturas, em impressionantes 800 vezes. Essa descoberta abre portas para diversas indústrias, especialmente aplicações aeroespaciais e militares, utilizando GPUs amplamente disponíveis, de baixo custo e não sujeitas a sanções dos EUA.

Leia mais

Lieferando.de: Aquisição Furtiva de Domínios de Restaurantes Alemães

2025-05-26
Lieferando.de: Aquisição Furtiva de Domínios de Restaurantes Alemães

Um analista de dados extraiu quase 9 milhões de domínios .de do projeto Common Crawl, filtrando aproximadamente 30.000 relacionados a restaurantes alemães. Um programa Golang revelou que cerca de 63% permaneciam ativos. Surpreendentemente, cerca de 5,7% (mais de 1100) desses domínios ativos foram 'capturados' pela Lieferando.de, exibindo seu logotipo e um link para seu site, em vez de redirecionar. Isso sugere que a Lieferando.de empregou essa estratégia de domínio antes e depois da pandemia, usando uma forma de 'sequestro de domínio' para SEO de baixo custo e crescimento hacker. O grande número de domínios de restaurantes extintos também reflete as dificuldades do setor de restaurantes alemão de 2019 a 2023.

Leia mais

Bíblia de Debugging: Nove Regras Imprescindíveis

2025-01-13

O livro "Debugging: The 9 Indispensable Rules for Finding Even the Most Elusive Software and Hardware Problems", de David J. Agans, é aclamado como um clássico para desenvolvedores de software e hardware. Este livro não se concentra em tecnologias específicas, mas em métodos fundamentais para encontrar e corrigir bugs. Por meio de nove regras, ilustradas com inúmeros exemplos envolventes, o autor explica como entender o sistema, fazê-lo falhar, obter dados, dividir e conquistar, mudar uma coisa de cada vez, manter um rastro de auditoria, verificar suposições, buscar ajuda e verificar correções. Mesmo desenvolvedores experientes encontrarão lembretes úteis, enquanto iniciantes o acharão um recurso inestimável.

Leia mais
Desenvolvimento

Testando um Netcode Robusto com Godot: Lidando com Latência e Perda de Pacotes

2025-06-19
Testando um Netcode Robusto com Godot: Lidando com Latência e Perda de Pacotes

O maior desafio no desenvolvimento de Little Brats! foi a parte multiplayer online: sincronizar computadores com latência variável mantendo a jogabilidade rápida e fluida. Este artigo detalha a jornada do autor, focando em compensação de lag, técnicas de predição/reconciliação e metodologias de teste robustas. Usando a classe ENetMultiplayerPeer do Godot e o comando `tc` do Linux para simular condições de rede (latência e perda de pacotes), o autor compara o desempenho dos modos de rede confiável e não confiável, fornecendo gráficos e conclusões perspicazes. O processo destaca as complexidades de criar um jogo online estável e oferece conselhos práticos para desenvolvedores.

Leia mais

Dominando o Delphi 5: Uma Retrospectiva de 25 Anos

2025-03-24

Marco Cantu lançou uma edição anotada de 2025 gratuita de seu clássico 'Dominando o Delphi 5'. O livro de 1139 páginas apresenta 475 notas de rodapé e dezenas de novas capturas de tela comparando as interfaces antigas e novas do IDE e dos aplicativos. Embora parte do código não compile, a maioria dos programas ainda são executados, um testemunho do legado duradouro do Delphi. Este presente para a comunidade celebra o 30º aniversário do Delphi e oferece uma jornada nostálgica por sua história.

Leia mais
Desenvolvimento Retrospectiva

Vulnerabilidades Críticas no Rsync: Possível Execução de Código Remota

2025-01-15

Pesquisadores descobriram seis vulnerabilidades no rsync, sendo a mais crítica delas a possibilidade de execução remota de código em um servidor com apenas acesso de leitura anônimo a um espelho rsync público. Essas vulnerabilidades variam de estouro de buffer de heap e vazamento de informações a travessia de caminho e condições de corrida. As vulnerabilidades foram corrigidas no rsync 3.4.0; os usuários são instados a atualizar imediatamente.

Leia mais
Tecnologia

Startup de codificação Base44, com seis meses de existência, adquirida pela Wix por US$ 80 milhões

2025-06-19
Startup de codificação Base44, com seis meses de existência, adquirida pela Wix por US$ 80 milhões

A Base44, startup de codificação por IA criada por Maor Shlomo e com apenas seis meses de existência, foi adquirida pela Wix por US$ 80 milhões em dinheiro. Com 250.000 usuários e um crescimento meteórico (10.000 usuários em três semanas), a Base44 se tornou um exemplo notável do potencial de startups, mesmo com equipes reduzidas. A aquisição demonstra o crescente mercado de plataformas de baixo código/sem código e a rápida adoção da IA em empresas iniciantes.

Leia mais
Startup

Zeekstd: Uma Implementação de Zstandard com Busca em Rust

2025-06-16
Zeekstd: Uma Implementação de Zstandard com Busca em Rust

Zeekstd é uma biblioteca Rust que implementa um formato Zstandard com capacidade de busca. Ele divide os dados comprimidos em quadros independentes para acesso aleatório eficiente. Totalmente compatível com a especificação original, o Zeekstd oferece melhorias e inclui funcionalidades de codificador e decodificador, permitindo a descompactação de arquivos inteiros ou quadros específicos. Uma ferramenta de linha de comando também é fornecida.

Leia mais
Desenvolvimento Compressão com Busca

Gemini AI aprimora o Google Workspace: Resumos para PDFs e formulários chegam

2025-06-13
Gemini AI aprimora o Google Workspace: Resumos para PDFs e formulários chegam

O Google está lançando novos recursos de IA Gemini para o Workspace, simplificando a recuperação de informações de PDFs e respostas de formulários. Os recursos de resumo de arquivos do Gemini agora se estendem a PDFs e formulários do Google, condensando detalhes e insights importantes para facilitar o acesso. Para PDFs, o Gemini gera cards de resumo com ações clicáveis, como 'elaborar uma proposta' ou 'listar perguntas de entrevista'. Para formulários, ele resume respostas de perguntas curtas, destacando os temas principais. Um novo recurso 'ajude-me a criar' gera automaticamente formulários com base em descrições do usuário, incorporando até mesmo dados de outros arquivos do Google Workspace. Esses recursos estão sendo lançados em etapas ao longo de junho e julho, com suporte de idiomas variado.

Leia mais

Erros de compilador C++: Erros sem sentido de uma declaração de função

2024-12-12
Erros de compilador C++: Erros sem sentido de uma declaração de função

Um desenvolvedor adicionando suporte XAML a um aplicativo C++ encontrou uma série de erros de compilador simplesmente incluindo o arquivo de cabeçalho winrt/Windows.UI.Xaml.h. Os erros decorreram do que parecia ser uma declaração de função normal: `template struct consume_Windows_UI_Xaml_IExceptionRoutedEventArgs { [[nodiscard]] auto ErrorMessage() const; };` A causa raiz era uma macro preexistente chamada ErrorMessage no projeto do desenvolvedor, conflitando com o nome da função. Essa macro criava um objeto ErrorMessageString e retornava um ponteiro para uma string de mensagem de erro. A falta de limites da macro fez com que o compilador interpretasse erroneamente a declaração da função como uma invocação de macro, resultando em erros como "argumentos insuficientes". A solução envolveu desabilitar a macro usando #pragma undef antes de incluir o cabeçalho ou remover a macro completamente e substituí-la por uma função inline.

Leia mais

Preços de Flash NAND Despencam Devido à Superabundância

2025-02-18
Preços de Flash NAND Despencam Devido à Superabundância

Espera-se que os preços de flash NAND caiam devido à superabundância, forçando os fabricantes de chips de memória a reduzir a produção. A demanda menor que o esperado de fabricantes de PCs e smartphones está contribuindo para o excesso de estoque. A TrendForce revisou as previsões de crescimento para 10-15% em 2025. Embora os preços devam permanecer fracos no primeiro semestre de 2025, a demanda de servidores de IA por SSDs deve impulsionar os embarques no segundo semestre. O mercado está se ajustando, com especialistas prevendo uma recuperação de preços na segunda metade do ano, impulsionada pela IA e pela transição para tecnologias avançadas.

Leia mais

IA resolve o enigma do balanceador de esteiras do Factorio

2024-12-30
IA resolve o enigma do balanceador de esteiras do Factorio

Esta postagem de blog descreve a jornada do autor na automação do design de balanceadores de esteiras do Factorio, um problema notoriamente complexo. Usando solucionadores de Programação de Inteiros Mistos (MIP) e Programação de Restrições SAT (CP-SAT), o autor enfrentou o desafio. Embora o modelo MIP tenha lutado com instabilidade numérica para balanceadores maiores, a abordagem CP-SAT, empregando discretização de fluxos e incorporando redes Banes e otimização de memória, resolveu com sucesso o design para um balanceador de 16x16 — uma façanha praticamente impossível manualmente. O processo destaca o papel crucial das técnicas de modelagem, seleção de algoritmos e estratégias de otimização para alcançar soluções eficientes.

Leia mais

Remake do jogo nostálgico 'Alley Cat' lançado

2024-12-17

O programador Joflof finalmente completou um remake do clássico jogo de 1983, 'Alley Cat', após muitos anos de trabalho. Este remake não apenas mantém os gráficos pixelados e os efeitos sonoros originais, mas também adiciona cinco novos níveis e modos multijogador para até quatro gatinhos jogarem simultaneamente. Além disso, Joflof incluiu opções de configuração especiais para o modo arcade para entusiastas de arcades. Atualmente, o jogo está disponível apenas para Windows, mas o autor espera que entusiastas ajudem a portá-lo para sistemas Linux e Mac.

Leia mais

O Tsunami Órfão de 1700: Uma história de detetive científica transpacífica

2025-03-31

Um tsunami misterioso atingiu o Japão em janeiro de 1700, sua origem inicialmente um enigma. Somente na metade da década de 1990, através de uma série de descobertas investigadas na América do Norte e no Japão, os cientistas descobriram a verdade: o tsunami resultou de um terremoto ao longo da costa do noroeste da América do Norte. O livro, "O Tsunami Órfão de 1700", reconta esta história de detetive científica transpacífica. Suas descobertas sustentam muitas das precauções atuais contra terremotos e tsunamis na região de Cascadia, e fornece um contraste e alerta nítidos quando comparado ao tsunami japonês de 2011.

Leia mais
Tecnologia terremoto

Previsões para 2025: Kernel Linux, Software Livre e o Futuro Incerto

2025-01-17

As previsões da LWN.net para 2025 retratam uma imagem de avanços empolgantes e desafios iminentes no cenário do kernel Linux e do software livre. O artigo prevê mudanças transformadoras com a classe de escalonamento extensível (sched-ext), maior adoção de Rust no kernel, a descoberta de novas tentativas de backdoors, riscos associados a projetos de manutenção única, o potencial impacto do código gerado por IA, crescente suporte para IA generativa gratuita e mantenedores, falhas persistentes de produtos em nuvem e violações de dados, um aumento em hardware aberto, um ressurgimento de distribuições de dispositivos móveis e o impacto de fatores geopolíticos. O ano que se aproxima promete grandes oportunidades e obstáculos consideráveis para a comunidade de software livre.

Leia mais
Desenvolvimento

Esposa bate recorde mundial de Tetris em um fliperama 'Mundo Bizarro'

2025-05-04

A esposa do autor tenta inesperadamente quebrar o recorde mundial de Tetris para Game Boy. Em um torneio de jogos clássicos, ela supera o recorde existente de 327 linhas, atingindo finalmente impressionantes 841 linhas, tornando-se a nova recordista mundial. O evento é cheio de reviravoltas inesperadas, mostrando não apenas suas habilidades excepcionais de jogo, mas também as controvérsias e complexidades por trás da verificação de recordes de videogames.

Leia mais

Notícias Hearst Online: Uma Jornada no Tempo

2025-05-08

O arquivo online de notícias da Hearst está no ar! Este site, um projeto colaborativo entre a Universidade da Califórnia e o Instituto de Humanidades Packard, apresenta uma vasta coleção de noticiários que abrangem de 1929 a 1967, originalmente doados pela Hearst Corporation. Os usuários podem navegar e assistir a esses filmes históricos, oferecendo uma jornada única no tempo. Observe que alguns noticiários podem conter preconceitos desatualizados e conteúdo potencialmente perturbador.

Leia mais

Polêmica do anúncio do Apple Wallet: Confiança quebrada?

2025-06-29
Polêmica do anúncio do Apple Wallet: Confiança quebrada?

A notificação push do Apple Wallet para um anúncio do filme F1 gerou controvérsia. O autor argumenta que essa decisão mina a imagem de privacidade e confiança cuidadosamente construída pelo Apple Wallet. Injetar anúncios no aplicativo Wallet é como colocar anúncios em uma carteira física – absurdo e diretamente contraditório à mensagem do Apple. Essa ação pode levar os usuários a acreditar que seus interesses estão sendo rastreados, corroendo a confiança e gerando preocupações com a privacidade. O autor sugere até mesmo que quem autorizou o anúncio seja demitido.

Leia mais
Tecnologia

A Entropia da Saída de Modelos de Linguagem Grandes: Uma Perspectiva da Teoria da Informação

2025-01-13

Esta publicação explora a saída de modelos de linguagem grandes (LLMs como o ChatGPT) de uma perspectiva da teoria da informação. O autor calcula a entropia de cada token de saída para medir a certeza do modelo ao prever o próximo token. Experimentos mostram entropia mais baixa (maior certeza) no final das frases ou fragmentos de palavras, e entropia mais alta (mais incerteza) em declarações descritivas. Uma comparação dos tipos de tokens em entropia baixa versus alta revela que a entropia baixa geralmente se correlaciona com declarações factuais (contendo nomes próprios), enquanto a entropia alta se correlaciona com declarações descritivas. Um exemplo em tâmil é usado para ilustração adicional, enfatizando a importância de discernir a verdade da falsidade.

Leia mais

América em 2024: Um Ano de Raiva e Confusão

2024-12-29
América em 2024: Um Ano de Raiva e Confusão

O ano de 2024 nos Estados Unidos foi marcado por um forte contraste entre a raiva generalizada e a confusão da elite. O aumento da falta de moradia, especialmente entre famílias, alimentou o ressentimento público. Essa raiva se manifestou de várias maneiras, desde a schadenfreude em relação às vítimas do submergível Titan até o apoio a Trump e a indignação com o assassinato de um CEO da área de saúde. A elite, no entanto, lutou para entender essa raiva, recorrendo a medidas de segurança ineficazes, como uma linha direta de crise para CEOs, alienando ainda mais o público. A tentativa da senadora Warren de articular a raiz da raiva foi sufocada, destacando uma quebra de comunicação crítica.

Leia mais
1 2 507 508 509 511 513 514 515 595 596