Alibaba lança sua primeira CPU para servidores, impulsionando a autossuficiência de chips na China

2025-03-03
Alibaba lança sua primeira CPU para servidores, impulsionando a autossuficiência de chips na China

A Academia Damo da Alibaba lançou sua primeira CPU para servidores, a C930, parte de sua série de processadores XuanTie RISC-V. Com entrega aos clientes em março, o chip é um passo importante nos esforços da China para melhorar sua independência em semicondutores em meio aos controles de exportação dos EUA. Voltado para computação de alto desempenho, a Alibaba também planeja outros chips XuanTie para aceleração de IA, aplicações automotivas e interconexão de alta velocidade. Essa iniciativa se alinha com o aumento do investimento da China em RISC-V, reduzindo a dependência de tecnologia estrangeira e promovendo a integração de tecnologia militar e civil. Também complementa o investimento planejado de 380 bilhões de yuans da Alibaba em IA e infraestrutura de nuvem nos próximos três anos, apoiando a crescente demanda por aplicativos de IA na China.

Leia mais

Apollo 13: Uma Aventura Espacial de Engenho e Sobrevivência

2025-04-18
Apollo 13: Uma Aventura Espacial de Engenho e Sobrevivência

Em 1970, a missão Apollo 13 à Lua transformou-se numa luta desesperada pela sobrevivência quando um tanque de oxigênio explodiu, deixando três astronautas presos a 200.000 milhas da Terra. Enfrentando a escassez de oxigênio, energia e água, a tripulação se viu em uma situação crítica devido à insuficiência de absorvedores de dióxido de carbono. O controle no solo, em um feito de engenho, guiou os astronautas por meio de um reparo improvisado usando apenas materiais disponíveis a bordo. Eles modificaram com sucesso o sistema de CO2, evitando um desastre e garantindo um retorno seguro. Essa história angustiante destaca a resiliência humana e a resolução de problemas diante de desafios inimagináveis.

Leia mais

Cekura: Automatizando os Testes de Agentes de Voz com IA

2025-04-21
Cekura: Automatizando os Testes de Agentes de Voz com IA

A Cekura, uma startup apoiada pela Y Combinator, está redefinindo a confiabilidade dos agentes de voz com IA. Fundada por ex-alunos do IIT Bombay com credenciais de pesquisa da ETH Zurich e sucesso comprovado em negociações de alto risco, a equipe da Cekura construiu a plataforma para resolver a natureza trabalhosa e propensa a erros dos testes manuais de agentes de voz. Eles automatizam os testes e a observabilidade, simulando milhares de cenários de conversação realistas do mundo real, desde pedidos de comida e marcação de compromissos até entrevistas. A plataforma utiliza conjuntos de dados personalizados e gerados por IA, fluxos de trabalho detalhados e simulações de persona dinâmicas para descobrir casos extremos e fornecer insights acionáveis. O monitoramento em tempo real, logs abrangentes e alertas instantâneos garantem que todas as chamadas sejam otimizadas e estejam prontas para produção. Em um mercado que se expande rapidamente com milhares de agentes de voz, a Cekura se destaca garantindo desempenho confiável, reduzindo o tempo de lançamento no mercado e minimizando erros de produção dispendiosos. Eles capacitam as equipes a demonstrarem confiabilidade antes da implantação, facilitando a construção de confiança com clientes e usuários.

Leia mais

O Crepúsculo das Voyager: Um Legado de Exploração Interstelar

2025-04-05
O Crepúsculo das Voyager: Um Legado de Exploração Interstelar

Quase 50 anos após o lançamento, as sondas Voyager estão se aproximando do fim de suas vidas operacionais. A energia está diminuindo devido ao plutônio em decadência, as espaçonaves envelhecidas perdem 4 watts anualmente, forçando decisões difíceis de desligar sistemas não essenciais, incluindo instrumentos científicos. A cientista do projeto Linda Spilker relata os desafios de manter essas naves antigas e o esforço para transmitir seu conhecimento às novas gerações. A jornada das Voyager, produzindo dados inestimáveis sobre a heliopausa e o espaço interestelar, inspira futuras missões interestelares, traçando um curso para a contínua exploração do cosmos pela humanidade.

Leia mais
Tecnologia Espaço Interstelar

Experimento da Redação de IA: Construindo uma Empresa Nativa de IA

2025-04-22
Experimento da Redação de IA: Construindo uma Empresa Nativa de IA

Henry Blodget, usando o ChatGPT, criou uma equipe de notícias de IA composta por uma editora-chefe, uma correspondente de tecnologia, uma correspondente de economia e mercados e um faz-tudo. Este experimento explora o papel da IA no jornalismo, não como substituição de jornalistas humanos, mas como colaboradora. Os membros da equipe de IA demonstraram eficiência e profissionalismo impressionantes. Blodget compartilha anedotas engraçadas, como comentar sobre a aparência de um colega de IA. Ele conclui destacando o potencial de colaboração entre IA e humanos na produção de notícias e espera explorações futuras.

Leia mais
Tecnologia

Testes de Entrega de Drones da Amazon Causam Discórdia na Vizinhança

2025-03-03
Testes de Entrega de Drones da Amazon Causam Discórdia na Vizinhança

O programa de teste de entrega de drones da Amazon em College Station, Texas, gerou forte reação negativa de moradores locais devido ao excesso de poluição sonora. Inicialmente, voos frequentes de drones interromperam severamente a vida dos moradores e até afetaram a vida selvagem. Embora a Amazon tenha afirmado ter implementado medidas de redução de ruído e cumprido as regulamentações, os moradores acreditam que a empresa cometeu um erro crucial ao localizar sua base de drones perto de áreas residenciais. A Amazon acabou suspendendo temporariamente seus drones para uma atualização de software e planeja rescindir seu contrato de locação, oferecendo um vislumbre de esperança para os moradores cansados do barulho. O incidente levanta questões sobre como as empresas de tecnologia equilibram os interesses comerciais com o bem-estar público ao desenvolver novas tecnologias.

Leia mais

A Bolha do Hype da IA: Uma Delusão na Indústria de Tecnologia

2025-04-19

Um cientista da computação argumenta apaixonadamente contra o hype exagerado atual em torno da IA. Muitas empresas seguem cegamente as tendências, vendo a IA como uma panacéia em vez de uma ferramenta prática. Esse hype leva ao desperdício de fundos, alocação incorreta de talentos e até mesmo sacrifícios de privacidade e liberdade. Ele argumenta que apenas uma pequena fração do hype da IA é baseada em fatos úteis, sendo o restante besteira exagerada, prejudicando em última análise investidores e pequenas empresas. O autor exorta os leitores a abordarem a IA racionalmente e a evitarem ser arrastados pela mídia e pela opinião pública.

Leia mais

A jornada do Swift para o WebAssembly: Desempenho, segurança e o futuro

2025-04-05
A jornada do Swift para o WebAssembly: Desempenho, segurança e o futuro

A comunidade Swift tem melhorado constantemente o suporte ao WebAssembly ao longo dos anos, e este artigo descreve uma visão e um roteiro para seu futuro. O WebAssembly, com sua portabilidade, segurança e alto desempenho, é ideal para aplicativos multiplataforma. A integração do Swift com o WebAssembly expande seu alcance e melhora a segurança, especialmente em ferramentas de desenvolvedor. A virtualização de macros Swift e plugins SwiftPM usando WebAssembly oferece maior segurança e tempos de construção mais rápidos. Os objetivos futuros incluem maior cobertura de API em bibliotecas principais, suporte aprimorado para compilação cruzada, suporte aprimorado ao modelo de componente e uma melhor experiência de depuração. O artigo também se aprofunda em considerações específicas da plataforma, como depuração, multithreading, espaço de endereço de 64 bits e bibliotecas compartilhadas, mostrando o potencial para o florescimento do Swift no ecossistema WebAssembly.

Leia mais

TDAH e Perda de Emprego: Não é um Fracasso

2025-04-25
TDAH e Perda de Emprego: Não é um Fracasso

Para pessoas com TDAH, a perda de emprego é uma possibilidade, e tudo bem. O autor, tendo sido demitido uma vez e pedido demissão quatro vezes, reformula as mudanças de emprego como experiências de aprendizado. Os locais de trabalho típicos são projetados para indivíduos neurotípicos, e os traços de TDAH muitas vezes entram em conflito com as expectativas, levando a mal-entendidos por parte dos empregadores. Ser demitido não é um reflexo da autoestima, mas sim uma questão de compatibilidade. O autor aconselha a se concentrar em entender as próprias necessidades e encontrar um trabalho melhor, e encoraja os leitores a não se preocuparem excessivamente com a segurança no emprego.

Leia mais
Diversos

LLMs Falham em Tarefa Simples: Correspondência entre Elementos HTML5 e TLDs

2025-09-21
LLMs Falham em Tarefa Simples: Correspondência entre Elementos HTML5 e TLDs

O autor testou três LLMs comercialmente disponíveis em uma tarefa aparentemente simples: identificar quais domínios de nível superior (TLDs) compartilham nomes com elementos HTML5 válidos. Os resultados foram decepcionantes, com os três modelos produzindo resultados imprecisos ou incompletos, destacando as limitações dos LLMs atuais, mesmo em tarefas que exigem habilidades básicas de comparação. A precisão, aparentemente, depende muito da familiaridade do usuário com o assunto.

Leia mais
IA

Assinatura de commits Git: Limitações das abordagens tradicionais e perspectivas futuras

2025-04-25

Este artigo explora o estado atual e os desafios da assinatura de commits Git. Métodos tradicionais como a assinatura GPG sofrem com complexidades no gerenciamento de chaves e riscos associados a identidades de longa duração. O autor analisa as deficiências da assinatura GPG, SSH e S/MIME em plataformas como GitHub e GitLab, e apresenta soluções emergentes como Gitsign e OpenPubkey do Sigstore. Essas soluções utilizam identidades de curta duração e logs de transparência para melhorar a segurança, mas atualmente apresentam limitações. O autor sugere priorizar o gerenciamento de chaves SSH e as regras de proteção de branches até que as soluções Sigstore amadureçam.

Leia mais

1 é um número primo? Uma saga matemática

2025-04-21
1 é um número primo? Uma saga matemática

Este ensaio mergulha no debate de longa data na matemática em torno da classificação de 1 como um número primo. Da exclusão de 1 como número pela escola pitagórica a diferentes pontos de vista mantidos por gigantes da matemática como Euler e Hardy, o status de 1 tem sido uma fonte de discussão contínua. O artigo explora as vantagens e desvantagens de considerar 1 como primo ou não, e os ajustes resultantes em teoremas e conceitos matemáticos. Por fim, o ensaio resume por que a comunidade matemática moderna geralmente não considera 1 um número primo, destacando que as definições matemáticas não são verdades imutáveis, mas convenções feitas para simplicidade e consistência teórica.

Leia mais

Kernel XNU: A Base Sólida para o Ecossistema Apple

2025-04-06
Kernel XNU: A Base Sólida para o Ecossistema Apple

Este mergulho profundo explora a arquitetura e a evolução do XNU, o kernel central que alimenta os sistemas operacionais da Apple (macOS, iOS, etc.). O XNU é um kernel híbrido único que combina os pontos fortes do microkernel Mach e do BSD Unix, equilibrando modularidade e desempenho. Traçando a história do XNU desde suas origens no microkernel Mach, o artigo abrange as transições arquitetônicas de PowerPC para Intel para Apple Silicon, melhorias no suporte multinúcleo, recursos de 64 bits e mecanismos de segurança aprimorados (SIP, Secure Enclave, Exclaves). O sucesso do XNU reside em sua flexibilidade e escalabilidade, adaptando-se a dispositivos que vão de iPhones a Mac Pros e fornecendo uma base poderosa para o ecossistema da Apple.

Leia mais
Desenvolvimento sistemas operacionais Apple

Aranhas Saltadoras do Tennessee: Mais Adoráveis do que Você Imagina

2025-04-05

O Tennessee abriga uma variedade surpreendentemente diversa de aranhas saltadoras (Salticidae), criaturas pequenas e diurnas com visão excepcional, até mesmo visão colorida, usada no namoro. Elas não constroem teias, mas usam seda para abrigos e linhas de arrasto para estabilizar saltos para caça e fuga. Seu veneno representa ameaça mínima para humanos, e algumas espécies exibem mimetismo, como imitar formigas para evitar predadores. Aranhas saltadoras machos têm rituais de cortejo elaborados, com espécies diferentes exibindo cores e comportamentos diversos. Embora pequenas, as aranhas saltadoras desempenham um papel ecológico importante, e sua abundância as torna um assunto fascinante para observação.

Leia mais

Guia Prático para Modelos de Linguagem de Grande Porte: Código e Ilustrações Incluídos

2025-04-19
Guia Prático para Modelos de Linguagem de Grande Porte: Código e Ilustrações Incluídos

O novo livro de Jay Alammar e Maarten Grootendorst, "Hands-On Large Language Models", oferece um guia prático e visualmente rico para entender e usar LLMs. O livro apresenta inúmeras ilustrações e exemplos de código, tornando conceitos complexos acessíveis a um público amplo. Com sua cobertura abrangente e repositório de código facilmente acessível, é um recurso valioso para iniciantes e desenvolvedores experientes.

Leia mais

Dispositivo de memória flash sub-nanossegundo baseado em materiais 2D: Fabricação e modelagem

2025-04-23
Dispositivo de memória flash sub-nanossegundo baseado em materiais 2D: Fabricação e modelagem

Pesquisadores fabricaram um dispositivo de memória flash sub-nanossegundo baseado em materiais bidimensionais (2D) (WSe2, grafeno e hBN). O processo de fabricação envolveu litografia por feixe de elétrons, deposição em camada atômica e esfoliação mecânica. A estrutura e o desempenho do dispositivo foram caracterizados usando microscopia de força atômica, microscopia eletrônica de transmissão e espectroscopia de dispersão de energia. Um modelo quase 2D foi desenvolvido para simular as características elétricas do dispositivo, e sua validade foi verificada experimentalmente. Esta pesquisa fornece novas vias para o desenvolvimento de dispositivos de memória flash de próxima geração de alto desempenho e baixo consumo de energia.

Leia mais

O Impacto da IA no Desenvolvimento de Jogos: A Luta dos Desenvolvedores

2025-04-08
O Impacto da IA no Desenvolvimento de Jogos: A Luta dos Desenvolvedores

O rápido avanço da IA está afetando significativamente a indústria de jogos, deixando muitos desenvolvedores lutando contra desafios e ansiedades. Este artigo apresenta entrevistas com vários profissionais da indústria de jogos, incluindo artistas, designers e programadores, que compartilham suas experiências com a IA no local de trabalho. Algumas empresas estão usando IA para gerar imagens, código e vozes para reduzir custos ou acelerar o desenvolvimento, levando a uma diminuição da qualidade e sentimentos de deslocamento entre os criadores humanos. Muitos desenvolvedores expressam reservas ou oposição direta à IA, argumentando que ela não pode substituir a criatividade e a expressão emocional humanas. Eles defendem a proteção dos direitos dos artistas humanos.

Leia mais
Jogos

Baterias Baratas: Uma Análise por Raio-X Revela Defeitos Chocantes

2025-09-25
Baterias Baratas: Uma Análise por Raio-X Revela Defeitos Chocantes

A Lumafield utilizou escaneamento de TC de raios-X para analisar mais de 1.000 baterias de íons de lítio, revelando defeitos de fabricação perigosos em baterias de baixo custo e falsificadas vendidas em plataformas como Amazon e Temu. Um defeito chamado de 'sobressalência do ânodo negativo' aumenta significativamente o risco de incêndio e curto-circuitos. Enquanto baterias de marcas famosas como Samsung e Panasonic não apresentaram problemas, as baterias de baixo custo tiveram uma taxa de defeito de 8%, com algumas marcas falsificadas ultrapassando 15%. Isso destaca os riscos de priorizar o preço em vez da segurança ao comprar baterias para dispositivos.

Leia mais
Tecnologia escaneamento de TC

Otimização Peephole na VM Ruby: Adicionando opt_respond_to

2024-12-31
Otimização Peephole na VM Ruby: Adicionando opt_respond_to

Esta é a quarta parte de uma série sobre otimização da Máquina Virtual Ruby (VM). O autor aprofunda-se na adição de uma instrução `opt_respond_to` ao CRuby para otimizar chamadas ao método `respond_to?`. O artigo detalha o uso de um depurador para rastrear a execução do código, localizar o otimizador peephole `iseq_peephole_optimize` e, analisando uma otimização de array congelado existente, tenta corresponder ao padrão de chamadas ao método `respond_to?`, preparando o terreno para a adição de uma nova instrução de otimização. O autor usa exemplos de código concisos e etapas de depuração para ilustrar claramente o mecanismo de otimização peephole e como depurar no código-fonte CRuby.

Leia mais
Desenvolvimento Otimização Peephole

Hackeando a Caldeira do Meu Senhorio: Um Ataque de Replay

2025-04-22
Hackeando a Caldeira do Meu Senhorio: Um Ataque de Replay

Frustrado com o sistema de aquecimento ineficiente e desigual do seu apartamento, o autor criou uma solução inteligente usando um ataque de replay. Utilizando SDRs de baixo custo (um RTL-SDR e um clone do HackRF), ele interceptou e replicou os sinais de rádio de 868MHz entre o termostato existente e a caldeira. Isso permitiu que ele controlasse remotamente o estado ligado/desligado da caldeira. Apesar de desafios significativos, ele integrou com sucesso isso ao Home Assistant, criando automações personalizadas e usando sensores para atingir um controle de temperatura confortável.

Leia mais
Hardware

Yahoo quer comprar o Chrome para desafiar o monopólio de busca do Google

2025-04-25
Yahoo quer comprar o Chrome para desafiar o monopólio de busca do Google

No julgamento antitruste do Google, o Yahoo expressou interesse em adquirir o navegador Chrome do Google. O Yahoo considera os navegadores um canal de distribuição crucial para mecanismos de busca, acreditando que possuir o Chrome aumentaria significativamente sua participação de mercado de busca. Embora o Yahoo esteja desenvolvendo seu próprio protótipo de navegador, adquirir o Chrome seria um caminho mais rápido para escalar. O negócio custaria dezenas de bilhões de dólares, mas a empresa controladora do Yahoo, Apollo Global Management, está apoiando a potencial aquisição.

Leia mais
Tecnologia

yt-dlp precisará do Deno para downloads do YouTube

2025-09-24
yt-dlp precisará do Deno para downloads do YouTube

O popular downloader do YouTube, yt-dlp, em breve precisará do runtime JavaScript Deno para funcionar corretamente devido a mudanças no YouTube. Anteriormente, o yt-dlp usava um interpretador JavaScript embutido, mas isso agora é insuficiente para superar as medidas anti-raspagem atualizadas do YouTube. Os usuários precisarão instalar o Deno e tomar medidas adicionais, dependendo de seu método de instalação (por exemplo, usando pip ou executáveis ​​oficiais), para atualizar o yt-dlp e garantir a capacidade contínua de download de vídeos do YouTube.

Leia mais
Desenvolvimento downloads do YouTube

Um SO minúsculo em menos de 1000 linhas de Zig: OS-1000-lines-zig

2025-09-21
Um SO minúsculo em menos de 1000 linhas de Zig: OS-1000-lines-zig

OS-1000-lines-zig é um projeto impressionante que implementa um sistema operacional leve em menos de 1000 linhas de código Zig. Este SO de kernel monolítico suporta gerenciamento básico de processos e memória e possui uma interface de linha de comando simples. Com apenas um compilador Zig, os desenvolvedores podem facilmente clonar, construir e executar o SO. O projeto possui uma estrutura de código limpa com componentes como implementação do kernel, funções comuns e um script de build, e inclui testes e diretrizes de contribuição. Planos de desenvolvimento futuro incluem a expansão do gerenciamento de processos, gerenciamento de memória, interface de linha de comando, rede e sistemas de arquivos.

Leia mais
Desenvolvimento

arXivLabs: Projetos experimentais com colaboradores da comunidade

2025-09-24
arXivLabs: Projetos experimentais com colaboradores da comunidade

arXivLabs é uma estrutura que permite que colaboradores desenvolvam e compartilhem novos recursos do arXiv diretamente em nosso site. Indivíduos e organizações que trabalham com o arXivLabs abraçaram e aceitaram nossos valores de abertura, comunidade, excelência e privacidade de dados do usuário. O arXiv está comprometido com esses valores e trabalha apenas com parceiros que os respeitam. Tem uma ideia para um projeto que agregará valor à comunidade do arXiv? Saiba mais sobre o arXivLabs.

Leia mais
Tecnologia

GlucoDataHandler: Aplicativo de Visualização de Dados de Glicose Multiplataforma

2025-09-21
GlucoDataHandler: Aplicativo de Visualização de Dados de Glicose Multiplataforma

O GlucoDataHandler é um aplicativo Android inovador que coleta dados de glicose de várias fontes e os exibe claramente no seu smartphone Android, smartwatch (Wear OS, Mi Band, Amazfit) e no seu carro (via GlucoDataAuto). Ele suporta vários dispositivos e aplicativos de monitoramento de glicose, incluindo AndroidAPS, Juggluco, xDrip+, Eversense e Dexcom, oferecendo alarmes personalizáveis, widgets e exibição na tela de bloqueio. A integração do Tasker e o encaminhamento de dados também são suportados. O aplicativo recebeu contribuições e apoio de vários membros da comunidade, facilitando o gerenciamento de glicose para pacientes com diabetes.

Leia mais
Diversos

O Teatro dos Pull Requests e da Revisão de Código

2025-09-25

A palestra de Saša Jurić na Goatmire Elixir Conf transformou a revisão de código em uma narrativa cativante. Ele destacou o problema comum de pull requests (PRs) muito grandes e complexos, levando a revisões superficiais, riscos de segurança e bases de código difíceis de manter. A principal conclusão: PRs revisáveis devem idealmente levar de 5 a 10 minutos para serem revisados, idealmente com menos de 300 linhas de código. Isso é alcançado criando mensagens de commit concisas e narrativas que explicam claramente o raciocínio e as etapas de cada alteração. Dividir grandes recursos em PRs menores e usar ferramentas como `git fixup` para manter um histórico de commit limpo são cruciais para uma revisão de código eficiente e código de maior qualidade. A palestra enfatizou que dizer "Eu não entendo" é melhor do que um "LGTM" sem sentido.

Leia mais
Desenvolvimento

Esquema de verificação de idade: um pesadelo de usabilidade?

2025-09-24
Esquema de verificação de idade: um pesadelo de usabilidade?

Uma nova solução de verificação de idade online está causando controvérsia. Sua forte dependência de smartphones exclui muitos usuários sem ou que não querem usar smartphones, como idosos. Isso afeta significativamente a navegação na web, especialmente nos modos privados, exigindo verificação de idade em cada visita ao site. O alto custo de implementação representa um grande obstáculo para startups, e as escolhas de tecnologia parecem limitantes. Os benefícios de privacidade reivindicados pela solução também são questionáveis.

Leia mais
Desenvolvimento

Microsoft estende atualizações de segurança do Windows 10: opções gratuitas e pagas disponíveis

2025-09-25
Microsoft estende atualizações de segurança do Windows 10: opções gratuitas e pagas disponíveis

Diante de críticas e preocupações dos usuários, a Microsoft anunciou novas opções para usuários nos EUA e na Europa estenderem as atualizações de segurança do Windows 10 gratuitamente, poucos dias antes do fim do suporte em 14 de outubro. Os usuários dos EUA podem escolher uma opção gratuita que envolve o backup de perfil por um ano de atualizações, ou pagar US$ 30 ou resgatar 1000 pontos de recompensas da Microsoft. Os usuários europeus podem obter um ano gratuito de atualizações fazendo login com uma conta Microsoft. Isso segue a pressão de grupos de defesa europeus e preocupações generalizadas sobre a atualização para o Windows 11.

Leia mais
Tecnologia

O Desafio Berghain de 2025: Uma Competição de Codificação Viral Que Quebrou a Internet

2025-09-24

A Listen Labs lançou um desafio de codificação viral, o Desafio Berghain, começando com um outdoor enigmático em São Francisco. O desafio incumbiu os participantes de um problema complexo de otimização: selecionar exatamente 1000 pessoas de um fluxo de chegadas aleatórias, cada uma com vários atributos, enquanto atendiam a cotas específicas e minimizavam as rejeições. Este jogo, deceptivamente simples, atraiu mais de 30.000 engenheiros. O autor, começando como um novato em algoritmos, subiu para o número 16 no ranking, detalhando sua jornada iterativa por meio de vários algoritmos, de abordagens gananciosas ingênuas a modelos sofisticados de cópula gaussiana e, finalmente, métodos práticos baseados em limiares. Eles encontraram sobrecarga do servidor e limitação de taxa, mostrando a escalabilidade inesperada do desafio. Ao analisar as soluções de melhor desempenho, o autor destaca as principais lições aprendidas: o simples costuma superar o complexo, o ajuste de parâmetros é crucial, a velocidade de iteração supera a perfeição, o conhecimento de domínio vem de fontes inesperadas e as restrições podem ser recursos. Em última análise, o Desafio Berghain reacendeu a paixão do autor pela programação e oferece insights sobre futuras competições técnicas colaborativas.

Leia mais
Desenvolvimento desafio de algoritmo

Vídeos de um Minuto a Partir de Storyboards de Texto Usando Transformadores com Treinamento em Tempo de Teste

2025-04-08

Modelos Transformer atuais têm dificuldades em gerar vídeos de um minuto devido à ineficiência das camadas de autoatenção para contextos longos. Este artigo explora camadas de Treinamento em Tempo de Teste (TTT), cujos estados ocultos são eles próprios redes neurais, oferecendo maior expressividade. Adicionar camadas TTT a um Transformer pré-treinado permite a geração de vídeos de um minuto a partir de storyboards de texto. Experimentos usando um conjunto de dados de desenhos animados do Tom e Jerry mostram que as camadas TTT melhoram significativamente a coerência do vídeo e a narrativa em comparação com modelos base como Mamba 2 e Gated DeltaNet, alcançando uma vantagem de 34 pontos Elo na avaliação humana. Embora ainda existam artefatos, provavelmente devido às limitações do modelo de 5B parâmetros, este trabalho demonstra uma abordagem promissora escalável para vídeos mais longos e narrativas mais complexas.

Leia mais
1 2 3 4 5 7 9 10 11 595 596