Otimizando um Kernel de Multiplicação de Matrizes em CUDA com Tensor Cores

2025-04-19

Esta publicação detalha a jornada do autor para escrever um kernel de multiplicação de matrizes otimizado em CUDA usando núcleos tensoriais em uma GPU NVIDIA Tesla T4. O objetivo era calcular D = α * A * B + β * C o mais rápido possível. Através da otimização iterativa de seis kernels, o autor alcançou desempenho comparável à implementação cuBLAS hgemm da NVIDIA, destacando técnicas como tiling hierárquico, exploração da hierarquia de memória, reutilização de dados, sobreposição de computação com movimentação de dados e uso eficiente de Tensor Cores. O autor compartilha insights obtidos por meio de profiling e otimização, enfatizando a importância da intensidade aritmética e largura de banda de memória.

Leia mais
Desenvolvimento

Google simplifica a exibição de URLs nos resultados de pesquisa móvel

2025-01-23
Google simplifica a exibição de URLs nos resultados de pesquisa móvel

O Google anunciou uma simplificação na forma como os URLs são exibidos nos resultados de pesquisa móvel. Anteriormente, os resultados de pesquisa móvel incluíam breadcrumbs do site como parte do URL, mas estes eram frequentemente truncados em telas menores. Agora, o Google removerá os breadcrumbs dos resultados de pesquisa móvel, exibindo apenas o domínio para uma experiência mais limpa e amigável ao usuário. Os resultados de pesquisa para desktop permanecem inalterados. Essa alteração não exige nenhuma ação dos desenvolvedores que usam dados estruturados de breadcrumbs; eles continuam sendo suportados para pesquisa em desktop.

Leia mais

Tarifas atingem a indústria de bicicletas: aumento de preços e a luta pela produção local

2025-04-03
Tarifas atingem a indústria de bicicletas: aumento de preços e a luta pela produção local

As novas tarifas impostas pelos EUA estão afetando dramaticamente a indústria de bicicletas. O artigo analisa os efeitos sobre bicicletas e peças de vários países (China, Vietnã, Camboja, Tailândia, Taiwan, Japão, UE, etc.), prevendo aumentos significativos de preços, especialmente para produtos de alta qualidade. Embora os EUA incentivem a produção local, a falta de infraestrutura e experiência especializada representa desafios enormes para a produção doméstica de componentes de bicicletas de alto desempenho. A conclusão observa que os preços das bicicletas aumentarão e a seleção diminuirá, mas os entusiastas do ciclismo continuarão a desfrutar do passeio.

Leia mais

Simulando um cérebro de verme: Um trampolim para a emulação de cérebro completo?

2025-04-01

Simular o cérebro humano tem sido um santo graal da ciência, mas sua complexidade se mostrou assustadora. Os cientistas se voltaram para C. elegans, um nematóide com apenas 302 neurônios. Após 25 anos e inúmeras tentativas malsucedidas, simular seu cérebro finalmente está ao alcance graças aos avanços na microscopia de lâmina de luz, microscopia de super-resolução e aprendizado de máquina. Essas tecnologias permitem a observação em tempo real da atividade neural em cérebros de vermes vivos e usam aprendizado de máquina para inferir os parâmetros biofísicos dos neurônios. Simular com sucesso um cérebro de C. elegans não seria apenas uma conquista científica notável, mas também forneceria experiência e métodos inestimáveis para simular cérebros mais complexos, incluindo, finalmente, cérebros humanos, abrindo caminho para pesquisas futuras em IA e neurociência.

Leia mais
IA

Localizando Fontes de RFI usando Correções de Campo Próximo: Um Estudo para Cosmologia de 21cm na Era da Reionização

2025-02-27

Pesquisadores desenvolveram um novo método para localizar fontes de interferência de radiofrequência (RFI), particularmente aquelas de objetos de campo próximo como aviões, usando correções de campo próximo. Este método combina o phasing de campo distante, correções de campo próximo e formação de feixe para localizar precisamente a posição 3D dos emissores de RFI, maximizando a coerência dos sinais curvos de campo próximo. Isso é mais eficiente do que o método tradicional de sinalização, preservando mais dados utilizáveis e aumentando as chances de detectar o sinal de 21cm durante a Era da Reionização. Os resultados demonstram uma estimativa eficaz da altitude dos emissores de RFI, revelando diferenças de desempenho em diferentes condições observacionais, lançando as bases para uma remoção mais precisa de RFI no futuro.

Leia mais

A Incômoda Verdade Sobre o Déficit Comercial Americano

2025-05-04
A Incômoda Verdade Sobre o Déficit Comercial Americano

Este artigo mergulha na complexa relação entre o persistente déficit comercial americano e o status do dólar como a moeda de reserva mundial. O autor argumenta que a posição privilegiada do dólar leva à sua supervalorização, prejudicando a competitividade da indústria americana e alimentando o populismo político interno. A peça disseca a mecânica da demanda global por dólares, o ciclo de dívida resultante e os riscos financeiros inerentes. Várias estratégias governamentais para lidar com o déficit são analisadas e questionadas por sua incapacidade de enfrentar a causa raiz. As implicações para os investimentos são exploradas, sugerindo um foco em títulos do Tesouro de curto prazo, ativos protegidos contra a inflação e ações internacionais para navegar pela volatilidade econômica potencial.

Leia mais

Corrigindo a Prova de Bird para o Crivo de Eratóstenes: Uma Prova sobre Listas Infinitas

2025-02-08

Este artigo corrige uma prova errônea de Richard Bird em seu livro *Thinking Functionally with Haskell* sobre o Crivo de Eratóstenes. Bird apresenta uma implementação circular baseada em listas, mas sua dica de prova é falha. Os autores fornecem uma prova de correção completa introduzindo novos lemas e recorrendo a um enfraquecimento do Postulado de Bertrand. A conexão entre este algoritmo e a visão de David Turner de "Programação Funcional Total" também é explorada.

Leia mais

Desvendando a Motivação Intrínseca: O Segredo para a Aprendizagem Sem Esforço

2025-04-29
Desvendando a Motivação Intrínseca: O Segredo para a Aprendizagem Sem Esforço

O autor relata uma mudança dramática em sua experiência de aprendizagem, de uma completa falta de motivação para um foco intenso. Ele atribui essa transformação à 'motivação intrínseca', o impulso que vem do prazer inerente a uma atividade. A peça mergulha na Teoria da Autodeterminação (TAD), explicando como autonomia, competência e relacionamento impactam a motivação intrínseca. A pesquisa revela que as recompensas podem às vezes ser contraproducentes, enquanto a autonomia e o feedback positivo a impulsionam. O autor conecta experiências pessoais com pesquisas, ilustrando como cultivar a motivação intrínseca e explorando o relacionamento complexo entre competição e motivação intrínseca.

Leia mais

A Vida agitada de uma mãe: Costura, Confeitaria e Criação de três filhos

2025-08-01

Uma mãe do estado de Washington compartilha sua rotina agitada: equilibrando três empregos, três filhos e tarefas domésticas, enquanto também mantém a forma física, lendo 'O Jogo de Ender', costurando o guarda-roupa de inverno de seus filhos e tentando reduzir a ingestão de cafeína. Recentemente, ela levou seus filhos para assistir a um show de luzes a laser na Barragem de Coulee e compartilha sua receita favorita de confeitaria – mingau assado que seus filhos devoram no café da manhã. Apesar de tudo isso, ela ainda luta contra enxaquecas.

Leia mais
Diversos

O Mistério do Sublinhado em `target='_blank'`

2025-02-24

Já se perguntou por que `target='_blank'` precisa daquele sublinhado? Antes do HTML5, desenvolvedores usavam `` para criar funcionalidades parecidas com SPA, dividindo a janela em frames com IDs únicos. O atributo `target` especificava em qual frame carregar um link. `_blank` não era um nome de frame; instruía o navegador a abrir uma nova janela (abridoras não eram comuns na época). O sublinhado denotava um valor especial, não um frame. Embora `` esteja depreciado, a convenção `_blank` permanece.

Leia mais
Desenvolvimento

Administração Trump restringirá exportações de chips de IA para Malásia e Tailândia

2025-07-05
Administração Trump restringirá exportações de chips de IA para Malásia e Tailândia

A administração Trump planeja restringir o envio de chips de IA de empresas como a Nvidia para a Malásia e a Tailândia, com o objetivo de conter o suspeito contrabando de semicondutores para a China. Essa medida visa impedir que a China obtenha processadores avançados de IA, já proibidos pelos EUA, por meio de intermediários nesses dois países do Sudeste Asiático. Embora a regra ainda não esteja finalizada, ela marca a primeira etapa formal na revisão prometida por Trump da abordagem de difusão de IA de seu antecessor. Embora afete algumas empresas, a regulamentação inclui medidas de mitigação, como permitir que algumas empresas continuem enviando mercadorias por meses sem licenças após a publicação.

Leia mais

Kubernetes 10 anos depois: Reflexões e uma visão para o futuro

2025-06-19

Este artigo reflete sobre a jornada de dez anos do Kubernetes, desde suas origens como o sistema Borg interno do Google até seu status atual como uma pedra angular da era nativa da nuvem. O autor elogia seus sucessos em orquestração de contêineres, gerenciamento de infraestrutura e agendamento de trabalhos, mas também destaca deficiências: as limitações do YAML, a dependência do etcd e as deficiências do gerenciador de pacotes Helm. Propostas para o Kubernetes 2.0 incluem substituir o YAML pelo HCL, suportar backends alternativos ao etcd e criar um gerenciador de pacotes nativo para melhor usabilidade e segurança. Outras sugestões envolvem definir o IPv6 como padrão e o IPSec integrado para simplificar a topologia de rede.

Leia mais

arXivLabs: Projetos experimentais com colaboradores da comunidade

2025-02-24
arXivLabs: Projetos experimentais com colaboradores da comunidade

arXivLabs é uma estrutura que permite que colaboradores desenvolvam e compartilhem novos recursos do arXiv diretamente em nosso site. Indivíduos e organizações que trabalham com o arXivLabs abraçaram e aceitaram nossos valores de abertura, comunidade, excelência e privacidade de dados do usuário. O arXiv está comprometido com esses valores e trabalha apenas com parceiros que os respeitam. Tem uma ideia para um projeto que agregará valor à comunidade do arXiv? Saiba mais sobre o arXivLabs.

Leia mais
Desenvolvimento

Atualização Principal do GitHub Issues: Subtarefas, Tipos de Issues e Pesquisa Avançada

2025-01-19
Atualização Principal do GitHub Issues: Subtarefas, Tipos de Issues e Pesquisa Avançada

O GitHub lançou uma atualização importante para Issues, incluindo subtarefas, tipos de issues e pesquisa avançada. Subtarefas permitem dividir problemas em unidades menores para melhor acompanhamento do progresso. Tipos de issues ajudam as equipes a classificar e gerenciar issues com uma linguagem consistente. A pesquisa avançada permite filtragem mais complexa para encontrar issues específicas. A IU do Issues também foi atualizada para melhor eficiência e usabilidade. Além disso, o CodeQL Action v2 foi oficialmente descontinuado, exigindo que os usuários atualizem para a versão v3. Os padrões padrão de varredura de segredos agora oferecem suporte a mais tipos de segredos, aumentando a segurança.

Leia mais
Desenvolvimento Atualização

Aceleração 10x: Mudando de pip para uv em aplicativos Flask/Django em contêineres Docker

2025-06-24
Aceleração 10x: Mudando de pip para uv em aplicativos Flask/Django em contêineres Docker

Este artigo descreve uma melhoria significativa de desempenho (até 10x) obtida ao mudar de pip para uv para gerenciamento de dependências em aplicativos Flask e Django em contêineres Docker. O autor explica como substituir requirements.txt por pyproject.toml, modificar o Dockerfile para usar uv e usar comandos uv para um gerenciamento eficiente de dependências. O processo evita ambientes virtuais e executa como um usuário não root, contribuindo para tempos de construção mais rápidos e maior eficiência. Um tutorial em vídeo e um projeto de exemplo também são fornecidos.

Leia mais
Desenvolvimento

Treinamento de Tom Perfeito: Desafios e Descobertas de um Estudo Online

2025-02-13
Treinamento de Tom Perfeito: Desafios e Descobertas de um Estudo Online

Um estudo online que visava melhorar a habilidade de tom perfeito (AP) recrutou falantes de cantonês e não cantonês com formação musical. Devido à desistência de participantes e ao progresso de treinamento mais lento que o esperado durante a pandemia, o estudo desviou-se de seu pré-registro, incluindo finalmente apenas 12 participantes nas análises. Os resultados mostraram melhora significativa na capacidade de AP mesmo com tempo de treinamento reduzido, e essa melhora generalizou-se para o timbre não treinado. O estudo também comparou o progresso de aprendizagem entre os participantes que completaram e não completaram o treinamento, mostrando impacto mínimo da exclusão de alguns participantes nos resultados finais.

Leia mais

cregit: Visualizando Contribuições ao Kernel do Linux

2025-03-27

O projeto cregit visualiza as contribuições ao kernel do Linux colorindo os arquivos de código-fonte para identificar os contribuidores individuais. Ao passar o mouse sobre os trechos de código, são exibidos detalhes do commit, e um clique abre o commit correspondente no GitHub. Embora baseado no git blame e usando srcML para análise, ele possui limitações, como expansão de macros e compilação C verdadeira. O cregit é um esforço colaborativo de pesquisadores da Polytechnique Montreal, da Linux Foundation e da University of Victoria.

Leia mais

CockroachDB 25.2: Segurança em Nível de Linha para Controle Aprimorado de Dados

2025-07-10
CockroachDB 25.2: Segurança em Nível de Linha para Controle Aprimorado de Dados

O lançamento do CockroachDB 25.2 apresenta a Segurança em Nível de Linha (RLS), um recurso poderoso que permite controle de acesso granular em nível de linha diretamente no banco de dados. Isso aborda as limitações das permissões tradicionais em nível de tabela, especialmente importantes para implantações multilocatárias e multi-regionais. O artigo detalha a implementação do RLS por meio de casos de uso multilocatário e multi-regional, mostrando seus benefícios no isolamento de dados, conformidade regulatória e lógica de aplicativo simplificada. A combinação do RLS com a funcionalidade Regional By Row (RBR) do CockroachDB fornece controle de acesso baseado em localização geográfica, garantindo a conformidade com as leis de residência de dados.

Leia mais

O Futuro da Programação na Era da IA

2025-03-28
O Futuro da Programação na Era da IA

Um tweet do CEO da Replit sugerindo que aprender a programar não é mais necessário gerou um debate. O autor, um engenheiro de software com 15 anos de experiência, reflete sobre as implicações das ferramentas de codificação baseadas em IA. Embora reconhecendo os ganhos de eficiência da IA, ele alerta contra a dependência excessiva, argumentando que isso diminui a compreensão e deixa os programadores vulneráveis aos fornecedores. Ele aconselha os iniciantes a construir uma base sólida nos fundamentos da programação para se manterem competitivos. A IA aumenta a produtividade, mas não pode substituir habilidades sólidas de programação.

Leia mais
Desenvolvimento

arXivLabs: Projetos Experimentais com Colaboradores da Comunidade

2025-04-03
arXivLabs: Projetos Experimentais com Colaboradores da Comunidade

arXivLabs é uma estrutura que permite a colaboradores desenvolverem e compartilharem novos recursos do arXiv diretamente em nosso site. Indivíduos e organizações que trabalham com o arXivLabs abraçaram e aceitaram nossos valores de abertura, comunidade, excelência e privacidade dos dados do usuário. O arXiv está comprometido com esses valores e trabalha apenas com parceiros que os respeitam. Tem uma ideia para um projeto que agregará valor à comunidade do arXiv? Saiba mais sobre o arXivLabs.

Leia mais
Desenvolvimento

AniSora: Modelo de Geração de Vídeo de Anime de IA de código aberto da Bilibili

2025-05-18
AniSora: Modelo de Geração de Vídeo de Anime de IA de código aberto da Bilibili

A Bilibili lançou o AniSora, um poderoso modelo de IA de código aberto para gerar vídeos no estilo anime. Com um clique, os usuários podem criar vídeos em vários estilos, incluindo episódios de séries, animações chinesas, adaptações de mangá, conteúdo de VTuber e muito mais. Baseado em pesquisa aceita no IJCAI'25, o AniSora se destaca por seu foco em estética de anime e mangá, fornecendo animação de alta qualidade com uma interface intuitiva acessível a todos os criadores.

Leia mais

Descanso: De Oblomov ao Mundo Moderno

2025-03-26
Descanso: De Oblomov ao Mundo Moderno

Este ensaio explora o significado de 'descanso', desde a representação extrema no romance russo *Oblomov* até suas diversas interpretações em religião, filosofia e sociedade moderna. Através de anedotas pessoais e observações da história e da cultura, o autor argumenta que o descanso não é simplesmente ociosidade, mas crucial para a restauração física e mental, o pensamento criativo e a manutenção do equilíbrio da vida. A peça é intercalada com numerosas anedotas de figuras notáveis, concluindo que, embora o equilíbrio perfeito possa ser inatingível, a exploração contínua do descanso e do trabalho é a essência da vida.

Leia mais

Rails 8: Surpreendentemente Ótimo para Projetos Individuais

2025-01-01

Após construir e implantar um novo aplicativo Rails 8, ficou claro: o Rails é incrível, especialmente para projetos pequenos com um único desenvolvedor. O novo guia de Introdução é excelente, guiando você do zero a um aplicativo pronto para produção com autenticação, cache, texto enriquecido, CI e um banco de dados – tudo sem muita dificuldade. O Rails 8 simplifica a configuração do banco de dados, tornando o SQLite pronto para produção. A configuração de CI integrada e os minutos gratuitos do Github Actions tornam a integração contínua muito fácil. Um novo gerador de autenticação fácil de usar e uma implantação simplificada aprimoram ainda mais a experiência. O Rails 8 torna o desenvolvimento eficiente e acessível, mesmo para desenvolvedores solo.

Leia mais
Desenvolvimento

O Magnetismo Perdido da Lua: Resolvido por um Impacto Antigo?

2025-05-29
O Magnetismo Perdido da Lua: Resolvido por um Impacto Antigo?

Rochas na superfície da Lua mostram sinais de um campo magnético forte, mas a Lua em si não possui um campo magnético inerente – um enigma de décadas. Cientistas do MIT propõem uma nova teoria: um grande impacto gerou uma nuvem de plasma, amplificando temporariamente o fraco campo magnético intrínseco da Lua, particularmente no lado oculto. A onda de choque do impacto 'agitou' ainda mais os elétrons nas rochas, fazendo com que registrassem este breve campo magnético alto. Isso explica as rochas altamente magnetizadas no lado oculto e prevê a possibilidade de encontrar evidências de choque e alto magnetismo perto do polo sul lunar, uma hipótese testável para missões futuras.

Leia mais

Racket School 2019: Projetando Suas Próprias Linguagens

2024-12-26

A trilha "Como Projetar Linguagens" da Racket School 2019 ofereceu um mergulho profundo na programação orientada a linguagem e na construção de linguagens usando Racket. O currículo abordou conceitos essenciais como expansão de macros, módulos e verificação de tipos, reforçados por laboratórios práticos. Os participantes construíram macros simples e linguagens tipadas, obtendo uma compreensão prática dos princípios de design de linguagem. As palestras e os laboratórios proporcionaram uma experiência de aprendizagem equilibrada, culminando na capacidade de projetar e construir linguagens personalizadas.

Leia mais

Porta-aviões versus Internet: Conectividade Aprimorada, Poder de Combate Multiplicado

2025-02-02
Porta-aviões versus Internet: Conectividade Aprimorada, Poder de Combate Multiplicado

Durante sua implantação no Mar Vermelho, o USS Abraham Lincoln (CVN-72) utilizou redes de satélites comerciais como Starlink e OneWeb para alcançar uma conectividade sem precedentes a bordo. Isso impulsionou significativamente as capacidades dos caças F-35, permitindo atualizações rápidas de dados de inteligência e melhorias de design, aumentando a sobrevivência e a letalidade. Além do combate, melhorou a qualidade de vida dos marinheiros, a eficiência do treinamento, a velocidade de manutenção e aumentou o moral. A iniciativa, Sailor Edge Afloat and Ashore (SEA2), agora é um programa da Marinha financiado, chamado Flank Speed Wireless, com o objetivo de fornecer conectividade global de alta velocidade e confiável para toda a frota.

Leia mais
Tecnologia Marinha

PropRise procura Engenheiro Fundador: Construa uma plataforma de dados de imóveis com milhões de registros

2025-02-23
PropRise procura Engenheiro Fundador: Construa uma plataforma de dados de imóveis com milhões de registros

A PropRise está procurando um engenheiro full-stack experiente como seu Engenheiro Fundador para possuir e construir os sistemas que alimentam sua plataforma de rápido crescimento. Isso envolve a construção de sistemas robustos de dados de back-end e interfaces front-end envolventes para milhões de registros de imóveis. Os candidatos devem ter experiência em full-stack, experiência em construir sistemas escaláveis ​​e intensivos em dados e uma capacidade comprovada de iterar e implantar rapidamente. A pilha de tecnologia inclui Typescript, Next.js, React, Postgres e GCP. Esta é uma função desafiadora e gratificante ideal para engenheiros que prosperam em ambientes de ritmo acelerado, gostam de enfrentar desafios complexos e são apaixonados pela interseção de IA e qualidade de dados.

Leia mais

Pare de ensinar finanças para crianças com PowerPoint!

2025-02-22
Pare de ensinar finanças para crianças com PowerPoint!

Este ensaio critica a abordagem do sistema educacional americano ao letramento financeiro, argumentando que simplesmente dar aulas aos alunos sobre conceitos financeiros é ineficaz. O autor argumenta que desafios do mundo real, como controle de impulsos e pressão de pares, são ignorados. Em vez de fórmulas complexas, o ensaio defende a experiência prática, como iniciar pequenas empresas, para ensinar lições financeiras valiosas. Somente combinando teoria com experiência prática, o verdadeiro letramento financeiro pode ser alcançado.

Leia mais

Zod v4 Beta: Validação de Tipos Mais Rápida, Menor e Mais Eficiente

2025-04-12
Zod v4 Beta: Validação de Tipos Mais Rápida, Menor e Mais Eficiente

Após mais de um ano de desenvolvimento ativo, o Zod v4 agora está em beta! Ele é mais rápido, menor, mais eficiente para o tsc e implementa alguns recursos há muito solicitados. O Zod 4 usa uma arquitetura interna totalmente nova que resolve algumas limitações de design de longa data, estabelece as bases para alguns recursos há muito solicitados e fecha 9 das 10 questões abertas mais votadas do Zod. Uma nova biblioteca irmã, @zod/mini, oferece uma API funcional e abalável por árvores para tamanhos de pacote significativamente menores. O Zod 4 também introduz um novo sistema de metadados, conversão de JSON Schema, suporte aprimorado para uniões discriminadas e muitas outras melhorias.

Leia mais
Desenvolvimento Validação de Tipos

A ideia maluca de Zuckerberg: redefinir as amizades no Facebook

2025-04-15
A ideia maluca de Zuckerberg: redefinir as amizades no Facebook

O CEO da Meta, Mark Zuckerberg, propôs um plano "maluco" em 2022 para redefinir todas as conexões de amigos dos usuários do Facebook. Este plano foi revelado durante um julgamento antitruste. Temendo a diminuição da relevância cultural do Facebook, Zuckerberg sugeriu apagar todas as listas de amigos dos usuários, forçando-os a reconstruir suas redes. Isso gerou debates internos e, finalmente, não foi implementado. O incidente destaca a evolução do Facebook para uma plataforma mais ampla de descoberta de conteúdo e entretenimento, e o processo antitruste contra a Meta, alegando que ela manteve seu monopólio ao adquirir o Instagram e o WhatsApp.

Leia mais
Tecnologia
1 2 368 369 370 372 374 375 376 595 596