Aventura na Implementação do Flash Attention em CUDA C++

2025-08-23

Esta postagem detalha a jornada do autor na implementação e otimização do Flash Attention em CUDA C++. Começando com uma implementação básica, o autor refina progressivamente o kernel usando técnicas como troca de memória compartilhada, pipeline de duas etapas e uso mais eficiente do ldmatrix. Por meio de perfilagem e otimização iterativas, a implementação final atinge um desempenho próximo ao limite teórico do hardware. A postagem também se aprofunda nas complexidades da implementação do softmax online e na resolução de conflitos de banco de memória compartilhada, fornecendo insights valiosos para desenvolvedores CUDA C++.

Leia mais
Desenvolvimento

Regulamentos de transporte reduziram raios em estreito movimentado de Singapura

2025-08-23
Regulamentos de transporte reduziram raios em estreito movimentado de Singapura

Um novo estudo revela que as regulamentações da Organização Marítima Internacional de 2020, que reduziram as emissões de enxofre dos navios, levaram a uma redução de quase 50% nos raios sobre a rota de navegação mais movimentada perto de Singapura. Os pesquisadores acreditam que as emissões dos navios influenciam a formação e as colisões de cristais de gelo nas nuvens, afetando a geração de raios. Este experimento não planejado destaca o impacto significativo, subestimado anteriormente, da atividade humana em tempestades e oferece insights cruciais sobre os efeitos das emissões humanas nas mudanças climáticas.

Leia mais
Tecnologia emissões de navios

Cloudflare Lança o Primeiro CDN MoQ: O Fim do WebRTC?

2025-08-23

A Cloudflare lançou oficialmente seu CDN Media over QUIC (MoQ), uma prévia técnica de um novo padrão que visa substituir o WebRTC, HLS/DASH e RTMP/SRT para streaming de mídia em tempo real. Os desenvolvedores podem testá-lo usando o ponto de extremidade público da Cloudflare e várias bibliotecas de clientes, até mesmo construindo transmissões ao vivo rapidamente com as APIs de Componentes Web fornecidas. Embora atualmente limitado em recursos (por exemplo, sem autenticação e suporte ao Safari), isso marca um passo significativo para o MoQ, sugerindo uma revolução na entrega de mídia em tempo real.

Leia mais

Desenvolvedores de jogos japoneses contornam taxas da Apple e do Google com sistemas de pagamento externos

2025-08-23
Desenvolvedores de jogos japoneses contornam taxas da Apple e do Google com sistemas de pagamento externos

Quase 70% dos populares jogos para smartphones japoneses adotaram sistemas de pagamento externos para evitar altas comissões da Apple e do Google. Essa medida antecede uma nova lei japonesa que exige que as gigantes de tecnologia abram seus sistemas de pagamento, atualmente usados por quase todos os usuários. A mudança para sites externos reduz as comissões de até 30% para cerca de 5%, aumentando a lucratividade dos desenvolvedores de jogos e potencialmente oferecendo descontos aos jogadores. Isso afeta um mercado estimado em mais de 1 trilhão de ienes (US$ 6,8 bilhões).

Leia mais

De macOS para Arch Linux: A Jornada de um Desenvolvedor

2025-08-23
De macOS para Arch Linux: A Jornada de um Desenvolvedor

Um desenvolvedor trocou seu MacBook Pro M1 Max de cinco anos por um laptop Lenovo ThinkBook 14 G7 AMD econômico rodando Arch Linux (Omarchy). Após um mês, ele descobriu que o Linux, embora sem alguns recursos polidos do macOS (como ferramentas de captura de tela e backups), oferece personalização sem precedentes. Criando atalhos personalizados e configurando várias ferramentas, ele alcançou um fluxo de trabalho comparável, ou até superior, à sua experiência no macOS. Ele abraçou a liberdade de adaptar seu SO, aceitando alegremente os compromissos na duração da bateria e na refrigeração. Essa transição destacou a alegria de um sistema altamente personalizável.

Leia mais
Desenvolvimento

Três dicas para superar problemas difíceis no desenvolvimento de software

2025-08-23
Três dicas para superar problemas difíceis no desenvolvimento de software

Superar problemas difíceis no desenvolvimento de software não é fácil. Este artigo sugere três dicas práticas: Primeiro, ouça ativamente as dificuldades de seus colegas de equipe e pergunte diretamente: "Por que isso é difícil?" Segundo, incentive a exploração profunda de soluções aparentemente impossíveis, investigando sua viabilidade em circunstâncias específicas. Mesmo que não seja adotado, esse processo gera novas ideias. Finalmente, projete várias soluções; mesmo que pareça demorado, uma compreensão mais profunda do problema fornece mais alavancagem para a implementação final. Em última análise, a compreensão coletiva é muito mais importante do que o próprio código.

Leia mais
Desenvolvimento

Uma pilha de blocos infinitamente alta? Impossível!

2025-08-20

Este artigo explora um problema de física contra-intuitivo: a estabilidade de uma pilha de blocos que se estende infinitamente. Ao analisar o torque e o centro de massa, o autor demonstra que pilhas de blocos de altura finita podem permanecer estáveis mesmo quando seus topos se estendem muito além da borda de uma mesa — um resultado que desafia a intuição. No entanto, ao tentar extrapolar isso para uma pilha infinitamente alta, o autor descobre que, independentemente do procedimento limitante usado, o resultado final é ou nenhuma pilha ou uma pilha que não se inclina. Isso revela as sutilezas das operações limitantes ao lidar com o infinito e as limitações da intuição.

Leia mais
Tecnologia mecânica limites

Arch Linux sofre ataque DDoS de uma semana

2025-08-24
Arch Linux sofre ataque DDoS de uma semana

A popular distribuição Arch Linux está sob um ataque distribuído de negação de serviço (DDoS) que dura uma semana, atingindo seu site principal, AUR e fóruns. O motivo do atacante é desconhecido. A equipe Arch está trabalhando ativamente com seu provedor de hospedagem para mitigar o ataque e avaliando opções de proteção DDoS. Embora o Arch seja conhecido por sua dificuldade técnica, o ataque causa inconveniência à comunidade. Os usuários podem obter pacotes por meio do pacote pacman-mirrorlist ou do GitHub para contornar interrupções de serviço.

Leia mais
Tecnologia

O Brinco Sussurrante: Um Paradoxo de Felicidade e Livre-arbítrio

2025-08-07

Os antigos cofres do tesouro de Til Iosophrang guardam um brinco mágico que fornece ao seu usuário conselhos ótimos, garantindo a máxima felicidade. No entanto, a um custo: ele gradualmente assume o controle da mente do usuário, fazendo com que seu neocórtex atrofie, tornando-o, por fim, um indivíduo agindo puramente por instinto. Finalmente, um homem chamado Kadmi Rachumion descobre o segredo do brinco e o tranca em segurança nos cofres, um aviso de que a linha entre liberdade e felicidade às vezes é mais sutil do que se imagina.

Leia mais

Google TV exige suporte de 64 bits para aplicativos

2025-08-23
Google TV exige suporte de 64 bits para aplicativos

O Google anunciou que, a partir de 1º de agosto de 2026, todos os aplicativos nas plataformas Google TV e Android TV deverão oferecer suporte à arquitetura de 64 bits e serem compatíveis com tamanhos de página de memória de 16 KB. Isso significa que os desenvolvedores precisam atualizar seus aplicativos para incluir código nativo arm64; caso contrário, os aplicativos não serão aceitos na Google Play. A mudança visa melhorar o desempenho, reduzir os tempos de inicialização e preparar o terreno para o hardware futuro. O Google recomenda que os desenvolvedores comecem a verificar e atualizar seus códigos de aplicativos agora para garantir a conformidade.

Leia mais
Tecnologia

Uma Aventura de Montagem de PC nos Anos 90: A Primeira Memória

2025-08-23
Uma Aventura de Montagem de PC nos Anos 90: A Primeira Memória

Construir um PC nos anos 90 era uma aventura. Em 1996, o autor ajudou um amigo a construir um computador, obtendo peças em lojas de computadores usados, anúncios de revistas e lojas locais. Encontrar peças compatíveis era um desafio, com recursos online limitados e a necessidade de compras presenciais. O processo envolveu várias viagens a diferentes lojas, incluindo uma corrida de última hora por um adaptador de teclado. O PC finalizado funcionou, destacando os desafios e aspectos únicos da construção de PCs nos anos 90, um contraste marcante com a facilidade de montagem de hoje.

Leia mais

Servidor Ubiquiti UniFi OS em Acesso Antecipado: Hospede sua Rede UniFi

2025-08-01
Servidor Ubiquiti UniFi OS em Acesso Antecipado: Hospede sua Rede UniFi

A Ubiquiti lançou o UniFi OS Server em acesso antecipado, permitindo que os usuários hospedem a pilha completa de rede UniFi em seu próprio hardware. Inicialmente, ele suportará UniFi Network e InnerSpace, com suporte potencial futuro para UniFi Protect. A instalação é simples, com suporte para Windows e Linux (embora com requisitos específicos). Os usuários podem gerenciar o servidor remotamente por meio de sua conta Ubiquiti ou localmente, embora a administração local perca o acesso remoto, MFA, notificações e backups na nuvem.

Leia mais
Hardware

Jogo de Tabuleiro Online sem JavaScript: Um Estudo de Caso em Aprimoramento Progressivo

2025-08-23

Este artigo descreve como um site de jogo de tabuleiro online alcançou funcionalidade JavaScript totalmente opcional usando renderização do lado do servidor, elementos HTML padrão e parâmetros de URL. O autor substituiu atualizações em tempo real por atualização automática de página e usou elementos HTML nativos para menus suspensos e modais. Embora tenha aumentado a carga do servidor e a complexidade do código, essa abordagem melhorou a velocidade de carregamento inicial da página e a robustez do site, gerando benefícios inesperados, como HTML mais semanticamente correto. No entanto, o autor conclui que o esforço extra não vale a pena, a menos que o público-alvo seja muito avesso a JavaScript, e pretende remover o código extra eventualmente.

Leia mais

Dica de Gerenciamento: Agora, Juntos

2025-08-23
Dica de Gerenciamento: Agora, Juntos

Este artigo apresenta uma técnica de gerenciamento de equipe altamente eficaz chamada "Agora, Juntos". Quando uma tarefa de um engenheiro está atrasada, os gerentes podem usar o tempo de reunião individual para concluir a tarefa em conjunto com o engenheiro. Isso não apenas resolve problemas rapidamente, mas também descobre possíveis obstáculos, como falta de motivação, excesso de trabalho ou bloqueadores não detectados. Isso permite que os gerentes apoiem melhor os membros da equipe e melhorem a eficiência da equipe. O uso excessivo dessa técnica pode sinalizar problemas de gerenciamento maiores que requerem atenção adicional.

Leia mais
Desenvolvimento

Seu escritório aberto está lhe dando TDAH de segunda mão

2025-08-16
Seu escritório aberto está lhe dando TDAH de segunda mão

Um desenvolvedor rastreou seus padrões de codificação por um mês e descobriu que é três vezes mais criativo em casa do que no escritório. Interrupções constantes no escritório aberto levaram a um tempo significativo de 'exploração' (relendo o código) em vez de codificação focada. Isso não se trata apenas de produtividade; o ambiente altera fundamentalmente seu estilo de trabalho. Pesquisas mostram que leva 23 minutos para se reconcentrar após uma interrupção, impossível em um escritório movimentado. Ele usou dados para convencer seu gerente a deixá-lo trabalhar em casa em tarefas complexas, reservando tempo no escritório para colaboração. O artigo destaca como os ambientes de escritório impactam a produtividade individual e o poder da otimização baseada em dados.

Leia mais
Desenvolvimento escritório aberto

ManimGL: O motor por trás das animações matemáticas do 3Blue1Brown

2025-08-23
ManimGL: O motor por trás das animações matemáticas do 3Blue1Brown

ManimGL é um poderoso motor para criar animações programáticas precisas, usado principalmente para vídeos de matemática explicativos. Originado como um projeto pessoal do criador do 3Blue1Brown, agora existe em duas versões: a original e uma edição mais estável, dirigida pela comunidade. Este guia se concentra na instalação e no uso do ManimGL, descrevendo os requisitos do sistema (Python 3.7+, FFmpeg, OpenGL, LaTeX opcional), comandos de instalação (`pip install manimgl`), sinalizadores úteis de linha de comando (-w, -o, -s, -so, -n, -f) e configuração personalizada (custom_config.yml). Recursos como documentação em chinês e informações de contribuição da comunidade também são fornecidos.

Leia mais

Scooters elétricas da Bo: Um modelo prático e um para quebrar recordes

2025-08-22
Scooters elétricas da Bo: Um modelo prático e um para quebrar recordes

A empresa britânica Bo está causando impacto com dois modelos de scooters elétricas: a Model-M prática (velocidade máxima de 22 mph, alcance de 40 milhas, US$ 2.500) e a Turbo de alto desempenho, com objetivo de atingir velocidades de três dígitos em Bonneville. Fundada por ex-engenheiros da F1, a Bo visa elevar as scooters elétricas além do transporte descartável. A Turbo possui uma configuração de motor duplo de 24.000 watts e tecnologia de estabilização Safesteer, mas custa US$ 30.000. O artigo explora a ambição da Bo, o mercado de scooters elétricas de alta qualidade e a compara com concorrentes como a RM-X da Rage Mechanics.

Leia mais
Tecnologia scooter elétrica

Anti-cheat para jogos Linux: Por que é tão difícil?

2025-08-23
Anti-cheat para jogos Linux: Por que é tão difícil?

A pesquisa de hardware do Steam mostra um aumento lento, mas constante, no número de jogadores que escolhem o Linux como sistema operacional principal para jogos, mas muitos títulos populares multiplayer (como Valorant e League of Legends) permanecem impossíveis de jogar devido a limitações de anti-cheat. Este artigo analisa como funcionam as soluções modernas de anti-cheat, particularmente como os drivers de modo kernel impedem que os processos acessem a memória do jogo. O autor explica por que essa abordagem é ineficaz no sistema aberto do Linux e sugere alternativas para mitigar a trapaça no Linux, como código de rede aprimorado e ofuscação de código. Embora os jogadores do Linux esperem ver suporte mais amplo para jogos, os desafios técnicos tornam isso improvável no futuro próximo.

Leia mais
Jogos

Banco de dados Readyset: Otimizando o desempenho de consultas de caminho frio com ICP

2025-08-23
Banco de dados Readyset: Otimizando o desempenho de consultas de caminho frio com ICP

O banco de dados Readyset alcançou um avanço significativo no desempenho de consultas em caso de falta de cache (caminho frio), especialmente para junções com predicados que filtram ambos os lados da junção. O algoritmo de junção hash anterior se mostrou ineficiente devido à leitura extensiva de dados irrelevantes. Ao introduzir o Index Condition Pushdown (ICP), o Readyset combina os resultados dos predicados do lado esquerdo com os predicados do lado direito, permitindo a recuperação precisa de dados no nível do mecanismo de armazenamento, evitando varreduras completas da tabela. Os benchmarks mostram uma melhoria de throughput >450x e uma redução de latência >450x, resolvendo efetivamente o gargalo de desempenho das consultas de caminho frio.

Leia mais
Desenvolvimento consultas de junção

C-Tubes: Revolucionando o design 3D com materiais planos

2025-08-22
C-Tubes: Revolucionando o design 3D com materiais planos

Pesquisadores do Laboratório de Computação Geométrica da EPFL desenvolveram os C-Tubes, um método inovador para criar estruturas curvas fortes e leves a partir de tiras planas de material. Seu algoritmo curva e conecta precisamente essas tiras, evitando estiramento ou rugas, resultando em tubos surpreendentemente rígidos e duráveis. Essa abordagem sustentável minimiza o desperdício e abre possibilidades em móveis, iluminação, arquitetura e muito mais. Os C-Tubes prometem revolucionar o design e a construção, oferecendo uma abordagem mais eficiente e ecológica para a criação de objetos 3D.

Leia mais
Design

O Aplicativo de Foco Mais Difícil: Sem Misericórdia, Sem Desculpas

2025-08-23
O Aplicativo de Foco Mais Difícil: Sem Misericórdia, Sem Desculpas

Esqueça aplicativos de foco fofinhos; este é brutal. Não há botão de início – a única maneira de usá-lo é guardar o telefone. Pegue-o, e uma sirene ensurdecedora soará, apagando todo o progresso. É um aplicativo pago, sem recursos gratuitos, e os desenvolvedores argumentam que, se você não pode pagar, você não é o público-alvo deles. Este aplicativo foi projetado para ser o mais difícil e eficaz, um sistema de defesa contra a economia de captura de atenção, forçando a disciplina por meio de penalidades severas por distração.

Leia mais
Desenvolvimento disciplina aplicativo pago

Calendário Celeste premiado do Planetário Abrams: Seu guia para o Cosmos

2025-08-18

O Calendário Celeste do Planetário Abrams é um guia mensal para observação do céu para todas as idades. O calendário de cada mês apresenta diagramas que rastreiam a lua, os planetas e as estrelas brilhantes. O verso fornece um mapa estelar simplificado para visualização no meio da noite em todo o território continental dos EUA. Utilizado em salas de aula, planetários e clubes de astronomia, este calendário altamente ilustrado recebeu prêmios e elogios de publicações como a Scientific American. Uma assinatura anual (12 edições, enviadas trimestralmente) custa US$ 12.

Leia mais
Diversos assinatura

Mistério do SSD Lento: Desmascarando um Disco Kingston Falso

2025-08-22

O autor comprou um SSD Kingston supostamente de 960 GB, mas sua velocidade ficou muito abaixo do esperado. Testes revelaram que era na verdade um disco de 128 GB, provavelmente uma contrafação com firmware modificado. Apesar da embalagem e aparência realistas, a impressão de baixa qualidade do adesivo traseiro o denunciou. O autor entrou em contato com o varejista online e recebeu reembolso total. Essa experiência serve como um alerta: mesmo ao comprar em grandes marketplaces online, a verificação cuidadosa é crucial para evitar golpes como o truque de "entrega pela Amazon".

Leia mais

Bild AI: Engenheiro Fundador (IA Aplicada) - Revolucionando a Construção com IA

2025-08-23
Bild AI: Engenheiro Fundador (IA Aplicada) - Revolucionando a Construção com IA

A Bild AI, uma startup em rápido crescimento, está procurando um Engenheiro Fundador em IA Aplicada. Eles estão enfrentando o complexo problema da compreensão de plantas na construção usando visão computacional e LLMs de última geração. O candidato ideal terá fortes habilidades em Python, aprendizado de máquina e aprendizado profundo, com um histórico comprovado de construção e implantação de soluções de IA do zero. Esta é uma função de alto impacto que exige mentalidade de crescimento e a capacidade de iterar rapidamente com base no feedback do usuário. Experiência em construção de produtos usados por clientes pagantes é um diferencial.

Leia mais
IA

Comunidade do Kernel Debate Patches Gerados por IA

2025-08-23

A comunidade do kernel Linux está lidando com o aumento das ferramentas de codificação assistidas por IA. Submissões usando LLMs para gerar patches geraram debates, com propostas para adicionar tags que identifiquem o uso de LLMs. No entanto, preocupações sobre a qualidade dos patches, questões de direitos autorais e aumento da carga de trabalho dos mantenedores são prevalentes, levando alguns a sugerir a proibição de contribuições geradas por LLM. Um consenso permanece difícil de alcançar, mas as discussões estão se expandindo para incluir uma política de IA mais ampla, prevista para ser discutida na Cúpula de Mantenedores de dezembro.

Leia mais
Desenvolvimento Patches de Código

IA revoluciona o projeto de chips: especialistas opinam

2025-08-20
IA revoluciona o projeto de chips: especialistas opinam

Especialistas em engenharia de semicondutores discutiram como a IA pode ser aplicada ao projeto de chips para maximizar seu valor e impactar o processo de projeto. Eles preveem que a IA mudará o projeto de chips de amplamente específico para domínio para uma abordagem mais granular com domínios e subdomínios, atendendo às necessidades exclusivas de diferentes verticais (por exemplo, automotivo ou aplicativos críticos para missão). As ferramentas de IA prometem automatizar processos, melhorar a análise de depuração e, finalmente, levar a fluxos de trabalho totalmente autônomos (nível 5), potencialmente reduzindo a dependência de engenheiros juniores. No entanto, os desafios permanecem em garantir a confiabilidade da IA e tornar seu processo de tomada de decisão transparente e compreensível para os engenheiros, garantindo a qualidade e a eficiência do projeto.

Leia mais
Desenvolvimento

Colt Telecom sofre violação de dados: Gangue de ransomware Warlock exige US$ 200.000

2025-08-23
Colt Telecom sofre violação de dados: Gangue de ransomware Warlock exige US$ 200.000

A empresa de telecomunicações britânica Colt Technology Services confirmou uma violação de dados, com a gangue de ransomware Warlock leiloando dados de clientes roubados na dark web. A gangue afirma possuir 1 milhão de documentos, incluindo informações financeiras, dados de arquitetura de rede e informações de clientes, por US$ 200.000. A Colt emitiu um aviso de segurança e oferece aos clientes uma lista de nomes de arquivos vazados. O ataque explorou uma vulnerabilidade do SharePoint, destacando riscos significativos de segurança cibernética.

Leia mais
Tecnologia

Citações Coercivas em Revisões por Pares: Estudo Revela Prática Preocupante

2025-08-22
Citações Coercivas em Revisões por Pares: Estudo Revela Prática Preocupante

Uma análise de 18.400 artigos de acesso aberto revelou que revisores são significativamente mais propensos a aprovar um manuscrito se seu próprio trabalho for citado em versões posteriores. Este estudo, que ainda não foi revisado por pares, analisou dados de quatro plataformas de publicação de acesso aberto e descobriu que revisores citados tinham maior probabilidade de aprovar artigos do que aqueles que não foram citados. A análise também examinou comentários de revisores, encontrando linguagem mais coercitiva por parte dos revisores que solicitaram citações ao rejeitarem artigos. Isso levanta preocupações sobre potenciais conflitos de interesse e integridade acadêmica no processo de revisão por pares.

Leia mais

Magia Negra no Encadeamento de Padrões do Python 3.10: Explorando `__subclasshook__`

2025-08-22

Este artigo explora as capacidades inesperadas que surgem da combinação do emparelhamento de padrões do Python 3.10 e o método `__subclasshook__` das Classes Base Abstratas (CBAs). Usando habilmente `__subclasshook__`, o autor demonstra 'sequestrar' o emparelhamento de padrões, permitindo a definição personalizada de quais tipos coincidem e até mesmo a correspondência com base em atributos de objetos, não apenas tipos. Embora mostre funcionalidades poderosas, como a criação de correspondências personalizadas, o autor adverte fortemente contra o uso desta técnica em código de produção devido à sua natureza imprevisível e potencialmente prejudicial.

Leia mais

Redes Kolmogorov-Arnold: Uma Rede Neural Mais Científica?

2025-08-22

Este artigo explora as diferenças filosóficas entre as Redes Kolmogorov-Arnold (KANs) e os Perceptrons Multicamadas (MLPs). Embora admita que ambos possuem o mesmo poder expressivo, o autor argumenta que diferenças surgem em otimização, generalização e interpretabilidade. KANs se alinham mais com o reducionismo, enquanto MLPs se inclinam para o holismo. O autor sugere que KANs podem ser mais adequadas para modelar fenômenos científicos, dada a dependência da ciência em abordagens reducionistas, citando o exemplo da compilação de fórmulas simbólicas. No entanto, a importância de experimentos empíricos é enfatizada, reconhecendo potenciais fraquezas das KANs em tarefas não científicas.

Leia mais
1 2 22 23 24 26 28 29 30 563 564