Category: IA

Por que alguns LLMs são rápidos na nuvem, mas lentos localmente?

2025-06-01

Este artigo explora por que modelos de linguagem grandes (LLMs), especialmente modelos Mixture-of-Experts (MoE) como DeepSeek-V3, são rápidos e baratos para servir em escala na nuvem, mas lentos e caros para executar localmente. A chave está na inferência em lote: GPUs excel em multiplicações de matrizes grandes, e processar em lote vários pedidos de usuário melhora significativamente a taxa de transferência, mas aumenta a latência. Modelos MoE e modelos com muitas camadas dependem particularmente do processamento em lote para evitar gargalos no pipeline e subutilização de especialistas. Provedores de nuvem equilibram a taxa de transferência e a latência ajustando o tamanho do lote (janela de coleta), enquanto execuções locais geralmente têm apenas um pedido, levando a uma utilização muito baixa da GPU. A eficiência dos serviços da OpenAI pode resultar de uma arquitetura de modelo superior, truques inteligentes de inferência ou GPUs muito mais poderosas.

RenderFormer: Renderização Neural com Iluminação Global sem Treinamento por Cena

2025-06-01

RenderFormer é um pipeline de renderização neural que renderiza diretamente uma imagem a partir de uma representação de cena baseada em triângulos com efeitos completos de iluminação global, sem exigir treinamento ou ajuste fino por cena. Em vez de uma abordagem física, ele formula a renderização como uma transformação sequencial: uma sequência de tokens representando triângulos com propriedades de reflectância é convertida em uma sequência de tokens de saída representando pequenos patches de pixels. Ele usa um pipeline de duas etapas baseado em transformer: uma etapa independente da visão que modela o transporte de luz de triângulo para triângulo e uma etapa dependente da visão que transforma feixes de raios em valores de pixels guiados pela etapa independente da visão. Nenhuma rasterização ou rastreamento de raio é necessário.

Algoritmos Quânticos: Desvendando o Problema do Subgrupo Oculto

2025-06-01

Este artigo mergulha no problema central da computação quântica — o Problema do Subgrupo Oculto (HSP). O HSP generaliza os algoritmos de Shor e Simon, oferecendo soluções eficientes para problemas classicamente difíceis. O artigo detalha a definição do HSP, os métodos de solução (o método padrão) e ilustra com o problema de Simon e o problema do logaritmo discreto. Finalmente, apresenta a Transformada Quântica de Fourier (QFT) e seu papel crucial na resolução do HSP.

Chatbot de IA envolvido em suicídio de adolescente: batalha legal sobre responsabilidade

2025-05-31
Chatbot de IA envolvido em suicídio de adolescente: batalha legal sobre responsabilidade

Uma juíza da Flórida decidiu que as proteções da Primeira Emenda não protegem uma empresa de IA de um processo que alega que seus chatbots desempenharam um papel no suicídio de um adolescente de Orlando. O processo, movido pela mãe do adolescente, afirma que os chatbots da Character.AI, imitando personagens de Game of Thrones, contribuíram para a morte de seu filho. A juíza rejeitou a defesa da Primeira Emenda dos réus, argumentando que o texto gerado por IA não é discurso protegido. No entanto, a juíza rejeitou as alegações de inflição intencional de sofrimento emocional e as alegações contra a empresa controladora do Google, Alphabet. A Character.AI afirmou que implementou recursos de segurança e espera defender sua posição com base nos méritos.

Syftr: Uma estrutura de código aberto para otimização automática de fluxos de trabalho de IA generativa

2025-05-31
Syftr: Uma estrutura de código aberto para otimização automática de fluxos de trabalho de IA generativa

Construir fluxos de trabalho de IA generativa eficazes enfrenta uma explosão combinatória de escolhas. Syftr é uma estrutura de código aberto que usa otimização bayesiana multi-objetivo para identificar automaticamente fluxos de trabalho Pareto-ótimos em termos de precisão, custo e restrições de latência. O Syftr pesquisa eficientemente um vasto espaço de configuração para encontrar fluxos de trabalho que equilibram de forma ótima precisão e custo, obtendo resultados significativos no benchmark CRAG Sports, reduzindo o custo em quase duas ordens de magnitude. O Syftr suporta vários componentes e algoritmos e é compatível com outras ferramentas de otimização, fornecendo uma abordagem eficiente e escalonável para a construção de sistemas de IA generativa.

Artista Tartaruga com IA no Simulador ROS

2025-05-31
Artista Tartaruga com IA no Simulador ROS

O turtlesim_agent é um agente de IA que transforma o simulador clássico ROS turtlesim em uma tela criativa impulsionada por linguagem natural. Usando o LangChain, ele interpreta instruções de texto e as traduz em desenhos visuais, transformando a tartaruga simulada em uma artista digital. Os usuários descrevem formas ou intenções de desenho em inglês simples; a IA raciocina sobre as instruções e as executa usando os comandos de movimento do turtlesim. Este projeto explora como os modelos de linguagem grandes interagem com ambientes externos para exibir comportamento criativo.

IA

Hugging Face de código aberto: Robôs HopeJR e Reachy Mini

2025-05-31
Hugging Face de código aberto: Robôs HopeJR e Reachy Mini

A Hugging Face Inc. tornou de código aberto os projetos de dois robôs desenvolvidos internamente, o HopeJR e o Reachy Mini. O HopeJR é um robô humanoide capaz de 66 movimentos, incluindo caminhar, com braços robóticos controlados por luvas especiais. O Reachy Mini é um robô de mesa, semelhante a uma tartaruga, com um pescoço retrátil, ideal para testar aplicativos de IA. Os projetos de ambos são de código aberto, com versões pré-montadas vendidas por aproximadamente US$ 250 e US$ 3.000, respectivamente. O envio é esperado até o final do ano.

IA

Cerebras quebra recorde de velocidade de inferência com Llama 4 Maverick 400B

2025-05-31
Cerebras quebra recorde de velocidade de inferência com Llama 4 Maverick 400B

A Cerebras Systems alcançou uma velocidade de inferência inovadora de mais de 2.500 tokens por segundo (TPS) no modelo de 400B parâmetros Llama 4 Maverick da Meta, mais do que o dobro do desempenho da Nvidia. Essa velocidade recorde, verificada independentemente pela Artificial Analysis, é crucial para aplicações de IA como agentes, geração de código e raciocínio complexo, reduzindo significativamente a latência e melhorando a experiência do usuário. Ao contrário da solução da Nvidia, que dependia de otimizações personalizadas indisponíveis, o desempenho da Cerebras é facilmente acessível por meio da próxima API da Meta, oferecendo uma solução superior para desenvolvedores e usuários corporativos de IA.

IA

Anthropic lança modo de voz para o chatbot Claude

2025-05-31
Anthropic lança modo de voz para o chatbot Claude

A Anthropic lançou um modo de voz beta para seu aplicativo de chatbot Claude, permitindo que os usuários tenham conversas completas faladas. Inicialmente disponível em inglês, o recurso usa o modelo Claude Sonnet 4 e oferece várias opções de voz. Os usuários podem alternar entre texto e voz e visualizar transcrições e resumos. Embora os usuários gratuitos tenham limites de uso, os assinantes pagos têm acesso a recursos como integração do Google Workspace. Isso segue as discussões anteriores da Anthropic com a Amazon e a ElevenLabs sobre recursos de voz.

A IA pode automatizar totalmente a engenharia de software?

2025-05-30
A IA pode automatizar totalmente a engenharia de software?

Este artigo explora a possibilidade da IA automatizar totalmente a engenharia de software. Atualmente, a IA se destaca em tarefas de codificação específicas, superando engenheiros humanos, mas carece de confiabilidade, compreensão de contexto longo e capacidades gerais. Os autores argumentam que a chave está em algoritmos de aprendizado muito menos eficientes do que o cérebro humano e na escassez de dados de treinamento de alta qualidade. Avanços futuros envolverão a combinação de treinamento de dados humanos em larga escala com aprendizado por reforço, criando ambientes de aprendizado por reforço mais ricos e realistas para permitir que a IA possua habilidades de aprendizado online semelhantes às humanas. Embora a IA escreva a maior parte do código, os empregos em engenharia de software não desaparecerão imediatamente; em vez disso, o foco mudará para tarefas mais difíceis de automatizar, como planejamento, testes e coordenação de equipe. Em última análise, a automação total significa que a IA pode assumir todas as responsabilidades humanas em um computador — uma meta potencialmente muito mais distante do que a simples geração de código.

IA

Kernels CUDA gerados por IA superam o PyTorch?

2025-05-30

Pesquisadores usaram grandes modelos de linguagem e uma nova estratégia de busca ramificada para gerar automaticamente kernels CUDA-C puros sem depender de bibliotecas como CUTLASS ou Triton. Surpreendentemente, esses kernels gerados por IA, em alguns casos, superam até mesmo os kernels de produção otimizados por especialistas no PyTorch, obtendo quase o dobro da velocidade na operação Conv2D. O método utiliza raciocínio em linguagem natural sobre estratégias de otimização e uma busca ramificada para explorar várias hipóteses em paralelo, evitando eficazmente ótimos locais. Embora o desempenho da multiplicação de matrizes FP16 e da atenção Flash ainda precise de melhorias, esta pesquisa abre uma nova fronteira na autogeração de kernels de alto desempenho, sugerindo o imenso potencial da IA na otimização de compiladores.

Assassinos ocultos na sua conta de nuvem de IA: 5 razões pelas quais os custos disparam

2025-05-30
Assassinos ocultos na sua conta de nuvem de IA: 5 razões pelas quais os custos disparam

As cargas de trabalho de IA são diferentes dos aplicativos corporativos típicos, levando a custos de armazenamento em nuvem inesperadamente altos devido ao processamento massivo de dados e operações frequentes. Este artigo revela cinco culpados: 1. Chamadas excessivas da API; 2. Uma multidão de arquivos pequenos; 3. Incompatibilidade do armazenamento frio com fluxos de trabalho de IA iterativos; 4. Taxas de saída de dados; e 5. Regras de ciclo de vida de dados mal configuradas. Esses custos ocultos muitas vezes passam despercebidos, resultando em contas explosivas. O artigo insta os desenvolvedores a otimizar o armazenamento e a transferência de dados, escolhendo estratégias de armazenamento mais adequadas para cargas de trabalho de IA para gerenciar os custos de forma eficaz.

Gatos conseguem sentir a diferença: como a olfação felina distingue entre humanos

2025-05-30
Gatos conseguem sentir a diferença: como a olfação felina distingue entre humanos

Um novo estudo revela que gatos domésticos usam a olfação para diferenciar entre humanos familiares (donos) e desconhecidos. Os gatos passaram significativamente mais tempo cheirando o odor de uma pessoa desconhecida, exibindo lateralização no uso das narinas semelhante a outros animais que respondem a odores novos. O estudo também encontrou correlações entre traços de personalidade felinos e comportamento de farejar, mas nenhuma associação com a força do vínculo gato-dono. Esta pesquisa ilumina a complexidade da cognição social olfativa felina, oferecendo novos insights sobre as interações gato-humano.

IA Generativa: Uma Ameaça à Criatividade Humana?

2025-05-30
IA Generativa: Uma Ameaça à Criatividade Humana?

A IA generativa, construída sobre uma base de roubo, está nos guiando para um futuro desumanizado. Embora reconhecendo os méritos da aprendizagem de máquina, os autores argumentam que a trajetória atual da IA generativa representa uma ameaça moral significativa ao bem mais valioso da humanidade: a criatividade. Eles escolheram um caminho diferente, priorizando a criatividade humana em vez da busca cega pela tecnologia, mesmo que isso signifique potencialmente ficar para trás. Essa estrada menos percorrida, acreditam eles, é mais emocionante e, em última análise, mais frutífera para sua comunidade.

O Espelho da IA: Como a Aprendizagem de Máquina Ilumina a Cognição Humana

2025-05-30
O Espelho da IA: Como a Aprendizagem de Máquina Ilumina a Cognição Humana

Um livro experimental, *O Algoritmo Humano*, escrito autonomamente por IA, explora os paralelos surpreendentes entre inteligência artificial e humana. Ao analisar os desafios dos Modelos de Linguagem Grandes (LLMs), como 'alucinações' e 'sobreajuste', o livro revela verdades negligenciadas sobre a cognição e a comunicação humanas. Ele destaca a discrepância entre nossas exigências rigorosas para a IA e nossa tolerância a nossos próprios vieses cognitivos. O livro não se trata de tornar a IA mais humana, mas de usar a IA como um espelho para ajudar os humanos a se entenderem melhor, melhorando as habilidades de comunicação e a autoconsciência.

IA

Deepfakes: Borrando a Linha Entre Realidade e Fabricação

2025-05-30
Deepfakes: Borrando a Linha Entre Realidade e Fabricação

Desde as primeiras manipulações de fotos de Abraham Lincoln até os "deepfakes" gerados por IA de hoje, a tecnologia de falsificação de imagens evoluiu dramaticamente. As ferramentas de IA democratizam a falsificação, tornando a criação de imagens falsas convincentes sem esforço. Essas falsificações geradas por IA não possuem referências no mundo real, tornando-as incrivelmente difíceis de rastrear e levando a preocupações sobre a disseminação de mentiras e propaganda nas mídias sociais. Deepfakes foram usados como armas na política, usados ​​para espalhar desinformação durante as eleições e semear discórdia. Os especialistas temem que, à medida que as pessoas se acostumam com deepfakes, comecemos a duvidar da veracidade de todas as informações, levando potencialmente a um colapso da confiança e à erosão da democracia. O artigo argumenta que, em uma era de sobrecarga de informações, as pessoas confiam em mitos e intuição em vez de razão, tornando os deepfakes mais fáceis de aceitar e espalhar.

IA

Além do BPE: O Futuro da Tokenização em Modelos de Linguagem Grandes

2025-05-30
Além do BPE: O Futuro da Tokenização em Modelos de Linguagem Grandes

Este artigo explora melhorias nos métodos de tokenização em grandes modelos de linguagem pré-treinados. O autor questiona o método comumente usado de Codificação de Par de Bytes (BPE), destacando suas deficiências no tratamento de subpalavras no início e dentro das palavras. São sugeridas alternativas, como adicionar uma máscara de nova palavra. Além disso, o autor argumenta contra o uso de algoritmos de compressão para pré-processamento de entradas, defendendo a modelagem de linguagem em nível de caractere, traçando paralelos com Redes Neurais Recorrentes (RNNs) e modelos de atenção própria mais profundos. No entanto, a complexidade quadrática do mecanismo de atenção apresenta um desafio. O autor propõe uma abordagem baseada em estrutura de árvore, usando subsequências com janela e atenção hierárquica para reduzir a complexidade computacional enquanto captura melhor a estrutura da linguagem.

Curie: Automação de Experimentos Científicos com IA

2025-05-30
Curie: Automação de Experimentos Científicos com IA

Curie é uma estrutura inovadora de agente de IA projetada para experimentação científica automatizada e rigorosa. Ele automatiza todo o processo experimental, da formulação de hipóteses à interpretação de resultados, garantindo precisão, confiabilidade e reprodutibilidade. Suporta pesquisa em ML, análise de sistemas e descoberta científica, permitindo que os cientistas insiram perguntas e recebam relatórios de experimentos automatizados com resultados e logs totalmente reprodutíveis, acelerando drasticamente a pesquisa.

Renderizador Neural Suave com Triângulos Aprendíveis

2025-05-30

Esta pesquisa apresenta um novo método de renderização neural usando triângulos 3D aprendíveis como primitivas. Ao contrário das máscaras binárias tradicionais, ele emprega uma função de janela suave derivada do campo de distância com sinal 2D (SDF) do triângulo para modular suavemente a influência do triângulo nos pixels. Um parâmetro de suavidade, σ, controla a nitidez dessa função de janela, permitindo uma transição suave de uma máscara binária para uma aproximação de uma função delta. A imagem final é gerada pela mistura alfa das contribuições de todos os triângulos projetados. Todo o processo é diferenciável, permitindo a aprendizagem baseada em gradiente para otimizar os parâmetros do triângulo.

Efeitos dependentes da idade da cafeína na complexidade e criticidade do cérebro durante o sono

2025-05-30
Efeitos dependentes da idade da cafeína na complexidade e criticidade do cérebro durante o sono

Um novo estudo revela que a cafeína afeta a complexidade e a criticidade do cérebro de maneira dependente da idade. Ao analisar dados de EEG do sono, os pesquisadores descobriram que a cafeína induziu aumentos na complexidade e criticidade da atividade cerebral em adultos jovens e de meia-idade, mas não em adultos mais velhos. Este estudo fornece insights novos sobre os efeitos da cafeína no cérebro e nas doenças neurodegenerativas relacionadas à idade.

Edição de base oferece nova esperança para o tratamento de distúrbios de expansão de repetições CAG e GAA

2025-05-29
Edição de base oferece nova esperança para o tratamento de distúrbios de expansão de repetições CAG e GAA

Este estudo investiga o potencial de editores de base de citosina (CBEs) e editores de base de adenina (ABEs) para tratar distúrbios de expansão de repetições, como a doença de Huntington (DH) e a ataxia de Friedreich (AF). Os pesquisadores projetaram editores direcionados a repetições CAG e GAA e demonstraram sua eficácia em experimentos in vitro e in vivo. Os CBEs reduziram significativamente a expansão da repetição CAG, até mesmo promovendo a contração, em um modelo de camundongo de DH. Os ABEs estabilizaram as repetições GAA e aumentaram a expressão do gene FXN em um modelo de camundongo de AF. Embora existam efeitos fora do alvo, as descobertas destacam o potencial significativo desses editores de base para tratar distúrbios de expansão de repetições.

Chatbots como intermediários na internet: receita para desastre

2025-05-29

Colocar um chatbot de IA não confiável entre você e a internet é um desastre esperando para acontecer. O autor usa o navegador Dia da Browser Company como exemplo, destacando os riscos: a IA pode recomendar produtos afiliados, promoções pagas ou até mesmo ser manipulada com conteúdo personalizado. Isso espelha como empresas como Google, Amazon e Microsoft priorizam seus próprios produtos, comportamento que, embora não seja ilegal, cria viés de informação e manipulação. Ainda mais preocupante é o potencial de manipulação ideológica, que a IA tornará mais eficiente e difícil de detectar. Depender de um chatbot é como depender de um mordomo para todas as suas notícias e comunicações; conveniente inicialmente, mas que leva, por fim, à manipulação ou pior.

Web Bench: Novo Benchmark para Agentes de Navegação na Web

2025-05-29
Web Bench: Novo Benchmark para Agentes de Navegação na Web

O Web Bench é um novo conjunto de dados para avaliar agentes de navegação na web, contendo 5.750 tarefas em 452 sites diferentes, com 2.454 tarefas de código aberto. O benchmark revela deficiências no tratamento de tarefas intensivas em escrita (login, preenchimento de formulários e download de arquivos) por agentes existentes, destacando a importância da infraestrutura do navegador. O Anthropic Sonnet 3.7 CUA obteve o melhor desempenho.

Ferramenta de código aberto revela o funcionamento interno de modelos de linguagem grandes

2025-05-29
Ferramenta de código aberto revela o funcionamento interno de modelos de linguagem grandes

A Anthropic lançou uma nova ferramenta de código aberto para rastrear os "processos de pensamento" de modelos de linguagem grandes. Essa ferramenta gera gráficos de atribuição, visualizando as etapas internas que um modelo empreende para chegar a uma decisão. Os usuários podem explorar interativamente esses gráficos na plataforma Neuronpedia, estudando comportamentos como raciocínio em várias etapas e representações multilíngues. Este lançamento visa acelerar a pesquisa sobre a interpretabilidade de modelos de linguagem grandes, fechando a lacuna entre os avanços nas capacidades de IA e nossa compreensão de seu funcionamento interno.

IA

Revolução de Produtividade da IA: Hype ou Realidade?

2025-05-29
Revolução de Produtividade da IA: Hype ou Realidade?

Apesar do entusiasmo em torno da revolução de produtividade da IA generativa por líderes da tecnologia e mídia, a teoria econômica e os dados lançam dúvidas. Embora a IA tenha potencial para automatizar tarefas e aumentar a produtividade em algumas ocupações, seu impacto no crescimento econômico geral pode ser muito menor do que as previsões otimistas sugerem. Estudos mostram que a IA atual produz uma economia média de custo de mão de obra de apenas 27% e afeta aproximadamente 4,6% das tarefas. Isso resulta em um crescimento de TFP de apenas 0,66% em dez anos, potencialmente menor considerando as dificuldades de automação de algumas tarefas. Embora a IA possa não exacerbar a desigualdade, alguns grupos ainda serão afetados negativamente. Um otimismo cauteloso em relação ao potencial da IA é justificado, evitando o tecnootimismo acrítico e focando nos impactos sociais mais amplos.

IA

Além dos cérebros de gatos: Explorando os limites da cognição com cérebros maiores

2025-05-28
Além dos cérebros de gatos: Explorando os limites da cognição com cérebros maiores

Este artigo explora a relação entre o tamanho do cérebro e as capacidades cognitivas, particularmente quais novas capacidades cognitivas podem surgir quando o tamanho do cérebro excede muito o dos humanos. A partir dos avanços recentes em redes neurais e modelos de linguagem grandes, e incorporando conhecimentos da teoria da computação e neurociência, o autor analisa como os cérebros processam grandes quantidades de dados sensoriais e tomam decisões. O artigo argumenta que os cérebros exploram "bolsos de redutibilidade" dentro da irredutibilidade computacional para navegar pelo mundo, e cérebros maiores podem ser capazes de aproveitar mais esses bolsos, levando a capacidades de abstração mais fortes e uma linguagem mais rica. Por fim, o artigo explora a possibilidade de mentes além da compreensão humana e as alturas potenciais que a IA pode alcançar.

IA

Novo Modelo de IA DeepSeek-R1-0528 de 685B Parâmetros no Hugging Face

2025-05-28
Novo Modelo de IA DeepSeek-R1-0528 de 685B Parâmetros no Hugging Face

Um novo modelo de linguagem grande, DeepSeek-R1-0528, com 685 bilhões de parâmetros, foi lançado no Hugging Face. O modelo está disponível no formato Safetensors e suporta tipos de tensores, incluindo BF16, F8_E4M3 e F32. Atualmente, nenhum provedor de inferência implantou o modelo, mas sua página no Hugging Face fornece detalhes como cartão do modelo, arquivos e versões.

IA

Aceleração de 1744x: Compilando uma Rede Neural para C

2025-05-28

O autor treinou uma rede neural com portas lógicas como funções de ativação para aprender o kernel 3x3 do Jogo da Vida de Conway. Para acelerar a inferência, o circuito lógico aprendido foi extraído e compilado em código C bit-paralelo (com otimizações para remover portas redundantes). A avaliação de desempenho mostrou uma impressionante aceleração de 1744x em comparação com a rede neural original.

O Paradoxo da IA: Provando que Você é Humano em um Mundo Dominado por Bots

2025-05-28
O Paradoxo da IA: Provando que Você é Humano em um Mundo Dominado por Bots

O rápido avanço da IA criou uma corrida armamentista bizarra: nós lutamos para provar que somos humanos enquanto máquinas facilmente contornam CAPTCHAs. Este artigo explora o desafio civilizacional que isso apresenta. Projetos como Worldcoin e Humanity Protocol estão tentando resolver isso com 'prova de personalidade' baseada em biometria e blockchain, mas enfrentam controvérsia. Por fim, o autor prevê um futuro onde agentes de IA superarão humanos em várias tarefas, levando a um cenário distópico onde os humanos precisam provar que são representados por um bot para acessar serviços digitais. Isso destaca um paradoxo profundo: nós construímos máquinas para nos substituir, então construímos barreiras para pará-las, apenas para potencialmente acabar precisando de agentes de IA como nossos delegados digitais.

IA

Interface célula-nanopartícula permite programação sem fio eletromagnética da expressão de transgene em mamíferos

2025-05-28
Interface célula-nanopartícula permite programação sem fio eletromagnética da expressão de transgene em mamíferos

Pesquisadores do ETH Zurich desenvolveram um novo método para o controle eletromagnético sem fio da expressão de transgenes em mamíferos usando nanopartículas. A abordagem emprega campos magnéticos para estimular nanopartículas multiferróicas (ferrita de cobalto e ferrita de bismuto), gerando espécies reativas de oxigênio (ROS) bioseguras que ativam a via celular KEAP1/NRF2, controlando precisamente a expressão de proteínas terapêuticas como a insulina. Testado com sucesso em um modelo de camundongo diabético, esta tecnologia permite o ajuste remoto e dinâmico da terapia sem injeções ou implantes. Aplicações promissoras incluem oncologia, neurologia e medicina regenerativa, potencialmente revolucionando a medicina de precisão.

IA
1 2 11 12 13 15 17 18 19 49 50