Category: IA

EQTY Lab, Intel e NVIDIA revelam estrutura de Computação Verificável para IA

2024-12-18

A EQTY Lab, em colaboração com a Intel e a NVIDIA, anunciou o lançamento da estrutura de Computação Verificável para IA, uma solução baseada em hardware para governança e auditoria de fluxos de trabalho de IA. Esta estrutura fornece certificados de autenticidade e conformidade em tempo real para treinamento, inferência e benchmarks de IA, garantindo explicabilidade, responsabilidade e segurança. Aproveitando o hardware de última geração da Intel e da NVIDIA, a Computação Verificável aborda os riscos crescentes nas cadeias de suprimentos de IA, como envenenamento de IA e violações de dados. Integra-se com ferramentas como ServiceNow, Databricks e Palantir, permitindo inovação responsável em IA e conformidade com regulamentos como o Ato de IA da UE. A solução já está implantada em vários setores, incluindo ciências da vida, setor público, finanças e mídia.

A Velocidade do Pensamento Humano: Apenas 10 Bits por Segundo

2024-12-18

Pesquisadores do Caltech descobriram que os processos de pensamento humano são surpreendentemente lentos, operando a apenas 10 bits por segundo – significativamente mais lento do que a taxa de entrada de um bilhão de bits por segundo de nossos sistemas sensoriais. Este estudo apresenta um paradoxo: por que nosso pensamento é tão lento? Os pesquisadores especulam que isso pode derivar da evolução de nossos cérebros a partir de sistemas de navegação simples, processando informações sequencialmente em vez de em paralelo. Essa descoberta desafia alguns conceitos de ficção científica sobre interfaces cérebro-computador, sugerindo que mesmo interfaces neurais seriam limitadas por nossa velocidade de processamento inerente de 10 bits por segundo.

Evolução Cultural da Cooperação entre Agentes de LLMs

2024-12-18

Pesquisadores examinaram se uma 'sociedade' de agentes de Modelos de Linguagem Grandes (LLMs) pode aprender normas sociais mutuamente benéficas, mesmo com incentivos para defeitar. Experimentos revelaram diferenças significativas na evolução da cooperação entre modelos base, com o Claude 3.5 Sonnet superando significativamente o Gemini 1.5 Flash e o GPT-4o. Além disso, o Claude 3.5 Sonnet utilizou um mecanismo de punição custoso para alcançar pontuações ainda mais altas, um feito não replicado pelos outros modelos. Este estudo propõe um novo benchmark para LLMs focado nas implicações sociais da implantação de agentes LLM, oferecendo insights para a construção de agentes de IA mais robustos e cooperativos.

Whittaker em palestra no NDSS 2024: IA, criptografia e novas ameaças

2024-12-18

No Simpósio NDSS 2024, Meredith Whittaker, presidente da Signal Foundation, proferiu uma palestra principal refletindo sobre as 'Guerras da Criptografia' dos anos 90. Ela destacou como pressões políticas, técnicas e comerciais moldaram a paisagem de criptografia atual. Whittaker alertou contra a visão da situação atual como simplesmente 'Guerras da Criptografia 2.0', argumentando que um motor econômico impulsionado por dados pessoais, tecnologia de vigilância e IA/ML representa uma ameaça fundamentalmente diferente da paisagem de criptografia dominada pelo governo dos anos 90. Ela enfatizou a necessidade de uma nova abordagem, com a pesquisa NDSS na vanguarda dessa resposta.

Além da NISQ: O Amanhecer da Máquina Megaquop

2024-12-18

John Preskill, do Caltech, proferiu um discurso principal na conferência Q2B 2024, discutindo a potencial transição da era NISQ (Quantum Intermediário Ruidoso) para a era Megaquop (milhões de operações quânticas). Máquinas Megaquop são projetadas para executar milhões de operações quânticas, embora com uma taxa de erro ainda alta. Por meio de técnicas de mitigação de erros e possivelmente qubits físicos de maior qualidade, elas poderiam realizar tarefas além do alcance de computadores clássicos e máquinas NISQ. Progressos significativos de equipes do Google, AWS e outras em correção de erros quânticos e melhorias de hardware lançam as bases para máquinas Megaquop. No entanto, Preskill destacou desafios, incluindo a velocidade de decodificação para correção de erros quânticos, mitigação de interferência de raios cósmicos e identificação de aplicações comercialmente viáveis. Aplicações futuras de máquinas Megaquop podem incluir simulações de sistemas quânticos complexos e pesquisas em ciência de materiais.

Sem Mais Adam: Escalonamento da Taxa de Aprendizagem na Inicialização é Tudo o que Você Precisa

2024-12-18

Pesquisadores apresentam SGD-SaI, um novo otimizador que aprimora o método de descida de gradiente estocástico. O SGD-SaI aborda desequilíbrios de treinamento por meio do escalonamento da taxa de aprendizagem na inicialização para diferentes grupos de parâmetros, com base em suas relações sinal-ruído de gradiente. Muito mais eficiente em termos de memória do que o AdamW, o SGD-SaI iguala ou supera o desempenho do AdamW em várias tarefas baseadas em Transformer, incluindo classificação ImageNet e pré-treinamento de LLMs. Sua robustez e praticidade são demonstradas em diversos aplicativos, tornando-o uma alternativa convincente.

IA

Exbody2: Imitação de Movimento de Corpo Inteiro de Alta Fidelidade em Robôs Humanoides

2024-12-18

Pesquisadores desenvolveram o Exbody2, uma estrutura de rastreamento de corpo inteiro generalizada que permite que robôs humanoides executem movimentos expressivos com estabilidade semelhante à humana. Treinado em simulação usando Aprendizado por Reforço e depois transferido para o mundo real, o Exbody2 desacopla o rastreamento de pontos-chave do controle de velocidade. Ele utiliza uma política de professor privilegiada para destilar habilidades de imitação precisas, alcançando a replicação de alta fidelidade de movimentos dinâmicos como corrida, agachamento e dança. Experimentos em duas plataformas humanoides demonstram desempenho superior em comparação com métodos de última geração, fornecendo diretrizes práticas para o controle avançado de corpo inteiro em robótica humanoide.

Pesquisa Google: Queda na Qualidade Causa Frustração entre os Usuários

2024-12-18

O especialista em SEO, Elie Berreby, destaca uma queda significativa na qualidade da pesquisa do Google, levando à insatisfação generalizada dos usuários. Ao analisar o feedback do usuário de canais não oficiais, como comentários do YouTube, ele revela reclamações sobre a deterioração dos resultados da pesquisa, publicidade excessiva e visões de IA roubando conteúdo. A estratégia do Google parece priorizar a monetização em detrimento da experiência do usuário, potencialmente levando os usuários a procurar mecanismos de pesquisa alternativos. O artigo serve como um aviso ao Google, sugerindo consequências graves se as melhorias não forem feitas.

FastVideo: Framework de código aberto acelera modelos de difusão de vídeo de grande porte

2024-12-17

FastVideo é um framework de código aberto projetado para acelerar a inferência e o treinamento de grandes modelos de difusão de vídeo. Ele suporta modelos como FastMochi e FastHunyuan, alcançando até 8 vezes mais velocidade na inferência. O framework utiliza técnicas de destilação de conhecimento e suporta destilação, ajuste fino e inferência para modelos de vídeo DiT baseados em PCM. Além disso, o FastVideo possui recursos de treinamento escaláveis com FSDP, paralelismo de sequência e checkpointing de ativação seletiva, permitindo ajuste fino eficiente em termos de memória.

Atenção como Gerenciamento de Linhas de Campo Eletromagnético: Um Novo Modelo de Consciência

2024-12-17

O Instituto de Pesquisa Qualia propõe um novo modelo de atenção, conceituando-a como o gerenciamento de padrões dinâmicos no campo eletromagnético do cérebro. Simulando linhas de campo elétrico que surgem de somas ponderadas de oscilações harmônicas, os pesquisadores demonstram como a atenção controla a densidade de carga modulando os modos ressonantes subjacentes, explicando flutuações e desvios aparentemente aleatórios no comportamento da atenção. Este modelo também oferece uma explicação potencial para experiências psicodélicas, sugerindo que psicodélicos interrompem o fluxo normal da atenção alterando a configuração dos modos harmônicos. A pesquisa fornece uma nova lente para a compreensão da consciência e o desenvolvimento de novas neuro-intervenções, como induzir estados exóticos de consciência perturbando não invasivamente o travamento de fase da atenção.

Modular lança MAX 24.6: Plataforma de IA Generativa nativa para GPU

2024-12-17

A Modular lançou o MAX 24.6, uma plataforma de IA generativa nativa para GPU, projetada para redefinir como a IA é desenvolvida e implantada. O núcleo do MAX 24.6 é o MAX GPU, uma pilha de serviço de IA generativa integrada verticalmente que elimina a dependência de bibliotecas de computação específicas de fornecedores, como a NVIDIA CUDA. Construído no compilador e tempo de execução de modelo de IA de alto desempenho MAX Engine e na camada de serviço nativa do Python MAX Serve, ele suporta todo o ciclo de vida de desenvolvimento de IA, da experimentação à implantação de produção. O MAX 24.6 suporta várias plataformas de hardware, incluindo aceleradores NVIDIA A100, L40, L4 e A10, com suporte planejado para GPUs H100, H200 e AMD. Ele é compatível com modelos Hugging Face e fornece uma API de cliente compatível com OpenAI. O MAX 24.6 alcança uma taxa de transferência de 3860 tokens de saída por segundo no modelo Llama 3.1, igualando o desempenho do vLLM com um tamanho de imagem Docker menor.

Relatório de Stanford Adverte sobre a Viabilidade e os Riscos de Bactérias Espelho

2024-12-17

Um relatório técnico da Universidade de Stanford detalha a viabilidade de criar 'bactérias espelho' e seus riscos potenciais. Bactérias espelho, com todas as moléculas quirais (proteínas, ácidos nucléicos e metabólitos) substituídas por suas imagens espelhadas, não podem evoluir naturalmente, mas estão se tornando cada vez mais sintetizáveis. Sistemas imunológicos e predação dependem de interações de moléculas quirais, o que significa que bactérias espelho podem escapar da detecção e do controle, potencialmente se espalhando sem controle e representando sérias ameaças a humanos, animais, plantas e ao meio ambiente. O relatório avalia de forma abrangente a síntese, a biosegurança, os impactos na saúde humana, as contramedidas médicas e as consequências ecológicas, instando a atenção para esse risco potencial de biosegurança.

A Duzia de Datasaurus: Expondo as Armadilhas da Estatística

2024-12-17

Treze conjuntos de dados, com estatísticas descritivas simples quase idênticas, mas com distribuições e visualizações muito diferentes! Esta é a fascinante Duzia de Datasaurus. Compreendendo um conjunto de dados em forma de dinossauro e outros doze com formas variadas, todos compartilham quase as mesmas médias, variâncias e correlações. Isso demonstra poderosamente o perigo de depender apenas de estatísticas descritivas básicas; a visualização é crucial. A Duzia de Datasaurus serve como um conto de advertência, incentivando os analistas de dados a priorizar a visualização antes da análise para evitar conclusões enganosas.

Estudo do MIT explica por que leis são escritas em estilo incompreensível

2024-12-17

Um novo estudo de cientistas cognitivos do MIT revela por que documentos legais são notoriamente difíceis de entender. Ao contrário da crença de que a complexidade decorre de edições iterativas, a pesquisa sugere que a linguagem jurídica complexa serve para transmitir autoridade, semelhante a um 'feitiço mágico'. Experimentos mostraram que mesmo não advogados instintivamente usam estruturas de linguagem complexas ao escrever leis. Essa descoberta pode inspirar legisladores a simplificar a linguagem jurídica para melhor compreensão pública.

Waymo se aventura em sua primeira viagem internacional para Tóquio

2024-12-17

A Waymo anunciou sua parceria com a Nihon Kotsu e a GO para levar seus veículos autônomos para Tóquio no início de 2025. Essa é a primeira expansão internacional da Waymo, testando seu sistema de direção autônoma em um ambiente urbano denso com tráfego pela esquerda. A empresa colaborará com parceiros e autoridades locais para garantir uma implementação segura e eficiente, alinhada com a visão do governo japonês para o futuro do transporte. A Nihon Kotsu, maior empresa de táxis de Tóquio, gerenciará e dará manutenção aos veículos.

Técnica revolucionária reduz custos de memória de LLMs em até 75%

2024-12-17

A Sakana AI, uma startup sediada em Tóquio, desenvolveu uma técnica inovadora chamada "memória universal de transformador" que melhora significativamente a eficiência de memória dos grandes modelos de linguagem (LLMs). Usando módulos de memória de atenção neural (NAMMs), a técnica atua como um editor inteligente, descartando informações redundantes e retendo detalhes cruciais. Isso resulta em uma redução de até 75% nos custos de memória e melhor desempenho em vários modelos e tarefas, oferecendo benefícios substanciais para empresas que utilizam LLMs.

Analista de Pesquisa de Mercado de Ações com IA: Insights de Mercado Instantâneos da Decode Investing

2024-12-16

A Decode Investing apresenta um analista de pesquisa de mercado de ações com tecnologia de IA, fornecendo insights de mercado instantâneos. Esta ferramenta analisa dados como documentos da SEC e atas de chamadas de ganhos para ajudar os investidores a tomar decisões informadas. Os recursos incluem um assistente de bate-papo com IA e um filtro de ações, projetados para otimizar os investimentos e aumentar a eficiência.

nCompass: Solução inovadora reduz custos de inferência de IA

2024-12-16

A nCompass Technologies desenvolveu um software inovador de serviço de inferência de IA que reduz o custo de servir modelos de IA em escala em até 50%. Usando software personalizado de inferência de IA e um escalonador de solicitações com reconhecimento de hardware e dimensionamento automático do Kubernetes, a nCompass mantém um serviço de alta qualidade com menos GPUs, resultando em uma melhoria de até 4x no tempo de resposta e custos de infraestrutura de GPU significativamente reduzidos. Os usuários acessam modelos de código aberto por meio de uma API sem limites de taxa e recebem um crédito de inscrição de US$ 100. Soluções locais também estão disponíveis para empresas que exigem custo-benefício e capacidade de resposta.

Benchmark de LLM: Pelicano em uma Bicicleta

2024-12-16

Simon Willison criou um benchmark único de LLM: gerar uma imagem SVG de um pelicano andando de bicicleta. Esse prompt incomum tinha como objetivo testar as habilidades criativas dos modelos sem depender de dados de treinamento pré-existentes. Ele testou 16 modelos de OpenAI, Anthropic, Google Gemini e Meta (Llama no Cerebras), revelando variações significativas na qualidade dos SVGs gerados. Alguns modelos produziram resultados surpreendentemente bons, enquanto outros tiveram dificuldades.

IA desvenda a química da tinta dos murais do Muro de Berlim

2024-12-16

Cientistas italianos usaram uma rede neural para analisar dados espectrais de dispositivos de espectroscopia Raman portáteis, revelando os segredos da química da tinta dos murais do Muro de Berlim. Esta pesquisa não apenas lança luz sobre os materiais e técnicas usados nessas obras de arte historicamente significativas, mas também fornece novas abordagens tecnológicas para a preservação da arte de rua. Ao analisar lascas de tinta de fragmentos de parede e combinando espectroscopia Raman, espectroscopia de fluorescência de raios-X e espectroscopia de reflectância de fibra óptica, juntamente com um algoritmo de IA personalizado chamado SAPNet, os pesquisadores identificaram com precisão a composição do pigmento, incluindo branco de titânio e até 75% de outros pigmentos. Essa descoberta demonstra o potencial significativo da IA na preservação do patrimônio cultural.

O Programa de Ada Lovelace: Um Legado da Computação

2024-12-16

Este artigo mergulha no programa de Ada Lovelace para a Máquina Analítica de Babbage, projetado para calcular os números de Bernoulli. Ele explica o contexto matemático dos números de Bernoulli e a mecânica da Máquina Analítica de Babbage. Embora nunca tenha sido executado, o programa de Lovelace, com sua abordagem rigorosa, loops e rastreamento de estado de variáveis, é considerado o primeiro programa complexo do mundo, prenunciando muitos aspectos da programação moderna. O artigo analisa bugs encontrados no programa e discute o lugar de Lovelace na história da computação, destacando suas contribuições que vão além do mero cálculo; ela previu o vasto potencial do computador, superando seus contemporâneos.

Google DeepMind lança Veo 2: Um avanço na geração de vídeo com IA

2024-12-16

O Google DeepMind lançou recentemente seu mais novo modelo de geração de vídeo com IA, o Veo 2. Este modelo representa um avanço significativo em realismo, detalhe e precisão de movimento, capaz de produzir vídeos 4K de alta qualidade a partir de instruções complexas. O Veo 2 supera outros modelos líderes de geração de vídeo com IA, destacando-se na fidelidade à execução de prompts e na geração de resultados incrivelmente realistas. De close-ups extremos de um DJ a cenas detalhadas de preparação de alimentos mostrando física realista, o Veo 2 demonstra sua versatilidade em vários estilos e cenários, marcando um novo marco na geração de vídeo com IA.

Perplexity supera o Google como melhor mecanismo de busca

2024-12-16

Um colunista de tecnologia veterano relembra a evolução dos mecanismos de busca, dos pioneiros iniciais como AltaVista à dominância do Google e, agora, à ascensão da busca impulsionada por IA. O artigo argumenta que a dependência excessiva do Google em anúncios degradou a qualidade da busca, enquanto o Perplexity, com sua abordagem impulsionada por IA, fornecimento de links de origem e foco na experiência do usuário, surgiu como uma alternativa superior. Embora reconhecendo as imperfeições das respostas de IA, o autor destaca as fontes verificáveis do Perplexity como um diferencial fundamental, fornecendo resultados de busca mais precisos e confiáveis. O futuro do Google é incerto, e sua capacidade de recuperar sua antiga glória ainda está por ser vista.

Prêmio de US$ 1 Milhão para Competição de Codificação de IA de Código Aberto

2024-12-16

Andy Konwinski lançou o Prêmio K, uma competição de US$ 1 milhão para avançar as capacidades de codificação de IA de código aberto. A competição usa uma versão reformulada do benchmark SWE-bench, eliminando a contaminação do conjunto de testes para uma avaliação mais precisa das habilidades de codificação de modelos de IA do mundo real. Inspirado no Prêmio Netflix, Konwinski acredita que a competição impulsionará a pesquisa em IA e atrairá talentos de ponta em todo o mundo.

Inteligência da Apple: Recepção Mista aos Recursos de IA do iPhone

2024-12-16

Uma pesquisa recente revela que, embora a IA seja um fator significativo para os compradores de iPhone, os recursos de IA atuais da Apple (como ferramentas de escrita e resumos de notificações) não impressionaram a maioria dos usuários. A maioria considera que eles têm pouco ou nenhum valor. No entanto, a adição da integração do Genmoji e do ChatGPT no iOS 18.2 pode mudar essa percepção.

NVIDIA Meshtron: Geração de Malhas 3D de Alta Fidelidade em Escala

2024-12-16

Pesquisadores da NVIDIA desenvolveram o Meshtron, um modelo inovador capaz de gerar malhas 3D de alta qualidade em escala e fidelidade sem precedentes. Usando uma arquitetura autorregressiva e atenção de janela deslizante, o Meshtron representa malhas como uma sequência de tokens e utiliza uma arquitetura Hourglass Transformer para resolver eficientemente os desafios de escalabilidade e eficiência dos métodos existentes na geração de modelos 3D complexos. Gerando malhas com detalhes semelhantes aos de artistas, o Meshtron oferece forte controlabilidade com entradas como nuvens de pontos, contagem de faces e nível de criatividade, abrindo caminho para uma geração de ativos 3D mais realistas em animação, jogos e ambientes virtuais.

IA

Estudo: Videogames Podem Aumentar o QI de Crianças

2024-12-16

Um estudo com quase 10.000 crianças americanas de 9 a 10 anos revelou que crianças que passavam mais tempo jogando videogame obtiveram pontuações mais altas em testes de QI. Os pesquisadores controlaram fatores genéticos e socioeconômicos, descobrindo que o aumento do tempo de jogo se correlacionou com melhores pontuações em compreensão de leitura, processamento visual-espacial e tarefas cognitivas, resultando em um aumento médio de 2,5 pontos no QI. Embora o estudo tenha se concentrado em crianças americanas e não tenha diferenciado os tipos de jogos, ele oferece insights valiosos, desafiando a crença de longa data de que jogos prejudicam as crianças. Mais pesquisas são necessárias para estabelecer a causalidade e explorar outros fatores contribuintes.

Microsoft apresenta Phi-4: novo modelo de linguagem pequeno que se destaca no raciocínio complexo

2024-12-15

A Microsoft lançou o Phi-4, seu mais recente modelo de linguagem pequeno (SLM) com 14 bilhões de parâmetros, que supera modelos maiores em tarefas de raciocínio complexo, particularmente em matemática, superando até mesmo o Gemini Pro 1.5 em problemas de competições matemáticas. Essa conquista é atribuída a conjuntos de dados sintéticos e orgânicos de alta qualidade e inovações pós-treinamento. Atualmente disponível no Azure AI Foundry sob um MSRLA, o Phi-4 será lançado no Hugging Face na próxima semana. A Microsoft enfatiza seu compromisso com o desenvolvimento responsável de IA, integrando recursos de segurança robustos ao design e implantação do Phi-4.

Ataque Best-of-N: Quebrando Sistemas de IA

2024-12-15

Pesquisadores desenvolveram um novo algoritmo de ataque de IA chamado Best-of-N (BoN). Este algoritmo de caixa-preta modifica repetidamente prompts — embaralhando aleatoriamente ou colocando em maiúsculas texto, por exemplo — até obter uma resposta prejudicial do sistema de IA. O BoN atingiu taxas de sucesso de ataque (ASRs) impressionantemente altas em modelos de linguagem de código fechado, como GPT-4o (89%) e Claude 3.5 Sonnet (78%), contornando efetivamente as defesas existentes. Além disso, o BoN se estende perfeitamente a modelos de linguagem visual e de áudio, destacando a vulnerabilidade de até mesmo sistemas de IA avançados a variações de entrada aparentemente inócuas. Esta pesquisa destaca preocupações significativas de segurança no campo da IA.

Visualização de IA: Redes de Rodovias Urbanas Semelhantes

2024-12-15

O site similar-cities usa IA para visualizar as relações entre cidades comparando as semelhanças de suas redes de rodovias. Ele emprega um algoritmo único de 'caminhada de bêbado', calculando a similaridade de caminhos aleatórios dentro das redes de rodovias para avaliar a similaridade estrutural. Os dados são obtidos do OpenStreetMap, abrangendo aproximadamente 2500 cidades. O projeto é de código aberto, fornecendo explicações detalhadas do algoritmo e código, e recebe mais dados de cidades para melhorar a precisão.

2 4