Category: IA

Não use a similaridade de cosseno descuidadamente!

2025-01-14
Não use a similaridade de cosseno descuidadamente!

Este artigo explora os riscos de depender excessivamente da similaridade de cosseno para comparações vetoriais em ciência de dados. O autor argumenta que, embora computacionalmente simples, a similaridade de cosseno frequentemente falha em capturar a similaridade semântica e pode ser facilmente enganada por padrões superficiais, como estilo de escrita e erros de digitação. O artigo usa exemplos para ilustrar esse problema e propõe vários métodos aprimorados, incluindo: usar diretamente LLMs para comparação, ajuste fino ou aprendizado por transferência para criar embeddings específicos da tarefa, engenharia de prompts prévios e pré-processamento de texto. O autor enfatiza a importância de escolher métricas de similaridade apropriadas com base em necessidades específicas, em vez de usar cegamente a similaridade de cosseno.

Glicol: Um Gerador de Imagens de IA Revolucionário

2025-01-14

Glicol é mais do que um gerador de imagens; é um artista digital. Usando algoritmos e modelos exclusivos, ele transforma descrições de texto em imagens com estilos diversos e detalhes ricos. Ele vai além dos estilos de imagem comuns, produzindo resultados impressionantes com ajustes sutis do usuário. Glicol anuncia uma nova era na geração de imagens de IA, oferecendo ferramentas criativas sem precedentes para artistas e designers.

Treinamento de IA pode não precisar de enormes centros de dados

2025-01-14
Treinamento de IA pode não precisar de enormes centros de dados

Gigantes da tecnologia estão competindo para construir enormes centros de dados com dezenas ou até centenas de milhares de GPUs para treinar modelos de IA. No entanto, um artigo na *The Economist* sugere que essa tendência pode mudar em breve. O treinamento de modelos de IA no futuro pode não exigir uma infraestrutura de hardware massiva, potencialmente eliminando a necessidade de hardware dedicado. Avanços em computação distribuída e novos algoritmos permitirão o treinamento de modelos de IA complexos em redes de computadores comuns, reduzindo significativamente a barreira de entrada para pesquisa em IA e promovendo uma adoção mais ampla da tecnologia de IA.

Agentes de IA superarão as pessoas como principais usuários de aplicativos até 2030

2025-01-14
Agentes de IA superarão as pessoas como principais usuários de aplicativos até 2030

A Accenture prevê uma mudança significativa: até 2030, os agentes de IA serão os principais usuários da maioria dos sistemas digitais corporativos, superando o uso de aplicativos até 2032. Este 'Big Bang Binário', marcado por modelos de base de IA quebrando a barreira da linguagem natural, remodelará como projetamos, usamos e operamos a tecnologia. O desenvolvimento futuro se concentrará em sistemas agentivos, núcleo digital e interfaces de usuário generativas, construídos em blocos componíveis. A Accenture recomenda experimentação interna com agentes, começando pequeno e expandindo a funcionalidade ao longo do tempo. É crucial manter a transparência, a explicabilidade e a confiança nesses agentes.

Voyage-code-3: Recuperação de código mais precisa com custos reduzidos

2025-01-14
Voyage-code-3: Recuperação de código mais precisa com custos reduzidos

A Voyage AI lançou o Voyage-code-3, um modelo de embedding de recuperação de código de próxima geração que supera o OpenAI-v3-large e o CodeSage-large em uma média de 13,80% e 16,81% em 32 conjuntos de dados. Aproveitando o aprendizado Matryoshka e a quantização (int8 e binário), o Voyage-code-3 reduz drasticamente os custos de armazenamento e pesquisa com impacto mínimo na qualidade de recuperação. Suporta embeddings de 2048, 1024, 512 e 256 dimensões e vários formatos de quantização, e possui um comprimento de contexto de 32K tokens. Treinado em um corpus de código massivo e diversificado, o Voyage-code-3 se destaca na recuperação de código, especialmente no tratamento de raciocínio algorítmico e sintaxe nuances, e foi rigorosamente avaliado para robustez e precisão.

3Dify: Gerador Gratuito de Modelos 3D a Partir de Imagens 2D com IA

2025-01-14

O 3Dify é uma ferramenta gratuita e impulsionada por IA que transforma imagens 2D em modelos 3D profissionais. Basta carregar sua imagem, e a IA remove automaticamente o fundo e gera um ativo 3D nos formatos GLB ou Gaussiano. Ideal para desenvolvimento de jogos, impressão 3D e projetos comerciais, o 3Dify oferece uma plataforma fácil de usar com uploads e downloads ilimitados. Embora atualmente limitado a imagens de um único objeto e possa exigir ajustes para modelos complexos, sua natureza gratuita e acessível o torna um recurso valioso para criadores.

IA

Resolvendo um Problema de Classificação de 350 Imagens com GPT-4

2025-01-13

Uma pequena empresa de IA enfrentou um desafio de reconhecimento de imagem: identificar 350 ilustrações de carros muito semelhantes. Abordagens tradicionais de visão computacional e realidade aumentada falharam. A equipe tentou aprendizado de transferência MobileNet e aumento de dados, mas os resultados foram inconsistentes. Finalmente, eles combinaram inteligentemente uma busca de incorporação de imagem baseada em KNN com GPT-4, enviando imagens candidatas para o GPT-4 para correspondência final. Embora não seja perfeito, essa solução melhorou significativamente a precisão e foi aplicada com sucesso em um aplicativo de museu, melhorando também a linha de produtos principal da empresa. Isso demonstra como os grandes modelos de linguagem estão se tornando ferramentas versáteis no desenvolvimento de produtos, simplificando o processo de aplicação de IA.

A Entropia da Saída de Modelos de Linguagem Grandes: Uma Perspectiva da Teoria da Informação

2025-01-13

Esta publicação explora a saída de modelos de linguagem grandes (LLMs como o ChatGPT) de uma perspectiva da teoria da informação. O autor calcula a entropia de cada token de saída para medir a certeza do modelo ao prever o próximo token. Experimentos mostram entropia mais baixa (maior certeza) no final das frases ou fragmentos de palavras, e entropia mais alta (mais incerteza) em declarações descritivas. Uma comparação dos tipos de tokens em entropia baixa versus alta revela que a entropia baixa geralmente se correlaciona com declarações factuais (contendo nomes próprios), enquanto a entropia alta se correlaciona com declarações descritivas. Um exemplo em tâmil é usado para ilustração adicional, enfatizando a importância de discernir a verdade da falsidade.

Ferramentas de IA e Pensamento Crítico: Um Estudo sobre Descarga Cognitiva

2025-01-13
Ferramentas de IA e Pensamento Crítico: Um Estudo sobre Descarga Cognitiva

Um estudo de métodos mistos com 666 participantes revelou uma correlação negativa significativa entre o uso frequente de ferramentas de IA e habilidades de pensamento crítico, mediada pela descarga cognitiva. Participantes mais jovens mostraram maior dependência de ferramentas de IA e pontuações mais baixas em pensamento crítico em comparação com participantes mais velhos. O estudo destaca os potenciais custos cognitivos da dependência de IA, oferecendo recomendações para estratégias educacionais para mitigar seus efeitos negativos no pensamento crítico.

FurtherAI: Revolucionando fluxos de trabalho de seguros com IA

2025-01-12
FurtherAI: Revolucionando fluxos de trabalho de seguros com IA

A FurtherAI, uma startup apoiada por investidores de primeira linha, incluindo a Y Combinator, está construindo colegas de IA para automatizar os fluxos de trabalho de seguros. Esses IAs podem lidar com documentos não estruturados, entrada de dados e até mesmo chamadas telefônicas. Sua missão é criar uma IA tão confiável, adaptável e em constante aprendizado quanto um funcionário humano. Eles estão atualmente contratando para várias funções, incluindo designers de produtos, engenheiros de pesquisa aplicada e engenheiros de software, oferecendo oportunidades emocionantes para aqueles interessados em IA e seguros.

IA

Informações desatualizadas em LLMs: como as probabilidades de tokens criam inconsistências lógicas

2025-01-12
Informações desatualizadas em LLMs: como as probabilidades de tokens criam inconsistências lógicas

Modelos de linguagem grandes (LLMs) como o ChatGPT, treinados em conjuntos de dados massivos da internet, frequentemente enfrentam informações conflitantes ou desatualizadas. Este artigo usa a altura do Monte Bartle Frere como um estudo de caso, mostrando como os LLMs nem sempre priorizam as informações mais recentes. Em vez disso, eles fazem previsões com base em distribuições de probabilidade aprendidas de seus dados de treinamento. Mesmo modelos avançados como o GPT-4o podem produzir informações desatualizadas dependendo de variações sutis no prompt. Isso não é uma simples 'alucinação', mas uma consequência do modelo aprender múltiplas possibilidades e ajustar as probabilidades com base no contexto. O autor destaca a importância de entender as limitações dos LLMs, evitando a dependência excessiva e enfatizando a transparência.

LLMs Contemplativos: Um Experimento Viral de Engenharia de Prompt

2025-01-12
LLMs Contemplativos: Um Experimento Viral de Engenharia de Prompt

O experimento de Maharshi no X (antigo Twitter) viralizou: um prompt projetado para fazer LLMs como Claude e GPT-4 'contemplar' antes de responder. Inspirado no modelo o1 da OpenAI, que usa aprendizado por reforço e 'cálculo em tempo de teste' para raciocínio aprimorado, o prompt incentiva LLMs a explorar múltiplas possibilidades, questionar suposições e imitar processos de pensamento humano. Ele enfatiza a exploração sobre conclusões imediatas, raciocínio profundo, mostrando o processo de pensamento e persistência. Embora eficaz para tarefas complexas, o autor adverte contra potenciais alucinações. A estrutura do prompt usa tags XML para separar a fase de contemplação e a resposta final, guiando o LLM com frases específicas para melhorar a clareza e precisão.

Microsoft lança Phi-4: Modelo de linguagem aberto de 14 bilhões de parâmetros

2025-01-12
Microsoft lança Phi-4: Modelo de linguagem aberto de 14 bilhões de parâmetros

A Microsoft revelou o Phi-4, um novo modelo de linguagem aberto com 14 bilhões de parâmetros. Construído usando uma combinação de dados sintéticos, sites de domínio público filtrados e livros acadêmicos e conjuntos de dados de perguntas e respostas, o Phi-4 possui um rigoroso processo de aprimoramento e alinhamento, garantindo o seguimento preciso de instruções e medidas de segurança robustas. Com um comprimento de contexto de 16k tokens, ele foi projetado para sistemas e aplicativos de IA de uso geral (principalmente em inglês) que precisam de ambientes com restrições de memória/computação, baixa latência e fortes capacidades de raciocínio e lógica. A Microsoft enfatiza que os desenvolvedores devem considerar as limitações dos modelos de linguagem e mitigar a precisão, segurança e justiça, especialmente em cenários de alto risco.

IA

IA nos anos 80: Um jogo simples de adivinhação de animais que foi pioneiro no aprendizado de máquina

2025-01-12
IA nos anos 80: Um jogo simples de adivinhação de animais que foi pioneiro no aprendizado de máquina

Este artigo relata um jogo simples, "Adivinhe o Animal", escrito em BASIC na década de 1980. Usando uma árvore de decisão, o jogo faz perguntas de sim/não para adivinhar o animal. O mais importante é que ele aprende com os erros, adicionando novas perguntas e respostas ao seu banco de conhecimento e salvando/carregando o progresso. Isso mostra as explorações iniciais de algoritmos treináveis, anteriores ao hype da IA moderna. O autor recriou o algoritmo em C++, comparando as vantagens e desvantagens de ambas as implementações. O artigo destaca como mesmo ideias simples, como árvores de decisão e aprendizado próprio, anteciparam a IA moderna.

Problemas do 'córtex pré-frontal' do ChatGPT: Um experimento curioso em testes cognitivos de IA

2025-01-12
Problemas do 'córtex pré-frontal' do ChatGPT: Um experimento curioso em testes cognitivos de IA

O autor aplicou uma série de testes cognitivos, incluindo o teste de desenho de relógio, ao ChatGPT, revelando sintomas semelhantes aos exibidos por humanos com danos no córtex pré-frontal, como organização espacial deficiente e déficits de planejamento. Embora o ChatGPT possa gerar programaticamente imagens corretas de relógios, ele falha consistentemente ao desenhar diretamente ou descrevê-las textualmente. Isso leva o autor a ponderar as habilidades cognitivas da IA, os mecanismos de supervisão e os riscos éticos de dotar a IA de funções cognitivas superiores. A conclusão é que os modelos de IA atuais lutam com tarefas humanas, levando a sugestões para governança e legislação de IA.

Robótica vs. IA: Desvendando os equívocos sobre complexidade

2025-01-11

Este artigo aborda equívocos comuns sobre as complexidades da robótica versus IA. O autor argumenta que as pessoas frequentemente confundem os dois campos, assumindo que os avanços em IA se traduzem diretamente em avanços na robótica. No entanto, o desafio central na robótica reside na natureza intrincada do controle sensório-motor, muito mais difícil do que comumente percebido. Isso se alinha com o Paradoxo de Moravec: habilidades sensório-motoras de baixo nível são mais difíceis de replicar do que o raciocínio de alto nível. O autor explica ainda como as soluções atuais de IA dependem de imensa capacidade de computação e conjuntos de dados massivos, condições difíceis de replicar em robótica. Limitações de hardware, gargalos de dados e velocidade do modelo também são discutidos, juntamente com uma perspectiva voltada para o futuro sobre o desenvolvimento futuro da robótica.

Previsões de IA/LLM: 1, 3 e 6 anos no futuro

2025-01-11

Simon Willison compartilhou suas previsões para o desenvolvimento de IA/LLM nos próximos 1, 3 e 6 anos no podcast Oxide and Friends. Ele antecipa que agentes de IA de propósito geral não se concretizarão em breve, mas assistentes de código e pesquisa prosperarão. Dentro de três anos, a reportagem investigativa assistida por IA poderá ganhar um Prêmio Pulitzer, juntamente com leis de privacidade mais rígidas. Seis anos depois, a IA poderá produzir arte incrível, mas também poderá levar a distúrbios civis generalizados, dependendo do desenvolvimento e impacto econômico da AGI/ASI. Willison enfatiza sua baixa confiança nessas previsões, oferecendo-as como um ponto interessante de reflexão futura.

Primeiro do Mundo: Clonagem de Voz com IA em Apenas 3 Segundos!

2025-01-10

AnyVoice apresenta uma tecnologia de IA inovadora que cria clones de voz hiper-realistas a partir de apenas 3 segundos de áudio. Esta tecnologia revolucionária acelera drasticamente o processo de clonagem de voz, eliminando a necessidade de gravações longas. Atualmente suporta inglês, chinês, japonês e coreano, o serviço requer que os usuários gravem uma amostra de áudio de 3 a 10 segundos em um ambiente silencioso. O uso comercial é permitido com uma licença comercial.

Rumo ao Raciocínio do Sistema 2 em LLMs: Aprendendo a Pensar com Meta Chain-of-Thought

2025-01-10
Rumo ao Raciocínio do Sistema 2 em LLMs: Aprendendo a Pensar com Meta Chain-of-Thought

Os pesquisadores propõem uma nova estrutura, Meta Chain-of-Thought (Meta-CoT), que estende o Chain-of-Thought (CoT) tradicional modelando explicitamente o raciocínio subjacente necessário para chegar a um determinado CoT. A Meta-CoT utiliza supervisão de processo, geração de dados sintéticos e algoritmos de busca. O artigo descreve um pipeline de treinamento que incorpora ajuste de instruções com rastros de busca linearizados e aprendizado por reforço. Este trabalho fornece um roteiro para habilitar Meta-CoT em LLMs, prometendo um raciocínio mais poderoso e semelhante ao humano em IA.

Agentes Não São Suficientes: Uma Nova Perspectiva no Desenvolvimento de IA

2025-01-10
Agentes Não São Suficientes: Uma Nova Perspectiva no Desenvolvimento de IA

Um artigo recente no arXiv, "Agentes Não São Suficientes", argumenta que, embora os agentes de IA estejam experimentando um ressurgimento, depender apenas da IA generativa é insuficiente para o seu maior sucesso. Os autores propõem um ecossistema futuro de IA compreendendo três componentes principais: Agentes, Sims (simulando preferências e comportamentos do usuário) e Assistentes (interagindo diretamente com os usuários e coordenando a execução de tarefas). Ao examinar experiências passadas com agentes, o artigo destaca a necessidade de construir sistemas de agentes de IA mais eficazes e sustentáveis.

Previsões de IA, robótica e exploração espacial de 2025: Hype vs. Realidade

2025-01-10

A revisão das previsões de Ano Novo de 2025 do fundador do MIT AI Lab, Rodney Brooks, resume suas previsões de 2018 sobre carros autônomos, robótica, IA e exploração espacial. Ele observa que o hype da IA distorce significativamente a compreensão da realidade, com muitas previsões de que a IA substituirá empregos humanos não sendo cumpridas. A tecnologia de direção autônoma progride lentamente, não cumprindo a promessa de veículos totalmente autônomos. A robótica enfrenta desafios semelhantes, com robôs humanoides longe de aplicações práticas. Na exploração espacial, embora o voo espacial comercial mostre progresso, está longe de atingir as expectativas. Brooks enfatiza a importância de avaliar racionalmente os avanços tecnológicos e evitar o hype, pois verdadeiras inovações tecnológicas exigem tempo e esforço contínuo.

IA

OpenAI proíbe engenheiro que criou rifle de sentinela robótico com ChatGPT

2025-01-09
OpenAI proíbe engenheiro que criou rifle de sentinela robótico com ChatGPT

Um engenheiro, conhecido como STS 3D, criou um rifle de sentinela robótico controlado pela API ChatGPT da OpenAI, gerando um debate acalorado sobre a militarização da IA. O sistema, mostrado disparando projéteis de festim em um vídeo viral, levou a OpenAI a banir rapidamente o engenheiro por violar suas políticas de uso, que proíbem o uso de seus serviços para desenvolver ou implantar armas. Embora a OpenAI tenha removido a linguagem que restringia aplicações militares no ano passado, ela mantém a proibição do uso de seu serviço para prejudicar outras pessoas. Esse incidente destaca os perigos potenciais da IA e a necessidade de regulamentações rigorosas em seu uso.

Zuckerberg Autorizou Meta a Treinar Llama com Obras com Direitos Autorais, Diz Processo

2025-01-09
Zuckerberg Autorizou Meta a Treinar Llama com Obras com Direitos Autorais, Diz Processo

O CEO do Meta, Mark Zuckerberg, teria aprovado o uso de um conjunto de dados chamado LibGen, contendo ebooks e artigos piratas, para treinar os modelos de IA Llama do Meta. Os autores, incluindo os autores de best-sellers Sarah Silverman e Ta-Nehisi Coates, acusam o Meta de violação de direitos autorais. O Meta alega uso justo, mas os autores argumentam que o Meta tentou ocultar a violação removendo informações de direitos autorais e até mesmo usando torrent para obter o LibGen, exacerbando a violação. O caso atualmente se refere apenas aos modelos Llama mais antigos do Meta, e o resultado ainda é incerto, mas as alegações já prejudicaram a reputação do Meta.

Nvidia lança Cosmos WFMs: Modelos de mundo abertos com consciência física

2025-01-09
Nvidia lança Cosmos WFMs: Modelos de mundo abertos com consciência física

Na CES 2025, a Nvidia lançou os Cosmos World Foundation Models (Cosmos WFMs), uma família de modelos de mundo de IA capazes de prever e gerar vídeos com consciência física. Esses modelos, categorizados como Nano, Super e Ultra com base em tamanho e desempenho (4 a 14 bilhões de parâmetros), são projetados para robótica, direção autônoma e muito mais. Embora a Nvidia os chame de 'abertos', eles não são totalmente de código aberto, e seus dados de treinamento, que supostamente incluem vídeos do YouTube não autorizados, são controversos. Apesar disso, várias empresas já adotaram os Cosmos WFMs para vários casos de uso.

NeuralSVG: Representação Neural Implícita para Geração de Texto para Vetor

2025-01-08
NeuralSVG: Representação Neural Implícita para Geração de Texto para Vetor

O NeuralSVG gera gráficos vetoriais a partir de prompts de texto, usando uma representação neural implícita (semelhante a NeRFs) codificada em uma pequena rede MLP e otimizada usando Amostragem de Destilação de Pontuação (SDS). Uma técnica de regularização baseada em dropout garante formas ordenadas e editáveis com uma estrutura em camadas. O modelo suporta controle dinâmico de aspectos como cor de fundo e proporção, tudo a partir de uma única representação aprendida. Experimentos mostram que o NeuralSVG supera os métodos existentes na geração de SVGs estruturados e flexíveis.

Engenheiro(a) de Machine Learning na Two Dots (YC)

2025-01-08
Engenheiro(a) de Machine Learning na Two Dots (YC)

A Two Dots, uma startup de fintech apoiada pelo Y Combinator, está contratando um(a) Engenheiro(a) de Machine Learning com salário de US$ 200.000 a US$ 250.000. Eles estão usando IA para revolucionar o processo de empréstimos, com o objetivo de prevenir futuras crises financeiras como a de 2008. A função envolve a manutenção de pipelines de aprendizado de máquina (imagens de documentos, linguagem natural, números) e requer fortes habilidades de trabalho em equipe. É um cargo híbrido em São Francisco, com 5 dias por semana no escritório.

IA

Estudos de resolvedores SAT I: Uma imersão na satisfação booleana

2025-01-08
Estudos de resolvedores SAT I: Uma imersão na satisfação booleana

Esta postagem de blog explora o fascinante mundo dos resolvedores SAT, traçando sua evolução de abordagens simples de força bruta a algoritmos sofisticados como Davis-Putnam e Aprendizado de Cláusulas Orientado a Conflitos (CDCL). Ele compara diferentes técnicas, destacando avanços recentes, como fechamento de congruência, varredura de equivalência de cláusulas e adição de variáveis ​​limitadas que melhoraram drasticamente o desempenho. O autor fornece exemplos de código Python que ilustram resolvedores de força bruta, baseados em Davis-Putnam e em loop de cláusulas fornecidas. A postagem também aborda técnicas de avaliação parcial e direções futuras de pesquisa, tornando-se uma leitura convincente para quem se interessa pelas intrincadas da satisfação booleana.

Revisando os Autômatos Celulares de Barricelli: Geração Espontânea de Vida

2025-01-07

Este artigo explora o trabalho de Nils Aall Barricelli, que foi pioneiro em autômatos celulares 15 anos antes de John Conway. O modelo de 'simbioorganismos' de Barricelli, em um espaço 1D circular finito, simula o movimento e a interação de diferentes elementos por meio de regras simples de eliminação por colisão, replicação posicional e mutação. As simulações revelam que, mesmo com regras simples, padrões periódicos estáveis emergem espontaneamente, assemelhando-se à geração espontânea da vida. O autor aprofunda a estabilidade desses padrões e propõe combinar simulações do universo primitivo com simulações de abiogênese para encontrar maneiras mais eficientes de explorar as origens da vida.

NVIDIA lança Project DIGITS: supercomputador de IA para todos

2025-01-07
NVIDIA lança Project DIGITS: supercomputador de IA para todos

A NVIDIA revelou o Project DIGITS, um supercomputador pessoal de IA baseado na plataforma Grace Blackwell. Este dispositivo, com preço inicial de US$ 3.000, democratiza o acesso à poderosa computação de IA para pesquisadores, cientistas de dados e estudantes. O superchip GB10 oferece até 1 petaflop de desempenho de IA, permitindo a execução de modelos de linguagem grandes com 200 bilhões de parâmetros. Os usuários podem desenvolver e executar inferências em seus desktops e, em seguida, implantar perfeitamente em infraestrutura de nuvem ou data center. O Project DIGITS visa tornar a supercomputação de IA acessível a milhões, acelerando a inovação em IA.

Google DeepMind cria equipe de IA para 'modelagem de mundo' com foco em AGI

2025-01-07
Google DeepMind cria equipe de IA para 'modelagem de mundo' com foco em AGI

O Google DeepMind está formando uma nova equipe de pesquisa em IA focada no desenvolvimento de "modelos de mundo" capazes de simular ambientes físicos. Liderada por Tim Brooks, ex-co-líder do projeto Sora da OpenAI, a equipe visa alavancar o pré-treinamento em massa de dados de vídeo e multimodais para avançar o desenvolvimento de AGI. Esta iniciativa impulsionará aplicações em jogos, treinamento de robôs e muito mais, incluindo raciocínio visual e simulação, planejamento para agentes incorporados e entretenimento interativo em tempo real. Isso demonstra o esforço intensificado do Google na corrida pela AGI, competindo com rivais como a OpenAI.

1 2 41 42 43 45 47 48 49 50 51 52