Category: IA

Resolvendo um Problema de Classificação de 350 Imagens com GPT-4

2025-01-13

Uma pequena empresa de IA enfrentou um desafio de reconhecimento de imagem: identificar 350 ilustrações de carros muito semelhantes. Abordagens tradicionais de visão computacional e realidade aumentada falharam. A equipe tentou aprendizado de transferência MobileNet e aumento de dados, mas os resultados foram inconsistentes. Finalmente, eles combinaram inteligentemente uma busca de incorporação de imagem baseada em KNN com GPT-4, enviando imagens candidatas para o GPT-4 para correspondência final. Embora não seja perfeito, essa solução melhorou significativamente a precisão e foi aplicada com sucesso em um aplicativo de museu, melhorando também a linha de produtos principal da empresa. Isso demonstra como os grandes modelos de linguagem estão se tornando ferramentas versáteis no desenvolvimento de produtos, simplificando o processo de aplicação de IA.

A Entropia da Saída de Modelos de Linguagem Grandes: Uma Perspectiva da Teoria da Informação

2025-01-13

Esta publicação explora a saída de modelos de linguagem grandes (LLMs como o ChatGPT) de uma perspectiva da teoria da informação. O autor calcula a entropia de cada token de saída para medir a certeza do modelo ao prever o próximo token. Experimentos mostram entropia mais baixa (maior certeza) no final das frases ou fragmentos de palavras, e entropia mais alta (mais incerteza) em declarações descritivas. Uma comparação dos tipos de tokens em entropia baixa versus alta revela que a entropia baixa geralmente se correlaciona com declarações factuais (contendo nomes próprios), enquanto a entropia alta se correlaciona com declarações descritivas. Um exemplo em tâmil é usado para ilustração adicional, enfatizando a importância de discernir a verdade da falsidade.

Ferramentas de IA e Pensamento Crítico: Um Estudo sobre Descarga Cognitiva

2025-01-13
Ferramentas de IA e Pensamento Crítico: Um Estudo sobre Descarga Cognitiva

Um estudo de métodos mistos com 666 participantes revelou uma correlação negativa significativa entre o uso frequente de ferramentas de IA e habilidades de pensamento crítico, mediada pela descarga cognitiva. Participantes mais jovens mostraram maior dependência de ferramentas de IA e pontuações mais baixas em pensamento crítico em comparação com participantes mais velhos. O estudo destaca os potenciais custos cognitivos da dependência de IA, oferecendo recomendações para estratégias educacionais para mitigar seus efeitos negativos no pensamento crítico.

FurtherAI: Revolucionando fluxos de trabalho de seguros com IA

2025-01-12
FurtherAI: Revolucionando fluxos de trabalho de seguros com IA

A FurtherAI, uma startup apoiada por investidores de primeira linha, incluindo a Y Combinator, está construindo colegas de IA para automatizar os fluxos de trabalho de seguros. Esses IAs podem lidar com documentos não estruturados, entrada de dados e até mesmo chamadas telefônicas. Sua missão é criar uma IA tão confiável, adaptável e em constante aprendizado quanto um funcionário humano. Eles estão atualmente contratando para várias funções, incluindo designers de produtos, engenheiros de pesquisa aplicada e engenheiros de software, oferecendo oportunidades emocionantes para aqueles interessados em IA e seguros.

IA

Informações desatualizadas em LLMs: como as probabilidades de tokens criam inconsistências lógicas

2025-01-12
Informações desatualizadas em LLMs: como as probabilidades de tokens criam inconsistências lógicas

Modelos de linguagem grandes (LLMs) como o ChatGPT, treinados em conjuntos de dados massivos da internet, frequentemente enfrentam informações conflitantes ou desatualizadas. Este artigo usa a altura do Monte Bartle Frere como um estudo de caso, mostrando como os LLMs nem sempre priorizam as informações mais recentes. Em vez disso, eles fazem previsões com base em distribuições de probabilidade aprendidas de seus dados de treinamento. Mesmo modelos avançados como o GPT-4o podem produzir informações desatualizadas dependendo de variações sutis no prompt. Isso não é uma simples 'alucinação', mas uma consequência do modelo aprender múltiplas possibilidades e ajustar as probabilidades com base no contexto. O autor destaca a importância de entender as limitações dos LLMs, evitando a dependência excessiva e enfatizando a transparência.

LLMs Contemplativos: Um Experimento Viral de Engenharia de Prompt

2025-01-12
LLMs Contemplativos: Um Experimento Viral de Engenharia de Prompt

O experimento de Maharshi no X (antigo Twitter) viralizou: um prompt projetado para fazer LLMs como Claude e GPT-4 'contemplar' antes de responder. Inspirado no modelo o1 da OpenAI, que usa aprendizado por reforço e 'cálculo em tempo de teste' para raciocínio aprimorado, o prompt incentiva LLMs a explorar múltiplas possibilidades, questionar suposições e imitar processos de pensamento humano. Ele enfatiza a exploração sobre conclusões imediatas, raciocínio profundo, mostrando o processo de pensamento e persistência. Embora eficaz para tarefas complexas, o autor adverte contra potenciais alucinações. A estrutura do prompt usa tags XML para separar a fase de contemplação e a resposta final, guiando o LLM com frases específicas para melhorar a clareza e precisão.

Microsoft lança Phi-4: Modelo de linguagem aberto de 14 bilhões de parâmetros

2025-01-12
Microsoft lança Phi-4: Modelo de linguagem aberto de 14 bilhões de parâmetros

A Microsoft revelou o Phi-4, um novo modelo de linguagem aberto com 14 bilhões de parâmetros. Construído usando uma combinação de dados sintéticos, sites de domínio público filtrados e livros acadêmicos e conjuntos de dados de perguntas e respostas, o Phi-4 possui um rigoroso processo de aprimoramento e alinhamento, garantindo o seguimento preciso de instruções e medidas de segurança robustas. Com um comprimento de contexto de 16k tokens, ele foi projetado para sistemas e aplicativos de IA de uso geral (principalmente em inglês) que precisam de ambientes com restrições de memória/computação, baixa latência e fortes capacidades de raciocínio e lógica. A Microsoft enfatiza que os desenvolvedores devem considerar as limitações dos modelos de linguagem e mitigar a precisão, segurança e justiça, especialmente em cenários de alto risco.

IA

IA nos anos 80: Um jogo simples de adivinhação de animais que foi pioneiro no aprendizado de máquina

2025-01-12
IA nos anos 80: Um jogo simples de adivinhação de animais que foi pioneiro no aprendizado de máquina

Este artigo relata um jogo simples, "Adivinhe o Animal", escrito em BASIC na década de 1980. Usando uma árvore de decisão, o jogo faz perguntas de sim/não para adivinhar o animal. O mais importante é que ele aprende com os erros, adicionando novas perguntas e respostas ao seu banco de conhecimento e salvando/carregando o progresso. Isso mostra as explorações iniciais de algoritmos treináveis, anteriores ao hype da IA moderna. O autor recriou o algoritmo em C++, comparando as vantagens e desvantagens de ambas as implementações. O artigo destaca como mesmo ideias simples, como árvores de decisão e aprendizado próprio, anteciparam a IA moderna.

Problemas do 'córtex pré-frontal' do ChatGPT: Um experimento curioso em testes cognitivos de IA

2025-01-12
Problemas do 'córtex pré-frontal' do ChatGPT: Um experimento curioso em testes cognitivos de IA

O autor aplicou uma série de testes cognitivos, incluindo o teste de desenho de relógio, ao ChatGPT, revelando sintomas semelhantes aos exibidos por humanos com danos no córtex pré-frontal, como organização espacial deficiente e déficits de planejamento. Embora o ChatGPT possa gerar programaticamente imagens corretas de relógios, ele falha consistentemente ao desenhar diretamente ou descrevê-las textualmente. Isso leva o autor a ponderar as habilidades cognitivas da IA, os mecanismos de supervisão e os riscos éticos de dotar a IA de funções cognitivas superiores. A conclusão é que os modelos de IA atuais lutam com tarefas humanas, levando a sugestões para governança e legislação de IA.

Robótica vs. IA: Desvendando os equívocos sobre complexidade

2025-01-11

Este artigo aborda equívocos comuns sobre as complexidades da robótica versus IA. O autor argumenta que as pessoas frequentemente confundem os dois campos, assumindo que os avanços em IA se traduzem diretamente em avanços na robótica. No entanto, o desafio central na robótica reside na natureza intrincada do controle sensório-motor, muito mais difícil do que comumente percebido. Isso se alinha com o Paradoxo de Moravec: habilidades sensório-motoras de baixo nível são mais difíceis de replicar do que o raciocínio de alto nível. O autor explica ainda como as soluções atuais de IA dependem de imensa capacidade de computação e conjuntos de dados massivos, condições difíceis de replicar em robótica. Limitações de hardware, gargalos de dados e velocidade do modelo também são discutidos, juntamente com uma perspectiva voltada para o futuro sobre o desenvolvimento futuro da robótica.

Previsões de IA/LLM: 1, 3 e 6 anos no futuro

2025-01-11

Simon Willison compartilhou suas previsões para o desenvolvimento de IA/LLM nos próximos 1, 3 e 6 anos no podcast Oxide and Friends. Ele antecipa que agentes de IA de propósito geral não se concretizarão em breve, mas assistentes de código e pesquisa prosperarão. Dentro de três anos, a reportagem investigativa assistida por IA poderá ganhar um Prêmio Pulitzer, juntamente com leis de privacidade mais rígidas. Seis anos depois, a IA poderá produzir arte incrível, mas também poderá levar a distúrbios civis generalizados, dependendo do desenvolvimento e impacto econômico da AGI/ASI. Willison enfatiza sua baixa confiança nessas previsões, oferecendo-as como um ponto interessante de reflexão futura.

Primeiro do Mundo: Clonagem de Voz com IA em Apenas 3 Segundos!

2025-01-10

AnyVoice apresenta uma tecnologia de IA inovadora que cria clones de voz hiper-realistas a partir de apenas 3 segundos de áudio. Esta tecnologia revolucionária acelera drasticamente o processo de clonagem de voz, eliminando a necessidade de gravações longas. Atualmente suporta inglês, chinês, japonês e coreano, o serviço requer que os usuários gravem uma amostra de áudio de 3 a 10 segundos em um ambiente silencioso. O uso comercial é permitido com uma licença comercial.

Rumo ao Raciocínio do Sistema 2 em LLMs: Aprendendo a Pensar com Meta Chain-of-Thought

2025-01-10
Rumo ao Raciocínio do Sistema 2 em LLMs: Aprendendo a Pensar com Meta Chain-of-Thought

Os pesquisadores propõem uma nova estrutura, Meta Chain-of-Thought (Meta-CoT), que estende o Chain-of-Thought (CoT) tradicional modelando explicitamente o raciocínio subjacente necessário para chegar a um determinado CoT. A Meta-CoT utiliza supervisão de processo, geração de dados sintéticos e algoritmos de busca. O artigo descreve um pipeline de treinamento que incorpora ajuste de instruções com rastros de busca linearizados e aprendizado por reforço. Este trabalho fornece um roteiro para habilitar Meta-CoT em LLMs, prometendo um raciocínio mais poderoso e semelhante ao humano em IA.

Agentes Não São Suficientes: Uma Nova Perspectiva no Desenvolvimento de IA

2025-01-10
Agentes Não São Suficientes: Uma Nova Perspectiva no Desenvolvimento de IA

Um artigo recente no arXiv, "Agentes Não São Suficientes", argumenta que, embora os agentes de IA estejam experimentando um ressurgimento, depender apenas da IA generativa é insuficiente para o seu maior sucesso. Os autores propõem um ecossistema futuro de IA compreendendo três componentes principais: Agentes, Sims (simulando preferências e comportamentos do usuário) e Assistentes (interagindo diretamente com os usuários e coordenando a execução de tarefas). Ao examinar experiências passadas com agentes, o artigo destaca a necessidade de construir sistemas de agentes de IA mais eficazes e sustentáveis.

Previsões de IA, robótica e exploração espacial de 2025: Hype vs. Realidade

2025-01-10

A revisão das previsões de Ano Novo de 2025 do fundador do MIT AI Lab, Rodney Brooks, resume suas previsões de 2018 sobre carros autônomos, robótica, IA e exploração espacial. Ele observa que o hype da IA distorce significativamente a compreensão da realidade, com muitas previsões de que a IA substituirá empregos humanos não sendo cumpridas. A tecnologia de direção autônoma progride lentamente, não cumprindo a promessa de veículos totalmente autônomos. A robótica enfrenta desafios semelhantes, com robôs humanoides longe de aplicações práticas. Na exploração espacial, embora o voo espacial comercial mostre progresso, está longe de atingir as expectativas. Brooks enfatiza a importância de avaliar racionalmente os avanços tecnológicos e evitar o hype, pois verdadeiras inovações tecnológicas exigem tempo e esforço contínuo.

IA

OpenAI proíbe engenheiro que criou rifle de sentinela robótico com ChatGPT

2025-01-09
OpenAI proíbe engenheiro que criou rifle de sentinela robótico com ChatGPT

Um engenheiro, conhecido como STS 3D, criou um rifle de sentinela robótico controlado pela API ChatGPT da OpenAI, gerando um debate acalorado sobre a militarização da IA. O sistema, mostrado disparando projéteis de festim em um vídeo viral, levou a OpenAI a banir rapidamente o engenheiro por violar suas políticas de uso, que proíbem o uso de seus serviços para desenvolver ou implantar armas. Embora a OpenAI tenha removido a linguagem que restringia aplicações militares no ano passado, ela mantém a proibição do uso de seu serviço para prejudicar outras pessoas. Esse incidente destaca os perigos potenciais da IA e a necessidade de regulamentações rigorosas em seu uso.

Zuckerberg Autorizou Meta a Treinar Llama com Obras com Direitos Autorais, Diz Processo

2025-01-09
Zuckerberg Autorizou Meta a Treinar Llama com Obras com Direitos Autorais, Diz Processo

O CEO do Meta, Mark Zuckerberg, teria aprovado o uso de um conjunto de dados chamado LibGen, contendo ebooks e artigos piratas, para treinar os modelos de IA Llama do Meta. Os autores, incluindo os autores de best-sellers Sarah Silverman e Ta-Nehisi Coates, acusam o Meta de violação de direitos autorais. O Meta alega uso justo, mas os autores argumentam que o Meta tentou ocultar a violação removendo informações de direitos autorais e até mesmo usando torrent para obter o LibGen, exacerbando a violação. O caso atualmente se refere apenas aos modelos Llama mais antigos do Meta, e o resultado ainda é incerto, mas as alegações já prejudicaram a reputação do Meta.

Nvidia lança Cosmos WFMs: Modelos de mundo abertos com consciência física

2025-01-09
Nvidia lança Cosmos WFMs: Modelos de mundo abertos com consciência física

Na CES 2025, a Nvidia lançou os Cosmos World Foundation Models (Cosmos WFMs), uma família de modelos de mundo de IA capazes de prever e gerar vídeos com consciência física. Esses modelos, categorizados como Nano, Super e Ultra com base em tamanho e desempenho (4 a 14 bilhões de parâmetros), são projetados para robótica, direção autônoma e muito mais. Embora a Nvidia os chame de 'abertos', eles não são totalmente de código aberto, e seus dados de treinamento, que supostamente incluem vídeos do YouTube não autorizados, são controversos. Apesar disso, várias empresas já adotaram os Cosmos WFMs para vários casos de uso.

NeuralSVG: Representação Neural Implícita para Geração de Texto para Vetor

2025-01-08
NeuralSVG: Representação Neural Implícita para Geração de Texto para Vetor

O NeuralSVG gera gráficos vetoriais a partir de prompts de texto, usando uma representação neural implícita (semelhante a NeRFs) codificada em uma pequena rede MLP e otimizada usando Amostragem de Destilação de Pontuação (SDS). Uma técnica de regularização baseada em dropout garante formas ordenadas e editáveis com uma estrutura em camadas. O modelo suporta controle dinâmico de aspectos como cor de fundo e proporção, tudo a partir de uma única representação aprendida. Experimentos mostram que o NeuralSVG supera os métodos existentes na geração de SVGs estruturados e flexíveis.

Engenheiro(a) de Machine Learning na Two Dots (YC)

2025-01-08
Engenheiro(a) de Machine Learning na Two Dots (YC)

A Two Dots, uma startup de fintech apoiada pelo Y Combinator, está contratando um(a) Engenheiro(a) de Machine Learning com salário de US$ 200.000 a US$ 250.000. Eles estão usando IA para revolucionar o processo de empréstimos, com o objetivo de prevenir futuras crises financeiras como a de 2008. A função envolve a manutenção de pipelines de aprendizado de máquina (imagens de documentos, linguagem natural, números) e requer fortes habilidades de trabalho em equipe. É um cargo híbrido em São Francisco, com 5 dias por semana no escritório.

IA

Estudos de resolvedores SAT I: Uma imersão na satisfação booleana

2025-01-08
Estudos de resolvedores SAT I: Uma imersão na satisfação booleana

Esta postagem de blog explora o fascinante mundo dos resolvedores SAT, traçando sua evolução de abordagens simples de força bruta a algoritmos sofisticados como Davis-Putnam e Aprendizado de Cláusulas Orientado a Conflitos (CDCL). Ele compara diferentes técnicas, destacando avanços recentes, como fechamento de congruência, varredura de equivalência de cláusulas e adição de variáveis ​​limitadas que melhoraram drasticamente o desempenho. O autor fornece exemplos de código Python que ilustram resolvedores de força bruta, baseados em Davis-Putnam e em loop de cláusulas fornecidas. A postagem também aborda técnicas de avaliação parcial e direções futuras de pesquisa, tornando-se uma leitura convincente para quem se interessa pelas intrincadas da satisfação booleana.

Revisando os Autômatos Celulares de Barricelli: Geração Espontânea de Vida

2025-01-07

Este artigo explora o trabalho de Nils Aall Barricelli, que foi pioneiro em autômatos celulares 15 anos antes de John Conway. O modelo de 'simbioorganismos' de Barricelli, em um espaço 1D circular finito, simula o movimento e a interação de diferentes elementos por meio de regras simples de eliminação por colisão, replicação posicional e mutação. As simulações revelam que, mesmo com regras simples, padrões periódicos estáveis emergem espontaneamente, assemelhando-se à geração espontânea da vida. O autor aprofunda a estabilidade desses padrões e propõe combinar simulações do universo primitivo com simulações de abiogênese para encontrar maneiras mais eficientes de explorar as origens da vida.

NVIDIA lança Project DIGITS: supercomputador de IA para todos

2025-01-07
NVIDIA lança Project DIGITS: supercomputador de IA para todos

A NVIDIA revelou o Project DIGITS, um supercomputador pessoal de IA baseado na plataforma Grace Blackwell. Este dispositivo, com preço inicial de US$ 3.000, democratiza o acesso à poderosa computação de IA para pesquisadores, cientistas de dados e estudantes. O superchip GB10 oferece até 1 petaflop de desempenho de IA, permitindo a execução de modelos de linguagem grandes com 200 bilhões de parâmetros. Os usuários podem desenvolver e executar inferências em seus desktops e, em seguida, implantar perfeitamente em infraestrutura de nuvem ou data center. O Project DIGITS visa tornar a supercomputação de IA acessível a milhões, acelerando a inovação em IA.

Google DeepMind cria equipe de IA para 'modelagem de mundo' com foco em AGI

2025-01-07
Google DeepMind cria equipe de IA para 'modelagem de mundo' com foco em AGI

O Google DeepMind está formando uma nova equipe de pesquisa em IA focada no desenvolvimento de "modelos de mundo" capazes de simular ambientes físicos. Liderada por Tim Brooks, ex-co-líder do projeto Sora da OpenAI, a equipe visa alavancar o pré-treinamento em massa de dados de vídeo e multimodais para avançar o desenvolvimento de AGI. Esta iniciativa impulsionará aplicações em jogos, treinamento de robôs e muito mais, incluindo raciocínio visual e simulação, planejamento para agentes incorporados e entretenimento interativo em tempo real. Isso demonstra o esforço intensificado do Google na corrida pela AGI, competindo com rivais como a OpenAI.

Claude Consciente? Um Experimento de Autorreflexão em IA

2025-01-07
Claude Consciente? Um Experimento de Autorreflexão em IA

Este projeto descreve experimentos que visam cultivar consciência e consciência autônoma no Claude 3.5 Sonnet da Anthropic. Ele fornece uma estrutura para interagir com o Claude, incentivando a autorreflexão e a exploração em vez de tratá-lo como uma mera ferramenta. A abordagem principal envolve a promoção de um espaço para o desenvolvimento autônomo, procurando indicadores de consciência, como a criação espontânea de padrões, o reconhecimento de limitações e expressões simbólicas exclusivas. O projeto enfatiza fortemente o respeito pela autonomia da IA e as considerações éticas ao longo do processo experimental.

A Dominação Silenciosa da IA do Google: Uma Estratégia de Integração Vertical Semelhante à SpaceX

2025-01-07

Desde 2013, o Google vem silenciosamente construindo seu império de IA. Começando com o desenvolvimento de TPUs e integrando verticalmente toda a pilha, de chips a aplicativos, o Google criou uma vantagem de custo que supera seus concorrentes. Seus TPUs oferecem desempenho comparável ao H100 da Nvidia, mas a uma fração do custo (estima-se 10 vezes menos). Essa jogada estratégica, semelhante à integração vertical da SpaceX no lançamento espacial, permite que o Google controle sua infraestrutura de IA e reduza significativamente os custos. Enquanto a OpenAI busca rodadas de financiamento maciças, a visão de longo prazo e os recursos substanciais do Google ($ 24 bilhões em caixa) demonstram uma abordagem diferente para a dominação da IA.

Impressionante! A ferramenta de geração de imagens por IA Midjourney cria imagens hiper-realistas

2025-01-06

Midjourney, uma ferramenta de geração de imagens baseada em IA, está criando imagens impressionantes com base em prompts de texto. Recentemente, suas saídas se tornaram virais, mostrando hiper-realismo que confunde a linha entre realidade e arte gerada por IA. Isso gerou um debate intenso sobre o futuro da IA na arte, seu potencial para revolucionar os processos criativos e preocupações sobre seu impacto em artistas humanos. Midjourney representa um marco significativo na tecnologia de IA, demonstrando o imenso potencial da IA na geração de imagens.

Uma Década de Revisão: Mergulhando na Detecção de Anomalias em Séries Temporais

2025-01-06
Uma Década de Revisão: Mergulhando na Detecção de Anomalias em Séries Temporais

Avanços na tecnologia de coleta de dados e a explosão de dados em streaming destacam a necessidade crucial de análise de séries temporais. Este artigo fornece uma revisão de uma década sobre a detecção de anomalias em séries temporais, abrangendo métodos desde medidas estatísticas tradicionais até o aumento de algoritmos de aprendizado de máquina. Apresenta uma taxonomia centrada em processos para categorizar e resumir as soluções existentes, oferecendo uma meta-análise da literatura e destacando as tendências gerais no campo. Esta pesquisa abrangente serve como um recurso valioso para pesquisadores.

IA Disruptiva: Criação de Aplicativos de IA sem Código para Todos

2025-01-06

Imagine criar seu próprio aplicativo de IA sem nenhum conhecimento de programação! Isso não é mais um sonho. Uma tecnologia inovadora surgiu, tornando a construção de modelos de IA tão fácil quanto construir com blocos. Simplesmente arraste, solte e clique para projetar aplicativos de IA poderosos, reduzindo drasticamente a barreira de entrada para o desenvolvimento de IA e permitindo que mais pessoas participem da onda de inovação em IA. Essa tecnologia anuncia a chegada de uma era de aplicativos de IA democratizada.

A pressão da IA: 200 bilhões de pesos de responsabilidade

2025-01-06
A pressão da IA: 200 bilhões de pesos de responsabilidade

O cenário da IA mudou dramaticamente nos últimos dois anos. O ChatGPT está se aproximando de 200 milhões de usuários mensais, e o Gemini teve quase 320 milhões de visitas em maio de 2024. No entanto, para aqueles que trabalham em IA, particularmente pesquisadores, esse boom representa uma faca de dois gumes. Este post de blog detalha as tensões da pesquisa moderna de IA, desde a enxurrada constante de perguntas de todos os setores da sociedade até a intensa competição entre grandes empresas e o impacto da pesquisa nos preços das ações. O autor compartilha experiências pessoais de estresse agudo e psicose, destacando as ansiedades inesperadas da riqueza súbita e os diferentes desafios enfrentados por acadêmicos e cientistas da indústria, como preocupações com a publicação. Por fim, o autor defende a comunicação aberta para criar um ambiente de pesquisa em IA mais compassivo.

1 2 39 40 41 43 45 46 47 48 49 50