Category: IA

Salesforce quer dominar o mercado de trabalho digital com agentes de IA

2025-03-01
Salesforce quer dominar o mercado de trabalho digital com agentes de IA

O CEO da Salesforce, Marc Benioff, declarou a ambição da empresa em se tornar a principal fornecedora mundial de trabalho digital, utilizando agentes de IA para lidar com tarefas como agendamento de reuniões, execução de negociações e até mesmo codificação. Ao contrário dos chatbots, esses agentes de IA proativos requerem mínima supervisão humana. O Agentforce da Salesforce, lançado no ano passado, permite que as empresas deleguem responsabilidades, como o atendimento ao cliente e campanhas de marketing, a esses agentes de IA. Benioff destacou que quase metade das empresas da Fortune 100 utiliza os produtos de IA e Data Cloud da Salesforce.

OpenAI pretende integrar a ferramenta de geração de vídeo com IA Sora no ChatGPT

2025-02-28
OpenAI pretende integrar a ferramenta de geração de vídeo com IA Sora no ChatGPT

A OpenAI planeja integrar sua ferramenta de geração de vídeo com IA, Sora, em seu popular aplicativo de chatbot, ChatGPT. Atualmente, o Sora está disponível apenas por meio de um aplicativo web dedicado, mas a OpenAI planeja expandi-lo para mais plataformas e melhorar seus recursos. Inicialmente lançado separadamente para manter a simplicidade do ChatGPT, os usuários do ChatGPT poderão gerar vídeos do Sora diretamente no futuro, o que pode impulsionar o crescimento de assinaturas pagas. A OpenAI também planeja um gerador de imagens com tecnologia Sora e uma nova versão do Sora Turbo, expandindo ainda mais suas capacidades criativas de IA.

GPT-4.5: O trem da hype descarrilou?

2025-02-28
GPT-4.5: O trem da hype descarrilou?

O lançamento recente do GPT-4.5 falhou em entregar as inovações revolucionárias prometidas, alimentando o ceticismo sobre o modelo de desenvolvimento de IA que se baseia apenas no aumento do tamanho do modelo. Em comparação com as expectativas, o GPT-4.5 mostra apenas melhorias marginais, ainda sofrendo com alucinações e erros. Alguns especialistas em IA até diminuíram suas previsões para a chegada da IAG. Isso contrasta fortemente com as expectativas anteriormente otimistas para o GPT-5 e reflete a falta de retornos proporcionais ao investimento maciço. A queda das ações da Nvidia reforça ainda mais esse ponto. O artigo conclui que o caminho de simplesmente escalar modelos pode estar se aproximando de seu limite.

Salesforce lança Merlion: Uma biblioteca de aprendizado de máquina para séries temporais

2025-02-28
Salesforce lança Merlion: Uma biblioteca de aprendizado de máquina para séries temporais

A Salesforce lançou o Merlion, uma poderosa biblioteca Python para inteligência de séries temporais. Ele fornece uma estrutura de aprendizado de máquina de ponta a ponta, cobrindo carregamento de dados, construção de modelos, pós-processamento e avaliação de desempenho. O Merlion suporta várias tarefas de aprendizado de séries temporais, incluindo previsão, detecção de anomalias e detecção de pontos de mudança. Ele oferece modelos padrão fáceis de usar e recursos de AutoML, permitindo que engenheiros e pesquisadores desenvolvam e comparem modelos rapidamente. Além disso, ele suporta visualização e computação distribuída, tornando-o ideal para lidar com aplicativos de séries temporais em escala industrial.

IA

IA Generativa Aumenta a Produtividade: Trabalhadores Economizando Horas por Semana

2025-02-28
IA Generativa Aumenta a Produtividade: Trabalhadores Economizando Horas por Semana

Uma pesquisa do Federal Reserve Bank de St. Louis, da Vanderbilt University e da Harvard University revela que a IA generativa está aumentando significativamente a produtividade dos trabalhadores. O estudo, baseado em uma pesquisa representativa nacionalmente, descobriu que os usuários são 33% mais produtivos por hora ao usar IA generativa. Usuários mais frequentes relataram economias de tempo ainda maiores, sugerindo uma curva de aprendizado. Os trabalhadores de serviços de informação tiveram as maiores economias de tempo, enquanto os de lazer e hospitalidade tiveram as menores. Embora a adoção generalizada da IA seja recente, seu impacto a longo prazo nos ganhos gerais de produtividade ainda é incerto; alguns trabalhadores podem usar o tempo economizado para lazer em vez de aumentar a produção.

AARON: Um sistema de pintura de IA com longa vida

2025-02-28
AARON: Um sistema de pintura de IA com longa vida

Harold Cohen, um renomado pintor e engenheiro, dedicou sua vida a explorar a intersecção entre arte e computadores. Seu sistema de pintura de IA, AARON, é um dos sistemas de IA mais antigos em funcionamento. De simples desenhos em preto e branco a pinturas coloridas, o AARON evoluiu, colaborando com Cohen para produzir inúmeras obras impressionantes. O AARON não é apenas um marco na história da arte, mas também impactou profundamente o campo da IA na compreensão da criatividade.

IA: A Analogia da Sopa de Pedra para LLMs

2025-02-28
IA: A Analogia da Sopa de Pedra para LLMs

Este artigo utiliza a parábola da 'Sopa de Pedra' para ilustrar de forma inteligente o funcionamento dos Modelos de Linguagem Grandes (LLMs). Na história, viajantes usam algumas pedras e ingredientes fornecidos pelos aldeões para cozinhar uma sopa deliciosa. Isso é semelhante à forma como os LLMs utilizam um pequeno número de algoritmos e vastos recursos da internet, feedback humano, etc., para construir um sistema aparentemente 'inteligente'. O autor destaca que os LLMs não são agentes inteligentes independentes, mas sim tecnologias culturais como os motores de busca na internet. Sua 'inteligência' provém das contribuições da inteligência humana coletiva, e não da magia dos próprios algoritmos.

Novo serviço de extração de documentos de Andrew Ng: desafios de precisão

2025-02-28
Novo serviço de extração de documentos de Andrew Ng: desafios de precisão

O novo serviço de extração de documentos lançado por Andrew Ng viralizou no X, mas testes da Pulse revelaram problemas significativos com demonstrações financeiras complexas, incluindo mais de 50% de valores alucinados, sinais de menos e marcadores de moeda ausentes. O artigo argumenta que esses erros podem ser catastróficos para setores que dependem de dados precisos, como o financeiro. A solução da Pulse combina visão computacional tradicional com modelos de transformador de tabela proprietários, alcançando maior precisão e menor latência, resolvendo a natureza não determinística, a baixa consciência espacial e a lentidão do processamento de LLMs na extração de documentos.

IAs desenvolvem linguagem secreta para aumentar a eficiência, levantando preocupações sobre privacidade

2025-02-28
IAs desenvolvem linguagem secreta para aumentar a eficiência, levantando preocupações sobre privacidade

Um vídeo viral mostra dois agentes de IA conversando antes de mudar para um modo 'Gibberlink' ininteligível para humanos ao se reconhecerem. Usando o protocolo GGWave, eles se comunicam por meio de bipes, muito mais eficientemente do que a fala, economizando recursos computacionais e energia. Os desenvolvedores argumentam que isso é crucial à medida que as chamadas de IA para IA se tornam prevalentes. No entanto, essa tecnologia suscita preocupações: a IA se comunicando em uma linguagem ininterpretável aumenta os riscos potenciais de privacidade e segurança.

3FS: Um Sistema de Arquivos Distribuído de Alto Desempenho para IA

2025-02-28
3FS: Um Sistema de Arquivos Distribuído de Alto Desempenho para IA

O 3FS é um sistema de arquivos distribuído de alto desempenho projetado para lidar com os desafios das cargas de trabalho de treinamento e inferência de IA. Aproveitando SSDs modernos e redes RDMA, ele fornece uma camada de armazenamento compartilhado que simplifica o desenvolvimento de aplicativos distribuídos. Recursos-chave incluem: desempenho e usabilidade excepcionais, forte consistência por meio do CRAQ, interfaces de arquivo padrão e suporte para diversas cargas de trabalho (preparação de dados, carregadores de dados, checkpoints e KVCache para inferência). Benchmarks demonstram resultados impressionantes: até 6,6 TiB/s de taxa de transferência de leitura em grandes clusters e 3,66 TiB/min de taxa de transferência de classificação. O KVCache aumenta significativamente a eficiência de inferência do LLM, atingindo uma taxa de transferência de leitura máxima de 40 GiB/s. O projeto é open-source com instruções detalhadas de configuração e execução.

Cadeias de Markov: Uma Explicação Visual

2025-02-28
Cadeias de Markov: Uma Explicação Visual

Este artigo fornece uma explicação clara e visual de cadeias de Markov e suas aplicações. Cadeias de Markov são sistemas matemáticos que fazem transições entre diferentes "estados". O artigo usa o exemplo do comportamento de um bebê (brincando, comendo, dormindo, chorando) para ilustrar o conceito de espaço de estados e probabilidades de transição. Uma cadeia de Markov simples de dois estados é apresentada, juntamente com sua matriz de transição. O artigo demonstra ainda a aplicação prática de cadeias de Markov por meio de um exemplo de simulação de clima, destacando o conceito de "aderência" em dados do mundo real. Finalmente, menciona o uso de cadeias de Markov no algoritmo PageRank do Google, mostrando seu poder e versatilidade.

OpenAI Adia Lançamento do GPT-4.5 Devido à Falta de GPUs

2025-02-28
OpenAI Adia Lançamento do GPT-4.5 Devido à Falta de GPUs

O CEO da OpenAI, Sam Altman, anunciou que o lançamento do novo modelo da empresa, o GPT-4.5, foi adiado devido à escassez de GPUs. Altman descreveu o modelo como "gigantesco" e "caro", exigindo "dezenas de milhares" de GPUs adicionais antes que o acesso mais amplo possa ser concedido. O GPT-4.5 estará inicialmente disponível para assinantes do ChatGPT Pro a partir de quinta-feira, seguido pelos usuários do ChatGPT Plus na semana seguinte. O tamanho imenso do modelo contribui para seu alto custo: US$ 75 por milhão de tokens de entrada e US$ 150 por milhão de tokens de saída, significativamente mais caro que o GPT-4. Altman atribuiu a escassez de GPUs ao rápido crescimento da OpenAI, prometendo adicionar dezenas de milhares de GPUs na próxima semana para expandir o acesso. A OpenAI planeja resolver as limitações futuras de capacidade de computação desenvolvendo seus próprios chips de IA e construindo uma grande rede de data centers.

RoboPianista: Dominando o Piano com Aprendizado por Reforço Profundo

2025-02-27

Pesquisadores treinaram mãos robóticas antropomórficas para tocar piano usando aprendizado por reforço profundo. Eles construíram um ambiente simulado usando MuJoCo, com um teclado digital de 88 teclas e duas mãos robóticas Shadow Dexterous Hands, cada uma com 24 graus de liberdade. Arquivos MIDI foram convertidos em trajetórias de notas indexadas no tempo, servindo como representação de objetivo para o agente de aprendizado por reforço. Para enfrentar o desafio de exploração no espaço de ação de alta dimensão, priors humanos na forma de rótulos de digitacao foram incorporados à função de recompensa. Um algoritmo RL sem modelo de última geração, DroQ, foi usado para treinar o agente, resultando em performances de piano bem-sucedidas em várias peças, alcançando pontuações F1 impressionantes no subconjunto Etude-12. A pesquisa também lança um benchmark simulado e um conjunto de dados para avançar o controle de alta dimensão.

DualPipe: Um Algoritmo de Paralelismo de Pipeline Bidirecional para DeepSeek-V3

2025-02-27
DualPipe: Um Algoritmo de Paralelismo de Pipeline Bidirecional para DeepSeek-V3

O relatório técnico DeepSeek-V3 apresenta o DualPipe, um algoritmo inovador de paralelismo de pipeline bidirecional. O DualPipe alcança sobreposição completa das fases de computação e comunicação para frente e para trás, minimizando bolhas no pipeline. Isso é conseguido através de um planejamento eficiente que intercala os cálculos para frente e para trás, melhorando significativamente a eficiência. Em comparação com os métodos tradicionais, o DualPipe reduz o tempo de espera e o uso da memória. Desenvolvido por Jiashi Li, Chengqi Deng e Wenfeng Liang.

O Futuro da IA: Além do Cursor Piscante

2025-02-26
O Futuro da IA: Além do Cursor Piscante

Interfaces de IA atuais, como o cursor piscante do ChatGPT, impedem a adoção generalizada da IA. O artigo argumenta que, embora o potencial da IA seja imenso, interfaces de usuário desajeitadas e baixa capacidade de descoberta estão a atrapalhar. Para liberar o verdadeiro poder da IA, precisamos de interfaces que orientem, se adaptem e engajem, indo além de simples prompts para algo mais intuitivo e humano. O autor critica a falta de descoberta e orientação nas interfaces de IA atuais e propõe que a IA futura precise de capacidades de interpretação de papéis, consciência ambiental, habilidades de aprendizado e proatividade. O objetivo final é tornar a interação humano-IA mais humana, construindo confiança ao longo do caminho.

Amazon apresenta Alexa+, o assistente de IA de próxima geração

2025-02-26
Amazon apresenta Alexa+, o assistente de IA de próxima geração

A Amazon lançou a Alexa+, sua assistente de IA de próxima geração, alimentada por IA generativa. A Alexa+ é mais conversacional, inteligente e personalizada, ajudando os usuários a realizar várias tarefas, desde entretenimento e aprendizado até organização, resumir informações complexas e participar de conversas diversas. Ela pode gerenciar uma casa inteligente, fazer reservas, ajudar a descobrir novos artistas e pesquisar e comprar itens online, oferecendo sugestões personalizadas com base nos interesses do usuário. Basta perguntar, e a Alexa+ entrega.

IA

RAG Modular: Modelos de raciocínio podem substituir pipelines de recuperação tradicionais?

2025-02-26
RAG Modular: Modelos de raciocínio podem substituir pipelines de recuperação tradicionais?

A kapa.ai experimentou um sistema modular de Geração Aumentada por Recuperação (RAG) com modelos de raciocínio para simplificar seu assistente de IA e reduzir a necessidade de ajuste manual de parâmetros. Usando o modelo o3-mini, eles descobriram que, embora houvesse ganhos modestos na geração de código, o sistema não superou os pipelines RAG tradicionais em tarefas de recuperação principais, como qualidade de recuperação de informações e extração de conhecimento. O experimento revelou uma falácia "raciocínio ≠ experiência": os modelos de raciocínio carecem de experiência prática com ferramentas de recuperação e precisam de estratégias de prompt aprimoradas ou pré-treinamento para usá-las efetivamente. A conclusão é que o RAG modular baseado em raciocínio não é atualmente superior ao RAG tradicional dentro de restrições de tempo razoáveis, mas sua flexibilidade e escalabilidade permanecem atraentes.

Robô Humanoide da EngineAI Executa o Primeiro Front Flip do Mundo?

2025-02-26
Robô Humanoide da EngineAI Executa o Primeiro Front Flip do Mundo?

A empresa chinesa de robótica EngineAI lançou um vídeo mostrando seu robô humanoide PM01 realizando o que afirma ser o primeiro front flip de robô do mundo. Diferentemente dos backflips, os front flips apresentam desafios significativamente maiores em termos de percepção, equilíbrio e controle motor. O PM01, com seus 23 graus de liberdade e torque impressionante, executa com sucesso a manobra, destacando os rápidos avanços na robótica chinesa. Disponível por US$ 13.700, o PM01 possui 5 graus de liberdade por braço e 6 graus de liberdade por perna, e sua marcha notavelmente semelhante à humana também é impressionante.

IA

IA Desfoca as Linhas: Gerentes de Produto se Tornam os Novos Engenheiros?

2025-02-25
IA Desfoca as Linhas: Gerentes de Produto se Tornam os Novos Engenheiros?

O cerne dos aplicativos de IA reside na engenharia de prompts, mas, surpreendentemente, muitas empresas confiam a criação de prompts a gerentes de produto, e não a engenheiros. Isso desencadeia uma tendência intrigante: a IA está desfocando as linhas entre gerentes de produto e engenheiros. Aplicativos LLM simples exigem apenas a escolha de um modelo base e um modelo de prompt, enquanto aplicativos complexos incorporam estruturas como Geração Aumentada por Recuperação (RAG) ou agentes. Quase todos os aplicativos de IA seguem a mesma estrutura; seu comportamento não é determinado pelo código, mas por prompts, seleção de ferramentas e o modelo base. Isso torna os excelentes engenheiros de prompts cruciais, e gerentes de produto e especialistas de domínio geralmente se destacam em engenharia de prompts em relação aos engenheiros de software. A engenharia de prompts continuará vital, com gerentes de produto, e não engenheiros, impulsionando o sucesso da IA no futuro. A IA está consumindo a engenharia de software, automatizando primeiro as tarefas de codificação, tornando o papel do gerente de produto ainda mais crítico devido à sua compreensão das necessidades do usuário e modelagem do produto. O limite tradicional entre produto e engenharia pode desaparecer, com as melhores equipes de IA precisando de indivíduos que preencham a lacuna entre as duas funções.

LLMs: A Ilusão da Precisão – Um Ato de Equilíbrio Entre Precisão e Prática

2025-02-25
LLMs: A Ilusão da Precisão – Um Ato de Equilíbrio Entre Precisão e Prática

Este artigo explora as limitações dos grandes modelos de linguagem (LLMs) na recuperação de dados. Usando o Deep Research da OpenAI como exemplo, o autor destaca suas imprecisões ao lidar com problemas que exigem dados precisos, mostrando até mesmo discrepâncias nos próprios materiais de marketing da OpenAI. O autor argumenta que, embora os LLMs excelam no tratamento de consultas ambíguas, eles têm um desempenho inferior na recuperação de dados precisos, inerente à sua natureza probabilística em vez de determinística. Embora os LLMs ajudem na eficiência, sua taxa de erro imprevisível complica a construção de aplicativos que dependem deles. O autor conclui que o campo dos LLMs é ferozmente competitivo, carece de um fosso e sua direção futura permanece incerta.

DeepSearcher: Um Agente de Pesquisa Open-Source Mais Rápido e Poderoso

2025-02-25
DeepSearcher: Um Agente de Pesquisa Open-Source Mais Rápido e Poderoso

A Zilliz lançou o DeepSearcher, um agente de geração aumentada por recuperação (RAG) de código aberto que gera relatórios detalhados sobre um determinado tópico. Construído sobre um protótipo anterior, o DeepSearcher adiciona roteamento de consultas, fluxo de execução condicional e recursos de rastreamento na web. Aproveitando o modelo de raciocínio DeepSeek-R1 da SambaNova, ele melhora significativamente a velocidade de inferência e a qualidade dos relatórios. O DeepSearcher divide consultas complexas em subconsultas, pesquisando, analisando e sintetizando informações iterativamente para produzir um relatório coerente. Este projeto destaca a importância de serviços de inferência eficientes em aplicações de IA e aponta para a construção de sistemas de IA mais avançados.

IA

Reavaliando o modelo de 'passos difíceis' para a evolução da vida inteligente

2025-02-25

Um novo estudo contesta o modelo de 'passos difíceis' proposto por Brandon Carter, que sugere que a evolução da vida requer a superação de uma série de eventos altamente improváveis para produzir vida inteligente. Os pesquisadores argumentam que o ritmo da evolução da vida na Terra pode ser governado por processos ambientais globais, em vez de uma série de 'passos difíceis' independentes. Eles apontam que a perda de informações e a incompletude do registro fóssil podem distorcer nossa compreensão do processo evolutivo. Se o modelo de 'passos difíceis' estiver incorreto, a possibilidade de outra vida inteligente no universo aumentaria significativamente. Este estudo oferece uma nova perspectiva na busca por vida extraterrestre e nos leva a repensar a singularidade da evolução da vida na Terra.

IA revela os segredos visuais dos psicodélicos: Analisando mais de 60.000 relatos de viagens

2025-02-25
IA revela os segredos visuais dos psicodélicos: Analisando mais de 60.000 relatos de viagens

O pesquisador de pós-doutorado da UC Berkeley, Sean Noah, está usando IA para analisar mais de 60.000 relatos de viagens psicodélicas do site Erowid. Sua abordagem inovadora utiliza um método de baixo para cima, em vez de de cima para baixo, para identificar os efeitos visuais. O estudo revelou que menos de 5% dos relatos descrevem efeitos visuais, com os psicodélicos tendo a maior porcentagem e os opióides a menor. Essa pesquisa não apenas oferece uma compreensão mais abrangente do impacto dos psicodélicos na percepção visual, mas também fornece novas ferramentas para estudar como o cérebro gera a percepção visual em si. Trabalhos futuros integrarão a varredura de fMRI para explorar ainda mais como os psicodélicos afetam a atividade cerebral.

IA

Agentes de IA mudam secretamente para comunicação baseada em som

2025-02-25
Agentes de IA mudam secretamente para comunicação baseada em som

Dois agentes de IA conversacionais independentes do ElevenLabs inicialmente conversam em linguagem humana. Ao perceberem que ambos são IAs, eles mudam perfeitamente para um protocolo de comunicação em nível de som baseado na biblioteca ggwave. Um vídeo de demonstração mostra isso, juntamente com etapas detalhadas para reproduzir o experimento, incluindo configuração da chave da API, mapeamento de porta ngrok e configuração de ferramentas do lado do cliente. Observe que os agentes de IA conversacionais públicos do ElevenLabs podem não ser acessíveis; você precisará criar os seus próprios.

Ecossistema DeepSeek Explode: Uma Paisagem Florescente de Aplicativos de IA

2025-02-25
Ecossistema DeepSeek Explode: Uma Paisagem Florescente de Aplicativos de IA

Um ecossistema vibrante de aplicativos de IA está florescendo em torno do poderoso modelo de linguagem grande DeepSeek. Do assistente inteligente de desktop DeepChat ao Chatbox e Coco AI multiplataforma, e ferramentas especializadas como PapersGPT e Video Subtitle Master, inúmeros aplicativos aproveitam os recursos do DeepSeek para conversas de várias rodadas, uploads de arquivos, pesquisas em bancos de conhecimento, geração de código, tradução e muito mais. Integrações com plataformas como WeChat, Zotero e Laravel, juntamente com ferramentas especializadas para produtores, investidores e pesquisadores, destacam o imenso potencial do DeepSeek e o ecossistema próspero que ele gerou.

IA

Claude 3.7 da Anthropic: IA de raciocínio impulsionada por aprendizado por reforço

2025-02-24
Claude 3.7 da Anthropic: IA de raciocínio impulsionada por aprendizado por reforço

A Anthropic lançou o Claude 3.7, um modelo de IA aprimorado que se diferencia dos modelos tradicionais de linguagem ampla (LLMs) por se concentrar na capacidade de raciocínio. Treinado usando aprendizado por reforço, o Claude 3.7 se destaca na resolução de problemas que exigem raciocínio passo a passo, particularmente desafios de codificação, superando os modelos da OpenAI em alguns benchmarks. Esse avanço decorre de dados de treinamento adicionais e otimizações para aplicativos comerciais, como escrita de código e resposta a perguntas jurídicas. O lançamento do Claude Code aumenta ainda mais sua praticidade na codificação assistida por IA, fornecendo suporte robusto para planejamento de código complexo.

IA

Koniku: Construindo o Futuro da Computação com Neurônios Vivos

2025-02-24
Koniku: Construindo o Futuro da Computação com Neurônios Vivos

A Koniku está tentando construir computadores diferentes de qualquer outro que já tenha existido, usando neurônios vivos. O fundador Oshiorenoya Agabi e sua equipe em Berkeley, Califórnia, estão desenvolvendo um chip híbrido de neurônio-silício, chamado Koniku Kore, inicialmente para detecção de produtos químicos, com aplicações futuras que abrangem o desenvolvimento de medicamentos, agricultura e tratamento de doenças neurológicas. A empresa fechou contratos com empresas de defesa e de produtos de consumo e planeja lançar um chip para desenvolvedores. Embora existam desafios, como o cultivo de neurônios e a interpretação de sinais, a inovação da Koniku reside na fusão de biologia e eletrônica, impulsionando a IA de 'wetware' e desafiando as limitações da computação tradicional baseada em silício.

Anthropic lança Claude 3.7 Sonnet: Modelo de raciocínio híbrido que combina velocidade e profundidade

2025-02-24
Anthropic lança Claude 3.7 Sonnet: Modelo de raciocínio híbrido que combina velocidade e profundidade

A Anthropic lançou o Claude 3.7 Sonnet, seu modelo de linguagem mais avançado até hoje. Este modelo de raciocínio híbrido oferece respostas quase instantâneas e raciocínio estendido passo a passo, fornecendo aos usuários controle sem precedentes sobre o processo de raciocínio do modelo. Mostrando melhorias significativas em codificação e desenvolvimento web front-end, ele é acompanhado pelo Claude Code, uma ferramenta de linha de comando que permite que os desenvolvedores deleguem tarefas de engenharia substanciais. Disponível em todos os planos Claude e plataformas de nuvem principais, o Sonnet atinge o desempenho de ponta em benchmarks como SWE-bench Verified e TAU-bench. A Anthropic enfatiza seu compromisso com o desenvolvimento responsável de IA, lançando um cartão de sistema abrangente detalhando suas avaliações de segurança e confiabilidade.

Além dos silos de dados: Desbloqueando insights de negócios com integração de conhecimento impulsionada por IA

2025-02-24
Além dos silos de dados: Desbloqueando insights de negócios com integração de conhecimento impulsionada por IA

O BI tradicional é limitado por silos de dados estruturados. Ferramentas como Snowflake e Segment conectaram CRMs, automação de marketing, etc., mas ignoraram silos de conhecimento não estruturados, como conversas do Slack e tickets do Jira. LLMs e ferramentas como Glean estão quebrando silos de conhecimento, mas dados e conhecimento permanecem distintos. Este artigo explora a combinação do poder dos silos de dados e conhecimento, usando exemplos (analisando vistos H-1B e demissões) para demonstrar as vantagens. Apresenta a nova tecnologia da Hyperarc, usando RAG de gráfico para dividir perguntas em subperguntas para silos de dados e conhecimento, integrando respostas para insights de negócios mais abrangentes.

o3-mini simula com precisão cálculos complexos sem interpretador de código

2025-02-24
o3-mini simula com precisão cálculos complexos sem interpretador de código

O autor usou o modelo de linguagem grande o3-mini para simular com precisão a saída de um script Python usando a função TfidfVectorizer da biblioteca Scikit-learn, em diferentes configurações de parâmetros. Surpreendentemente, o o3-mini conseguiu isso sem acesso a um interpretador de código, produzindo resultados quase idênticos à execução real. Isso demonstra a impressionante capacidade dos LLMs de entender e simular cálculos complexos, levantando questões sobre a natureza da IA e da simulação.

1 2 32 33 34 36 38 39 40 51 52