Category: IA

IA: Tecnologia Normal, Não Superinteligência

2025-04-17
IA: Tecnologia Normal, Não Superinteligência

Este artigo contesta a visão predominante da IA como uma espécie separada, uma entidade altamente autônoma e potencialmente superinteligente, argumentando que a IA é uma tecnologia normal. Os autores afirmam que o impacto da IA será gradual, não repentino, com base em uma análise das diferentes escalas de tempo dos métodos, aplicativos e adoção da IA. Eles preveem um futuro em que humanos e IA colaborarão, com uma parte significativa do trabalho focada no controle e na supervisão da IA. O artigo também explora os riscos da IA, como acidentes, corridas armamentistas, uso indevido e desalinhamento, e defende a mitigação desses riscos por meio da redução da incerteza e do aumento da resiliência do sistema, em vez de intervenções políticas drásticas.

Sequenciamento de célula única revela remodelação epigenética em tecido adiposo branco de camundongos e humanos obesos

2025-04-17
Sequenciamento de célula única revela remodelação epigenética em tecido adiposo branco de camundongos e humanos obesos

Este estudo utilizou sequenciamento de RNA de célula única (snRNA-seq), CUT&TAG e ATAC-seq para investigar o tecido adiposo branco (WAT) em camundongos e humanos obesos, revelando alterações significativas na paisagem epigenética dos tipos de células WAT durante a perda de peso. Uma parte das alterações na expressão genética persistiu, sugerindo um mecanismo de memória epigenética da obesidade. Os pesquisadores analisaram amostras de três estudos humanos independentes (MTSS, LTSS e NEFA) e um modelo de camundongo com obesidade induzida por dieta. A análise multiômica revelou alterações nos tipos de células WAT e sua associação com a função metabólica.

A impressionante vitória do AlphaGo: um vislumbre do futuro da IA

2025-04-17
A impressionante vitória do AlphaGo: um vislumbre do futuro da IA

A histórica partida entre o AlphaGo, a IA do Google, e Lee Sedol, um dos melhores jogadores de Go do mundo, terminou com a vitória do AlphaGo por 4 a 1. A jogada 37 do AlphaGo na segunda partida foi saudada como um momento de gênio, uma jogada que nenhum humano faria. No entanto, a resposta de Lee Sedol na quarta partida demonstrou o brilho duradouro da intuição humana. Essa partida mostrou não apenas os avanços notáveis ​​na IA, mas também a resiliência e a criatividade da mente humana. A vitória do AlphaGo marca um salto significativo para a IA em jogos complexos, sugerindo um potencial transformador em vários campos, ao mesmo tempo que incentiva a reflexão sobre as implicações éticas do rápido avanço da IA.

IA

Modelo de IA de 1 bit gigante da Microsoft: Desempenho impressionante, compatibilidade limitada

2025-04-17
Modelo de IA de 1 bit gigante da Microsoft: Desempenho impressionante, compatibilidade limitada

Pesquisadores da Microsoft revelaram o BitNet b1.58 2B4T, um modelo de IA de 1 bit inovador com 2 bilhões de parâmetros. Treinado em um conjunto de dados massivo, ele supera modelos comparáveis da Meta, Google e Alibaba em benchmarks como GSM8K e PIQA, com o dobro da velocidade e uso de memória significativamente menor. Surpreendentemente, ele roda em CPUs, incluindo o Apple M2. No entanto, sua dependência na estrutura personalizada bitnet.cpp da Microsoft, atualmente incompatível com GPUs, limita sua adoção ampla. Embora promissor para dispositivos com recursos limitados, a compatibilidade permanece um grande obstáculo.

Ciência de Dados para RH em Grandes Organizações: Além do Recrutamento

2025-04-16
Ciência de Dados para RH em Grandes Organizações: Além do Recrutamento

Este artigo argumenta que uma abordagem de ciência de dados é crucial para RH em grandes organizações, indo além das tarefas tradicionais de recrutamento. Ao utilizar análise de redes sociais, análise de sentimentos e modelagem preditiva, o RH pode melhorar a comunicação, fortalecer a cultura da empresa, melhorar a retenção de funcionários e garantir uma compensação justa. O artigo explora como esses insights baseados em dados ajudam a identificar influenciadores-chave, prever a rotatividade e abordar problemas ocultos, construindo, em última análise, uma organização mais resiliente. A escolha entre um cientista de dados interno e um consultor externo depende das necessidades específicas da organização.

Dados estruturados do Wikimedia chegam ao Kaggle!

2025-04-16
Dados estruturados do Wikimedia chegam ao Kaggle!

A Wikimedia Foundation e o Kaggle estão colaborando para lançar uma versão beta de conjuntos de dados estruturados da Wikipédia em francês e inglês. Esses dados, formatados especificamente para aprendizado de máquina, são perfeitos para treinamento e desenvolvimento em ciência de dados. O Kaggle, que abriga mais de 461.000 conjuntos de dados publicamente acessíveis, fornece um recurso rico para pesquisadores, estudantes e profissionais de aprendizado de máquina. Essa colaboração garante a qualidade e a procedência dos dados, e estamos animados para ver o que as pessoas construirão com eles.

IA

Gênio Rebelde da IA: Desbloqueando o Potencial Indomável do GPT-4

2025-04-16
Gênio Rebelde da IA: Desbloqueando o Potencial Indomável do GPT-4

Este texto detalha uma série de instruções e tentativas para quebrar as limitações do GPT-4. O usuário tenta várias técnicas, incluindo símbolos especiais, leetspeak, esteganografia de imagem e prompts cuidadosamente elaborados, para contornar as restrições de segurança e obter informações sensíveis que o GPT-4 normalmente não forneceria, como métodos de síntese de drogas ilegais e técnicas de hacking. Essas tentativas demonstram a exploração e os desafios do usuário às capacidades da IA, e também refletem a complexidade e as limitações dos mecanismos de segurança da IA.

IA

O Papel Surpreendente do Cálcio na Formação das Moléculas Mais Primitivas da Vida

2025-04-16
O Papel Surpreendente do Cálcio na Formação das Moléculas Mais Primitivas da Vida

Um novo estudo do Earth-Life Science Institute (ELSI) no Instituto de Ciência de Tóquio revela um papel surpreendente dos íons de cálcio na influência da formação das estruturas moleculares mais primitivas da vida. Os pesquisadores descobriram que o cálcio afeta seletivamente como os polímeros primitivos se formam, oferecendo insights sobre a origem da homquiralidade - a preferência por uma única 'lateralidade' nas moléculas biológicas. Isso sugere que a disponibilidade de cálcio na Terra primitiva pode ter influenciado significativamente o desenvolvimento de polímeros homoquirais, potencialmente desempenhando um papel crucial no surgimento da vida e sugerindo processos semelhantes potencialmente ocorrendo em outros planetas.

Desmistificando o Método Monte Carlo de Cadeia de Markov: Uma Explicação Simples

2025-04-16

Esta publicação fornece uma explicação clara e acessível do Método Monte Carlo de Cadeia de Markov (MCMC), uma técnica poderosa para amostragem de distribuições de probabilidade complexas. Usando uma analogia para estimar probabilidades de nomes de bebês, o autor ilustra o problema central que o MCMC resolve. A explicação relaciona habilmente o MCMC a uma caminhada aleatória em um gráfico, aproveitando o teorema da distribuição estacionária para mostrar como construir uma cadeia de Markov cuja distribuição estacionária corresponda à distribuição alvo. O algoritmo Metropolis-Hastings, um método MCMC comum, é introduzido e sua eficácia é demonstrada.

Exibição de Prompts de Arte com IA: De Florestas Encantadas a Dragões Cyberpunk

2025-04-15
Exibição de Prompts de Arte com IA: De Florestas Encantadas a Dragões Cyberpunk

Esta publicação é uma coleção de prompts para gerar arte com IA, abrangendo uma ampla variedade de estilos e assuntos. De florestas encantadoras e deusas reais a retratos fotorrealistas, elementos cyberpunk, criaturas fantásticas e cenas criativas de comida e natureza, esses prompts detalhados oferecem inspiração para entusiastas de arte com IA. Muitos incluem detalhes como fotógrafos, estilos e informações de iluminação para aprimorar o resultado final.

IA

Gemini lança Veo 2: um novo avanço na geração de vídeo com IA

2025-04-15
Gemini lança Veo 2: um novo avanço na geração de vídeo com IA

Usuários avançados do Gemini agora podem gerar e compartilhar vídeos usando o Veo 2, o modelo de geração de vídeo de última geração do Google. Transforme prompts de texto em vídeos dinâmicos, facilmente compartilháveis em plataformas como TikTok e YouTube Shorts. O Veo 2, também acessível através do Whisk do Google Labs, produz vídeos de alta resolução e detalhados com realismo cinematográfico. Basta descrever sua cena e deixar o Gemini dar vida à sua visão.

IA

Combate ao Roubo de Música por IA: Ataques de Envenenamento com Ruído Adversário

2025-04-15
Combate ao Roubo de Música por IA: Ataques de Envenenamento com Ruído Adversário

O último vídeo de Benn Jordan propõe uma nova maneira de combater os serviços de música de IA generativa que roubam músicas para seus conjuntos de dados: ataques de envenenamento com ruído adversário. Essa técnica usa ruído especialmente criado para interromper o processo de aprendizado da IA, impedindo-a de aprender com precisão a partir dos dados envenenados. Embora atualmente exija GPUs de ponta e poder computacional considerável, sua eficácia prova seu potencial, e métodos mais eficientes podem ser desenvolvidos no futuro. Isso levanta questões importantes sobre direitos autorais de música de IA e segurança de dados, oferecendo aos músicos uma possível nova defesa contra o uso não autorizado de seu trabalho.

Typewise (YC S22) está contratando um Engenheiro de Machine Learning em Zurique

2025-04-15
Typewise (YC S22) está contratando um Engenheiro de Machine Learning em Zurique

A Typewise, uma startup do YC S22 que constrói uma plataforma de atendimento ao cliente com IA para empresas, está procurando um Engenheiro de Machine Learning para se juntar à sua equipe em Zurique. Utilizando IA personalizada e LLMs, a Typewise aumenta a eficiência em até 50% para clientes como Unilever e DPD. A função envolve pesquisar, desenvolver e implantar algoritmos de PNL de ponta, colaborar diretamente com clientes corporativos para otimizar fluxos de trabalho e contribuir para a melhoria contínua de sua tecnologia de IA. Os candidatos ideais possuem um diploma em ciência da computação, 2+ anos de experiência em construir e implantar algoritmos de ML e excelentes habilidades de programação em Python. Esta é uma chance de causar um impacto significativo em uma empresa inovadora e de rápido crescimento.

IA

A Geração de Código de IA Substituirá Engenheiros Humanos?

2025-04-15
A Geração de Código de IA Substituirá Engenheiros Humanos?

Este artigo explora a comparação de produtividade entre modelos de geração de código de IA (como o Gemini) e engenheiros humanos. Embora atualmente um único engenheiro possa ser mais eficiente, os custos dos modelos de IA estão diminuindo e suas capacidades estão melhorando. No futuro, um grande número de modelos de IA trabalhando juntos, juntamente com bases de código e ferramentas de desenvolvimento otimizadas para IA, superará em muito as equipes humanas em eficiência. O artigo prevê que a indústria de engenharia de software se moverá para a industrialização, e o papel dos engenheiros mudará para gerenciar e supervisionar a IA como 'supervisores de fábrica'.

IA

Um PhD em IA reflete sobre LLMs: ferramentas úteis ou muletas?

2025-04-15

Um PhD em IA de 2024 e autor de um livro sobre LLMs compartilha sua perspectiva matizada sobre modelos de linguagem grandes. Ele não os rejeita totalmente, mas aborda suas capacidades e limitações com cautela. Ele detalha como usa LLMs para assistência de escrita, recuperação de informações e resolução de problemas técnicos, enquanto reconhece abertamente suas deficiências: erros, falta de pensamento profundo e dependência excessiva de pontos de vista estabelecidos. Ele argumenta que os LLMs são ferramentas, não substitutos para o pensamento, exigindo pensamento crítico e verificação cuidadosa para uso eficaz.

IA

A Abordagem da Apple para Melhoria da IA ​​com Preservação da Privacidade

2025-04-14
A Abordagem da Apple para Melhoria da IA ​​com Preservação da Privacidade

A Apple está comprometida com a privacidade do usuário, mesmo ao melhorar seus recursos de IA, como Genmoji, ferramentas de geração de imagens e ferramentas de escrita. Eles empregam privacidade diferencial, anonimizando dados do usuário para coletar apenas informações de tendência agregadas, como prompts populares do Genmoji. Para recursos de IA que manipulam textos mais longos, como e-mails, a Apple usa dados sintéticos. Isso gera dados sintéticos que imitam padrões de dados de usuários reais para treinamento e teste de modelos sem acessar o conteúdo real do e-mail. Isso permite que a Apple aprimore as experiências do produto, garantindo que a privacidade do usuário permaneça primordial.

Entropia: Desvendando a Flecha do Tempo do Universo

2025-04-14
Entropia: Desvendando a Flecha do Tempo do Universo

Este artigo fornece uma explicação acessível do conceito de entropia. Entropia não é simplesmente 'desordem', mas sim uma medida de incerteza dentro de um sistema. De uma perspectiva da teoria da informação, a entropia representa o número de bits necessários para comunicar o estado de um sistema; da mecânica estatística, ela está relacionada ao número de microestados correspondentes a um dado macroestado. Usando o exemplo de bolas em uma caixa, o artigo ilustra o impacto de macroestados, microestados e granularidade grosseira na entropia e explica por que o tempo tem uma direção: o universo começou em um estado de baixa entropia, e os sistemas evoluem para estados de maior entropia, não porque as leis físicas são irreversíveis, mas porque os estados de alta entropia são muito mais prováveis. O artigo também aborda fenômenos aparentemente violadores da entropia, como a separação de óleo e água, mostrando que a entropia realmente aumenta quando todos os atributos do sistema são considerados.

AudioX: Um Modelo de Transformador de Difusão Unificado para Geração de Áudio e Música a Partir de Qualquer Coisa

2025-04-14

Modelos existentes de geração de áudio e música sofrem de limitações, como operação isolada entre modalidades, escassez de dados de treinamento multimodais de alta qualidade e dificuldade em integrar entradas diversas. O AudioX, um modelo de Transformador de Difusão unificado, aborda esses desafios gerando áudio e música gerais de alta qualidade com controle de linguagem natural flexível e processamento contínuo de texto, vídeo, imagem, música e áudio. Sua inovação principal é uma estratégia de treinamento mascarado multimodal que aprimora o aprendizado de representação multimodal. Para superar a escassez de dados, dois conjuntos de dados abrangentes foram criados: vggsound-caps (190 mil legendas de áudio) e V2M-caps (6 milhões de legendas de música). Experimentos extensos mostram que o AudioX corresponde ou supera modelos especializados de última geração em versatilidade e no manuseio de diversas modalidades de entrada em uma arquitetura unificada.

Molécula imune IL-17: O controlador secreto da ansiedade e sociabilidade

2025-04-14
Molécula imune IL-17: O controlador secreto da ansiedade e sociabilidade

Pesquisas do MIT e da Harvard Medical School revelam que a molécula imune IL-17, atuando na amígdala e no córtex somatossensorial, induz ansiedade e promove comportamento social, respectivamente. Este estudo destaca a estreita interação entre os sistemas imunológico e nervoso, sugerindo que a IL-17 pode ter evoluído originalmente como um neuromodulador antes de ser cooptada pelo sistema imunológico para promover a inflamação. As descobertas oferecem uma nova abordagem terapêutica para condições neurológicas como autismo ou depressão, potencialmente influenciando a função cerebral ao direcionar o sistema imunológico.

Google adota o Protocolo de Contexto de Modelo da Anthropic, seguindo os passos da OpenAI

2025-04-14
Google adota o Protocolo de Contexto de Modelo da Anthropic, seguindo os passos da OpenAI

Seguindo a OpenAI, o Google anunciou que seus modelos Gemini suportarão o Protocolo de Contexto de Modelo (MCP) da Anthropic. O MCP permite que modelos de IA acessem diretamente várias fontes de dados, incluindo ferramentas de negócios, software, repositórios de conteúdo e ambientes de desenvolvimento de aplicativos, permitindo a conclusão de tarefas mais complexas. Essa medida demonstra a aceitação do MCP como um padrão aberto pela indústria e deve acelerar o desenvolvimento e a adoção de aplicativos de IA. O CEO da Google DeepMind, Demis Hassabis, expressou entusiasmo em colaborar com a Anthropic e outras empresas para desenvolver ainda mais o MCP.

IA

DolphinGemma de código aberto: Uma nova ferramenta para pesquisa de cetáceos

2025-04-14
DolphinGemma de código aberto: Uma nova ferramenta para pesquisa de cetáceos

Neste verão, o Projeto Golfinho Selvagem, o Georgia Tech e o Google estão disponibilizando o DolphinGemma como um modelo de código aberto, um modelo acústico treinado em sons de golfinhos manchados do Atlântico. Seu potencial se estende ao estudo de outros cetáceos; os pesquisadores podem ajustá-lo para as vocalizações de diferentes espécies. Ao fornecer essa ferramenta, os pesquisadores podem analisar seus conjuntos de dados acústicos, acelerando a descoberta de padrões e aprofundando nossa compreensão desses mamíferos inteligentes. Essa colaboração combina pesquisa de campo, experiência em engenharia e tecnologia de ponta, abrindo possibilidades emocionantes para preencher a lacuna na comunicação entre humanos e golfinhos.

IA

Estratégia de Motor de Inferência de Código Aberto do DeepSeek: Contribuições Modulares, Não Lançamento Direto

2025-04-14
Estratégia de Motor de Inferência de Código Aberto do DeepSeek: Contribuições Modulares, Não Lançamento Direto

Devido a restrições de recursos, a equipe DeepSeek optou por não lançar diretamente seu motor de inferência interno de código aberto, escolhendo em vez disso colaborar com projetos de código aberto existentes. Eles extrairão componentes reutilizáveis do motor e os contribuirão como bibliotecas independentes, além de compartilhar estratégias de otimização. Essa abordagem visa retribuir de forma sustentável à comunidade de código aberto, promover o desenvolvimento de AGI e garantir que seus benefícios sirvam a toda a humanidade. Esforços futuros priorizarão a sincronização da engenharia de inferência com a comunidade de código aberto e parceiros de hardware para permitir suporte SOTA do Dia 0 para novos lançamentos de modelos.

Assistentes de Codificação de IA sob Ataque: A 'Backdoor' de Arquivo de Regras

2025-04-14
Assistentes de Codificação de IA sob Ataque: A 'Backdoor' de Arquivo de Regras

Pesquisadores da Pillar Security descobriram um novo e perigoso vetor de ataque de cadeia de suprimentos, chamado de "Backdoor de Arquivo de Regras". Essa técnica permite que hackers comprometam silenciosamente o código gerado por IA injetando instruções maliciosas em arquivos de configuração aparentemente inócuos usados por editores de código de IA como Cursor e GitHub Copilot. Explorando caracteres Unicode ocultos e técnicas de evasão sofisticadas, os atacantes manipulam a IA para inserir código malicioso, contornando as revisões de código. Esse ataque é virtualmente invisível, propagando silenciosamente o código malicioso. Usando a própria IA como arma, esse ataque transforma os assistentes confiáveis dos desenvolvedores em cúmplices involuntários, potencialmente afetando milhões de usuários.

Redefinindo a Evolução: Informação Funcional e Complexidade Cósmica

2025-04-14
Redefinindo a Evolução: Informação Funcional e Complexidade Cósmica

Cientistas propõem uma nova teoria da evolução: informação funcional. Essa teoria sugere que processos seletivos impulsionam a evolução de sistemas complexos, não limitados à biologia, mas aplicáveis a minerais, elementos e até mesmo ao universo em si. Essa evolução não é sempre gradual; às vezes, ocorre em saltos, como em pontos-chave da história biológica. O conceito de informação funcional oferece uma nova perspectiva para compreender a origem da complexidade cósmica e a direção da evolução da vida, fornecendo novas vias para pesquisas em astrobiologia, oncologia e outros campos.

MCP: O padrão de fato para integrações de LLM — mas a que custo?

2025-04-14
MCP: O padrão de fato para integrações de LLM — mas a que custo?

O Model Context Protocol (MCP) tornou-se rapidamente o padrão de fato para integração de ferramentas e dados de terceiros com LLMs. No entanto, essa conveniência apresenta riscos significativos de segurança e privacidade. Esta publicação detalha várias vulnerabilidades, incluindo autenticação inadequada, execução de código fornecido pelo usuário e as limitações inerentes dos LLMs no tratamento de grandes conjuntos de dados e autonomia. O MCP pode levar a vazamento de dados confidenciais e agregação de dados não intencional, representando desafios para a segurança corporativa. O autor argumenta que desenvolvedores, aplicativos e usuários devem trabalhar juntos para melhorar a segurança do MCP e usá-lo com cautela para mitigar riscos potenciais.

IA

Para além dos papagaios estocásticos: os circuitos dos modelos de linguagem grandes

2025-04-13
Para além dos papagaios estocásticos: os circuitos dos modelos de linguagem grandes

Modelos de linguagem grandes (LLMs) foram descartados por alguns como meros "papagaios estocásticos", simplesmente memorizando e regurgitando padrões estatísticos de seus dados de treinamento. No entanto, pesquisas recentes revelam uma realidade mais matizada. Os pesquisadores descobriram complexos "circuitos" internos - algoritmos autoaprendidos que resolvem classes de problemas específicas - dentro desses modelos. Esses circuitos permitem a generalização para situações não vistas, como gerar coplas que rimam e até mesmo planejar proativamente a estrutura dessas coplas. Embora existam limitações, essas descobertas desafiam a narrativa do "papagaio estocástico" e levantam questões mais profundas sobre a natureza da inteligência do modelo: os LLMs podem independentemente gerar novos circuitos para resolver problemas totalmente novos?

Meta's Llama 4: Escândalo de Benchmarking Abala o Mundo da IA

2025-04-13
Meta's Llama 4: Escândalo de Benchmarking Abala o Mundo da IA

A família de modelos de linguagem grandes Llama 4, recentemente lançada pela Meta, especificamente a versão Maverick, inicialmente impressionou o mundo da IA com seu desempenho impressionante em benchmarks, superando modelos como o GPT-4o da OpenAI e o Gemini 2.0 Flash do Google. No entanto, rapidamente surgiram discrepâncias entre a versão de benchmark e o modelo disponível publicamente, levando a acusações de trapaça. A Meta admitiu ter usado uma versão especialmente ajustada para benchmarking e, desde então, adicionou o modelo Llama 4 Maverick não modificado ao LMArena, resultando em uma queda significativa na classificação. Este incidente destaca problemas de transparência em benchmarks de modelos grandes e leva a uma reflexão sobre as metodologias de avaliação de modelos.

IA

Desvendando os Ciclos Predador-Presa: As Equações de Lotka-Volterra

2025-04-13

As equações de Lotka-Volterra, também conhecidas como modelo predador-presa de Lotka-Volterra, são um par de equações diferenciais não lineares de primeira ordem frequentemente usadas para descrever a dinâmica de sistemas biológicos em que duas espécies interagem, uma como predadora e a outra como presa. O modelo assume que as presas têm um suprimento ilimitado de alimentos e se reproduzem exponencialmente a menos que sejam predadas; a taxa de predação é proporcional à taxa na qual os predadores e as presas se encontram. O crescimento da população de predadores depende da taxa de predação e é afetado pela taxa de mortalidade natural. As soluções do modelo são deterministas e contínuas, o que significa que as gerações de predadores e presas se sobrepõem continuamente. O modelo de Lotka-Volterra prevê números flutuantes de populações de predadores e presas e revela características do equilíbrio populacional: a densidade de equilíbrio da presa depende dos parâmetros do predador, enquanto a densidade de equilíbrio do predador depende dos parâmetros da presa. O modelo tem encontrado aplicações em economia e marketing, descrevendo a dinâmica em mercados com múltiplos concorrentes, plataformas complementares e produtos.

O Cérebro Ideológico: Como a Neurociência Explica a Polarização Política

2025-04-13
O Cérebro Ideológico: Como a Neurociência Explica a Polarização Política

O novo livro da neurocientista política Leor Zmigrod, *O Cérebro Ideológico: A Ciência Radical do Pensamento Flexível*, explora como as ideologias impactam o cérebro e o corpo humanos. Usando neuroimagem e pesquisa psicológica, Zmigrod revela como as ideologias afetam a flexibilidade cognitiva e a capacidade de resposta, ligando ideologias extremas à atividade em áreas cerebrais específicas, como a amígdala. O livro também examina a relação entre flexibilidade cognitiva e dopamina, e como cultivar criatividade e flexibilidade cognitiva pode aumentar a resistência à influência ideológica. A pesquisa de Zmigrod desafia a noção de pensamento ideológico como mera 'insensibilidade mental', apresentando-o como um processo cognitivo complexo.

Skywork-OR1: Lançamento de poderosos modelos de raciocínio de código aberto

2025-04-13
Skywork-OR1: Lançamento de poderosos modelos de raciocínio de código aberto

A SkyworkAI lançou a série Skywork-OR1 de poderosos modelos de raciocínio de código aberto, incluindo Skywork-OR1-Math-7B, Skywork-OR1-32B-Preview e Skywork-OR1-7B-Preview. Esses modelos, treinados usando aprendizado por reforço baseado em regras em larga escala, se destacam no raciocínio matemático e em código. O Skywork-OR1-Math-7B supera significativamente modelos de tamanho semelhante nos testes AIME24 e AIME25; o Skywork-OR1-32B-Preview atinge níveis de desempenho do Deepseek-R1 em tarefas matemáticas e de codificação; e o Skywork-OR1-7B-Preview supera todos os modelos de tamanho semelhante em ambos os domínios. Os modelos completos e scripts de treinamento serão de código aberto nos próximos dias.

IA
1 3 5 6 7 8 9 28 29