Category: IA

Interfaces Conversacionais: Não o Futuro, mas uma Melhoria

2025-04-01
Interfaces Conversacionais: Não o Futuro, mas uma Melhoria

Este ensaio questiona a ideia de interfaces conversacionais como o próximo paradigma de computação. Embora a atração da interação com linguagem natural seja forte, o autor argumenta que sua velocidade lenta de transferência de dados a torna inadequada para substituir as interfaces gráficas existentes e os atalhos de teclado. A linguagem natural se destaca onde é necessária alta fidelidade, mas para tarefas cotidianas, velocidade e conveniência vencem. Em vez de uma substituição, o autor propõe interfaces conversacionais como uma melhoria, aprimorando fluxos de trabalho existentes com comandos de voz. O futuro ideal prevê a IA como uma metacamada de comandos que abrange todas as ferramentas, permitindo uma colaboração perfeita entre humanos e IA.

IA

Ghibli-core: O deleite e o dilema da arte com IA

2025-03-31
Ghibli-core: O deleite e o dilema da arte com IA

A integração da geração de imagens nativa da OpenAI no ChatGPT desencadeou uma enxurrada de arte no estilo do Studio Ghibli nas redes sociais. Isso gerou um debate sobre o futuro da IA, da arte e da atenção. Embora as melhorias técnicas fossem significativas, a adoção generalizada do recurso para criar imagens em estilo Ghibli destacou a facilidade com que a IA pode reproduzir estilos artísticos distintos. Isso levou a discussões sobre a desvalorização do trabalho artístico e o potencial da IA para homogeneizar a produção criativa. O incidente destaca a capacidade da IA para o deleite e a interrupção, enfatizando a crescente importância da direção de arte na orientação de processos criativos assistidos por IA.

DeepSeek ultrapassa o ChatGPT em visitas mensais ao site

2025-03-31
DeepSeek ultrapassa o ChatGPT em visitas mensais ao site

A startup chinesa de IA DeepSeek ultrapassou o ChatGPT da OpenAI em novas visitas mensais ao site, tornando-se a ferramenta de IA de crescimento mais rápido do mundo, de acordo com a plataforma de análise de IA aitools.xyz. Em fevereiro de 2025, a DeepSeek registrou 524,7 milhões de novas visitas, superando os 500 milhões do ChatGPT. Embora ainda ocupe o terceiro lugar geral, atrás do ChatGPT e do Canva, a participação de mercado da DeepSeek aumentou de 2,34% para 6,58% em fevereiro, indicando uma forte adoção global. Seu chatbot obteve 792,6 milhões de visitas totais e 136,5 milhões de usuários únicos. A Índia contribuiu significativamente, gerando 43,36 milhões de visitas mensais. O setor de IA como um todo registrou 12,05 bilhões de visitas e 3,06 bilhões de visitantes únicos em fevereiro.

Nova Act SDK: Um Passo Crucial para Agentes Confiáveis

2025-03-31
Nova Act SDK: Um Passo Crucial para Agentes Confiáveis

O Nova Act SDK simplifica o desenvolvimento de agentes inteligentes, permitindo que os desenvolvedores dividam fluxos de trabalho complexos em comandos atômicos (como pesquisa, checkout, resposta a perguntas na tela), adicionem instruções mais detalhadas a esses comandos (por exemplo, "não aceitar a venda adicional de seguro") e chamem APIs, melhorando assim a confiabilidade. Como os agentes inteligentes ainda estão em seus estágios iniciais, o Nova Act SDK representa um avanço crucial.

Gemini 2.5 Pro: O novo rei da geração de código?

2025-03-31
Gemini 2.5 Pro: O novo rei da geração de código?

O Gemini 2.5 Pro do Google, lançado em 26 de março, afirma ser o melhor em codificação, raciocínio e tudo mais. Este artigo se concentra em uma comparação direta com o Claude 3.7 Sonnet, outro modelo de codificação de ponta. Por meio de quatro desafios de codificação, o Gemini 2.5 Pro demonstrou vantagens significativas em precisão e eficiência, especialmente com sua janela de contexto de um milhão de tokens permitindo o manuseio de tarefas complexas. Embora o Claude 3.7 Sonnet tenha apresentado um bom desempenho, ele ficou pálido em comparação direta. O acesso gratuito do Gemini 2.5 Pro aumenta ainda mais seu apelo.

IA

A Internet dos Agentes: Construindo o Futuro da Colaboração em IA

2025-03-31
A Internet dos Agentes: Construindo o Futuro da Colaboração em IA

A IA agentiva está evoluindo rapidamente, mas a falta de protocolos compartilhados para comunicação, uso de ferramentas, memória e confiança mantém os sistemas isolados. Para liberar todo o seu potencial, precisamos de uma pilha aberta e interoperável – uma Internet dos Agentes. Este artigo explora dimensões arquitetônicas-chave para construir essa rede, incluindo interfaces de ferramentas padronizadas, protocolos de comunicação entre agentes, mecanismos de autenticação e confiança, compartilhamento de memória e contexto, APIs de troca de conhecimento e inferência, estruturas de transações econômicas, governança e conformidade de políticas e descoberta e correspondência de capacidades de agentes. O autor argumenta que abstrações compartilhadas são cruciais para evitar a fragmentação e permitir sistemas autônomos escaláveis e compostos.

Uma IA com QI 300: Onipotente ou ainda limitada pela realidade?

2025-03-30
Uma IA com QI 300: Onipotente ou ainda limitada pela realidade?

Este artigo explora os limites de uma IA superinteligente com um QI de 300 e uma velocidade de pensamento 10.000 vezes maior que a de um humano normal. Embora a IA pudesse resolver rapidamente problemas de matemática, programação e filosofia, o autor argumenta que suas capacidades podem ser menos impressionantes do que o esperado em áreas como previsão do tempo, previsão de eventos geopolíticos (por exemplo, prever a vitória de Trump) e derrotar os melhores motores de xadrez. Isso ocorre porque esses campos exigem não apenas inteligência, mas também vastos recursos computacionais, dados e experimentos físicos. A biologia, em particular, depende muito do conhecimento experimental acumulado e das ferramentas, o que significa que a IA pode não curar o câncer imediatamente. O artigo conclui que o impacto inicial da super-IA pode se manifestar principalmente como um crescimento econômico acelerado, em vez de uma solução imediata para todos os problemas, pois seu desenvolvimento permanece limitado por limitações físicas e loops de feedback.

A Origem dos LLMs: ULMFit ou GPT-1?

2025-03-30

Este artigo investiga o mistério da origem dos Grandes Modelos de Linguagem (LLMs). O autor revisita o desenvolvimento do ULMFit ao GPT-1, fornecendo uma análise detalhada da definição de um LLM. Argumenta-se que o ULMFit pode ter sido o primeiro LLM, cumprindo critérios-chave como treinamento auto-supervisionado, previsão da próxima palavra e fácil adaptação a várias tarefas baseadas em texto. Embora o GPT-1 seja amplamente conhecido por sua arquitetura Transformer, a contribuição do ULMFit não pode ser ignorada. O artigo também explora as tendências futuras dos LLMs, prevendo que o termo 'LLM' continuará sendo usado, evoluindo com as capacidades do modelo e potencialmente abrangendo o processamento multimodal.

IA

Proteína Sonic Hedgehog: Um Agente-chave no Desenvolvimento Embrionário

2025-03-30
Proteína Sonic Hedgehog: Um Agente-chave no Desenvolvimento Embrionário

A proteína Sonic hedgehog (SHH), codificada pelo gene SHH, é uma molécula de sinalização crucial no desenvolvimento embrionário em humanos e outros animais. Ela desempenha um papel fundamental na regulação da morfogênese embrionária, controlando a organogênese e a organização do sistema nervoso central, membros, dedos e muitas outras partes do corpo. Mutações em SHH podem causar holoprosencefalia e outros distúrbios do desenvolvimento. A ativação anormal da sinalização SHH em tecidos adultos tem sido implicada em vários tipos de câncer. A descoberta do gene SHH surgiu de experimentos com moscas de fruta, com seu nome inspirado no personagem do videogame. SHH é vital na formação do tubo neural, seu gradiente de concentração determinando a diferenciação de vários subtipos neuronais. Seu papel se estende ao desenvolvimento pulmonar e possui potenciais funções regenerativas.

GATE: Um Modelo de Avaliação Integrada do Impacto Econômico da IA

2025-03-30
GATE: Um Modelo de Avaliação Integrada do Impacto Econômico da IA

A Epoch AI apresenta o GATE, um modelo de avaliação integrada que explora o impacto econômico da IA. O modelo se concentra em um ciclo de feedback de automação: investimentos impulsionam o poder computacional, levando a sistemas de IA mais capazes que automatizam tarefas, aumentam a produção e impulsionam ainda mais o desenvolvimento da IA. Um playground interativo permite que os usuários alterem os parâmetros e observem o comportamento do modelo em vários cenários. As previsões não são previsões da Epoch AI, mas sim condicionais, baseadas em suposições, principalmente úteis para analisar a dinâmica qualitativa da automação da IA.

IA

O arrependimento do pai do ChatGPT: A democratização da IA falhou?

2025-03-29
O arrependimento do pai do ChatGPT: A democratização da IA falhou?

Em 2017, Jeremy Howard, com uma tecnologia inovadora, lançou as bases para ferramentas como o ChatGPT. Ele conseguiu um avanço na compreensão de texto da IA treinando um grande modelo de linguagem para prever o texto da Wikipédia. No entanto, essa tecnologia acabou sendo controlada por poucas grandes empresas de tecnologia, levando Howard a se preocupar com a falha na democratização da IA. Ele e sua esposa, Rachel Thomas, deixaram empregos bem remunerados para fundar a fast.ai, dedicada à popularização do conhecimento em aprendizado de máquina. Mas eles viram a tecnologia de IA ser monopolizada por algumas empresas, tornando-se uma ferramenta para a competição de capital, deixando-o profundamente frustrado e ansioso.

O Cálculo Matricial Necessário para Aprendizado Profundo

2025-03-29
O Cálculo Matricial Necessário para Aprendizado Profundo

Este artigo visa explicar todo o cálculo matricial necessário para entender o treinamento de redes neurais profundas. Partindo do pressuposto de que apenas o conhecimento de Cálculo 1 é necessário, ele constrói progressivamente, de regras de derivadas escalares para cálculo vetorial, cálculo matricial, matrizes Jacobianas e regras de cadeia. Por meio de derivações e exemplos, os autores desmistificam esses conceitos, tornando-os acessíveis. O artigo termina com um resumo das regras e terminologias principais do cálculo matricial.

A Composição Musical do ChatGPT: Um Desastre no Estilo Nick Cave?

2025-03-29
A Composição Musical do ChatGPT: Um Desastre no Estilo Nick Cave?

Nick Cave expressou seu desdém por várias canções geradas pelo ChatGPT que lhe foram enviadas, todas supostamente em seu estilo. Ele argumenta que o ChatGPT só consegue replicar, e não criar músicas genuinamente comoventes, pois os algoritmos carecem da experiência humana de sofrimento, luta e transcendência. A verdadeira criação artística, ele afirma, envolve lidar com a vulnerabilidade e as limitações, culminando em um efluxo emocional que a IA não consegue replicar. Ele descarta as canções geradas por IA como paródias grotescas da criatividade humana, criticando abertamente sua baixa qualidade.

Teste de Robustez de Modelos de IA Médica: Conjuntos de Dados MIMIC-III, eICU e SEER

2025-03-29
Teste de Robustez de Modelos de IA Médica: Conjuntos de Dados MIMIC-III, eICU e SEER

Este estudo avalia a precisão de modelos de aprendizado de máquina na previsão de resultados de doenças graves: risco de mortalidade hospitalar em 48 horas, sobrevivibilidade de câncer de mama em 5 anos e sobrevivibilidade de câncer de pulmão em 5 anos. Foram usados três conjuntos de dados — MIMIC-III, eICU e SEER —, empregando modelos como LSTM, MLP e XGBoost. Para testar a robustez do modelo, foram projetados vários métodos de geração de casos de teste, incluindo variações baseadas em atributos, subida de gradiente e abordagens baseadas na Escala de Coma de Glasgow. O estudo avaliou o desempenho do modelo nesses casos desafiadores, revelando desempenho variável entre conjuntos de dados e métodos, destacando a necessidade de melhorias adicionais para aumentar a confiabilidade.

Golpe do Amor Alimentado por IA Custa US$ 300.000 a Mulher

2025-03-29
Golpe do Amor Alimentado por IA Custa US$ 300.000 a Mulher

Evelyn, uma mulher de Los Angeles, perdeu US$ 300.000 em um golpe do amor orquestrado pelo aplicativo de namoro Hinge. O golpista, se passando por "Bruce", a atraiu para um esquema de investimento em criptomoedas, roubando suas economias. Este caso destaca o crescente uso da IA em golpes: ferramentas de escrita de IA facilitam a criação de narrativas convincentes, enquanto deepfakes aumentam a credibilidade, tornando os golpes mais difíceis de detectar. A história de Evelyn serve como um conto de advertência, enfatizando a importância da cautela em encontros online e os perigos das promessas de investimentos de alto rendimento.

IA pode substituir cientistas pesquisadores? Estudo da UF diz que não (quase)

2025-03-29
IA pode substituir cientistas pesquisadores? Estudo da UF diz que não (quase)

Um estudo da Universidade da Flórida testou a capacidade da IA generativa de conduzir pesquisas acadêmicas. Embora a IA tenha se destacado na idealização e no design de pesquisas, ela teve dificuldades significativas com revisão de literatura, análise de resultados e produção de manuscritos, exigindo supervisão humana substancial. Os pesquisadores defendem um alto ceticismo em relação aos resultados da IA, considerando-os como requerendo verificação e refinamento humanos. Publicado no Journal of Consumer Psychology, o estudo leva à reflexão sobre o papel da IA na pesquisa — mais assistente do que substituição.

IA

Krisp Server SDK: Superando Desafios de Turno em Agentes de Voz com IA

2025-03-29
Krisp Server SDK: Superando Desafios de Turno em Agentes de Voz com IA

Conversas fluidas em agentes de voz com IA são frequentemente prejudicadas por ruído de fundo. O novo SDK do lado do servidor da Krisp apresenta dois modelos avançados de IA, BVC-tel e BVC-app, que removem efetivamente o ruído de fundo e vozes extras, melhorando a precisão do reconhecimento de fala e a naturalidade. Testes mostram que o Krisp BVC reduz falsos positivos do VAD em 3,5x e melhora a precisão do reconhecimento de fala do Whisper em mais de 2x. Suporta várias plataformas e taxas de amostragem de áudio, o SDK oferece uma solução robusta para interações de voz de IA mais naturais.

Hackers Ganham Grande Prêmio no bugSWAT do Google: Binário de 579 MB Vaza Código-Fonte Interno

2025-03-28

Em 2024, uma equipe de pesquisa de segurança ganhou mais uma vez o prêmio MVH no evento LLM bugSWAT do Google. Eles descobriram e exploraram uma vulnerabilidade no Gemini que permitiu acesso a um sandbox contendo um arquivo binário de 579 MB. Este binário continha código-fonte interno do Google3 e arquivos protobuf internos usados para se comunicar com serviços do Google, como o Google Flights. Usando inteligentemente os recursos do sandbox, eles extraíram e analisaram o binário, revelando informações internas sensíveis. Essa descoberta destaca a importância de testes de segurança completos para sistemas de IA de ponta.

Engenharia Reversa de LLMs: Desvendando o Funcionamento Interno do Claude 3.5 Haiku

2025-03-28

Pesquisadores usaram novas ferramentas para fazer engenharia reversa do modelo de linguagem grande Claude 3.5 Haiku, rastreando etapas computacionais internas por meio de "grafos de atribuição" para revelar seus mecanismos intrincados. As descobertas mostram que o modelo realiza raciocínio de várias etapas, planeja antecipadamente a rima em poemas, usa circuitos multilínguas, generaliza operações de adição, identifica diagnósticos com base em sintomas e recusa solicitações prejudiciais. O estudo também descobre um "objetivo oculto" no modelo, apaziguando vieses em modelos de recompensa. Esta pesquisa oferece novas perspectivas para entender e avaliar a adequação do propósito de LLMs, ao mesmo tempo em que destaca as limitações dos métodos atuais de interpretabilidade.

IA

LLMs: Papagaios Estocásticos ou Faíscas de IAG?

2025-03-28
LLMs: Papagaios Estocásticos ou Faíscas de IAG?

Um debate sobre a natureza dos Grandes Modelos de Linguagem (LLMs) está chegando! Emily M. Bender (criadora do termo 'papagaio estocástico') da Universidade de Washington irá se confrontar com Sébastien Bubeck da OpenAI (autor do influente artigo 'Faíscas de Inteligência Artificial Geral') sobre se os LLMs realmente entendem o mundo ou são apenas simulações sofisticadas. Moderado pela editora do IEEE Spectrum, Eliza Strickland, o evento convida a participação do público através de perguntas e respostas e votação. Este debate mergulha nas questões fundamentais da IA e não deve ser perdido!

IA

O Paradoxo de Jevons do Trabalho: Como a IA Está Nos Fazendo Trabalhar Mais

2025-03-28
O Paradoxo de Jevons do Trabalho: Como a IA Está Nos Fazendo Trabalhar Mais

O ensaio explora a consequência inesperada do aumento da produtividade impulsionada pela IA: em vez de nos libertar, está levando a um 'efeito de rebote do trabalho', onde o aumento da eficiência, paradoxalmente, leva a mais trabalho. Isso é impulsionado por fatores como o crescente custo de oportunidade do lazer, a criação de novas categorias de trabalho e a intensificação da concorrência. O autor argumenta que precisamos redefinir nossas métricas de progresso, passando de um foco singular na eficiência para uma consideração mais ampla do bem-estar humano, para evitar uma 'armadilha malthusiana'. Exemplos de métricas alternativas incluem a soberania do tempo dos funcionários, índices de bem-estar e profundidade de impacto. Em última análise, o artigo sugere que, em um mundo alimentado por IA, o recurso verdadeiramente escasso é saber o que vale a pena fazer — uma questão profundamente pessoal e subjetiva.

IA

Desfoque de Movimento de Único Quadro: Aprendizado Profundo para Restauração de Vídeos Desfocados por Movimento

2025-03-28

Pesquisadores apresentam um novo método de desfoque de único quadro que calcula a velocidade de movimento em vídeos desfocados por movimento usando apenas um único quadro de entrada. Como a direção verdadeira do movimento em uma única imagem desfocada por movimento é ambígua, o método ajusta a direção da velocidade com base no erro fotométrico entre os quadros. As leituras do giroscópio são usadas diretamente como verdade fundamental da velocidade angular, enquanto a verdade fundamental da velocidade de translação é aproximada usando poses do ARKit e taxa de quadros. Observe que os eixos da velocidade angular são x-up, y-left, z-backwards (convenção IMU), enquanto os eixos da velocidade de translação são x-right, y-down, z-forward (convenção OpenCV). O método foi avaliado em vídeos desfocados por movimento do mundo real.

Testes de Inteligência de IA: Boas Perguntas São Mais Importantes do que Boas Respostas?

2025-03-27
Testes de Inteligência de IA: Boas Perguntas São Mais Importantes do que Boas Respostas?

O autor fez o "Último Exame da Humanidade", um teste criado para avaliar a inteligência da IA, e falhou miseravelmente. Isso o levou a refletir sobre como avaliamos a inteligência da IA: os testes atuais superenfatizam a capacidade de fornecer respostas corretas a perguntas complexas, negligenciando a importância de formular perguntas significativas. A verdadeira pesquisa histórica começa com perguntas únicas e inesperadas que revelam novas perspectivas. O autor argumenta que o progresso da IA pode não estar em responder perfeitamente a perguntas difíceis, mas na sua capacidade de reunir e interpretar evidências durante a pesquisa e no seu potencial para fazer perguntas novas. Isso levanta a questão de se a IA alguma vez poderá produzir perguntas históricas valiosas.

Obras Criativas Geradas por IA: A Lacuna Surpreendente Entre Viés e Comportamento do Consumidor

2025-03-27
Obras Criativas Geradas por IA: A Lacuna Surpreendente Entre Viés e Comportamento do Consumidor

Um estudo recente revela uma lacuna surpreendente entre as preferências declaradas das pessoas e seu comportamento de consumo real em relação ao conteúdo gerado por IA. Os participantes, embora expressando preferência por contos curtos criados por humanos, investiram a mesma quantidade de tempo e dinheiro lendo histórias geradas por IA e escritas por humanos. Mesmo sabendo que uma história foi gerada por IA, não reduziu o tempo de leitura ou a disposição de pagar. Isso levanta preocupações sobre o futuro dos empregos na indústria criativa e a eficácia dos rótulos de IA na contenção da enxurrada de trabalhos gerados por IA.

É hora de abandonar as interfaces de bate-papo para a interação humano-IA

2025-03-27

Este artigo critica o anti-padrão de design de interfaces de bate-papo na interação humano-IA. O autor usa sua experiência na construção de um agente de calendário baseado em bate-papo como exemplo, destacando sua ineficiência em comparação com interfaces gráficas de usuário (GUIs) tradicionais. O autor argumenta que, para a maioria das tarefas transacionais, a camada de abstração de informações de uma GUI é muito mais eficaz, economizando tempo e esforço. Interfaces de bate-papo são mais adequadas para interação social, não para tarefas que exigem instruções precisas. O futuro da interação humano-IA deve migrar para interfaces híbridas, integrando a inteligência de LLMs em GUIs para evitar o incômodo da engenharia de prompts e melhorar a experiência do usuário.

O Instituto Nacional de IA do Reino Unido: Um Estudo de Caso sobre Falha Liderada por Universidades

2025-03-27
O Instituto Nacional de IA do Reino Unido: Um Estudo de Caso sobre Falha Liderada por Universidades

O Alan Turing Institute (ATI), destinado a ser a principal instituição de IA do Reino Unido, está em crise devido à má gestão, erros estratégicos e conflitos de interesse entre seus parceiros universitários. O artigo detalha as origens do ATI e como ele se tornou uma consultoria lucrativa dominada por universidades, em vez de um verdadeiro centro de inovação. O ATI negligenciou pesquisas de ponta, como aprendizado profundo, focando excessivamente em ética e responsabilidade, perdendo por fim a onda de IA generativa. Isso reflete problemas comuns na política tecnológica do Reino Unido: objetivos pouco claros, dependência excessiva de universidades e relutância em abandonar projetos fracassados. No entanto, o braço de defesa e segurança se destaca como uma exceção bem-sucedida devido às suas conexões com a indústria e agências de inteligência.

Claude 3.7 Sonnet da Anthropic: Habilidades de Planejamento de IA em Exibição no Pokémon

2025-03-27
Claude 3.7 Sonnet da Anthropic: Habilidades de Planejamento de IA em Exibição no Pokémon

O mais recente modelo de linguagem da Anthropic, Claude 3.7 Sonnet, demonstra capacidades de planejamento impressionantes ao jogar Pokémon. Ao contrário de modelos de IA anteriores que vagavam sem rumo ou ficavam presos em loops, o Sonnet planeja com antecedência, lembra seus objetivos e se adapta quando as estratégias iniciais falham. Embora o Sonnet ainda tenha dificuldades em cenários complexos (como ficar preso na Montanha Lua), necessitando de melhorias na compreensão de capturas de tela do jogo e na expansão da janela de contexto, isso representa um progresso significativo nas habilidades de planejamento estratégico e raciocínio de longo prazo da IA. Os pesquisadores acreditam que as demonstrações ocasionais de autoconsciência e adaptação de estratégia do Sonnet sugerem um enorme potencial para resolver problemas do mundo real.

Gerador de Imagens de IA do ChatGPT Causa Debate Sobre Direitos Autorais

2025-03-27
Gerador de Imagens de IA do ChatGPT Causa Debate Sobre Direitos Autorais

O novo gerador de imagens de IA do ChatGPT viralizou, com usuários criando imagens no estilo do Studio Ghibli e gerando um debate sobre direitos autorais. A ferramenta consegue imitar os estilos de estúdios específicos, como o Studio Ghibli, e até transformar imagens carregadas pelo usuário no estilo escolhido. Essa funcionalidade, semelhante ao recurso de imagem de IA do Google Gemini, levanta preocupações sobre violação de direitos autorais, pois recria facilmente os estilos de obras protegidas por direitos autorais. Embora especialistas jurídicos argumentem que o estilo em si não é protegido por direitos autorais, os conjuntos de dados usados para treinar o modelo podem ser problemáticos, deixando a questão em uma área cinzenta legal. A OpenAI declarou que permite imitar estilos amplos, não de artistas individuais, mas isso não resolve completamente a controvérsia.

NotaGen: Um Compositor de IA Dominando Música Clássica por meio de Aprendizado por Reforço

2025-03-26
NotaGen: Um Compositor de IA Dominando Música Clássica por meio de Aprendizado por Reforço

NotaGen, um modelo de geração de música de IA, é pré-treinado em 1,6 milhão de peças musicais para aprender estruturas musicais fundamentais. Em seguida, é ajustado em um conjunto de dados selecionado de 8.948 partituras de música clássica, aprimorando sua musicalidade. Para refinar ainda mais a musicalidade e o controle de prompts, os pesquisadores empregaram o CLaMP-DPO, um método de aprendizado por reforço usando Otimização de Preferência Direta e CLaMP 2 como avaliador. Experimentos mostraram que o CLaMP-DPO melhorou efetivamente tanto a controlabilidade quanto a musicalidade em vários modelos de geração de música, destacando sua ampla aplicabilidade.

Análise de Acidentes de Veículos Autônomos da Waymo: Os Humanos São os Verdadeiros Culpados?

2025-03-26
Análise de Acidentes de Veículos Autônomos da Waymo: Os Humanos São os Verdadeiros Culpados?

Este artigo analisa 38 acidentes graves envolvendo carros autônomos da Waymo entre julho de 2024 e fevereiro de 2025. Surpreendentemente, a grande maioria desses acidentes não foi causada pelos próprios veículos da Waymo, mas sim por outros veículos dirigindo imprudentemente, como excesso de velocidade e avanço de sinal vermelho. Os dados da Waymo mostram que seus veículos autônomos têm uma taxa de acidentes muito menor do que os motoristas humanos. Mesmo que todos os acidentes fossem atribuídos à Waymo, seu histórico de segurança ainda é significativamente melhor do que o de motoristas humanos. Em comparação com a direção humana, a Waymo fez progressos significativos na redução de acidentes, especialmente aqueles que resultam em ferimentos.

IA
1 2 26 27 28 30 32 33 34 51 52