LLMs falham graciosamente: o desempenho em contextos longos se degrada mesmo em tarefas simples

2025-07-15
LLMs falham graciosamente: o desempenho em contextos longos se degrada mesmo em tarefas simples

Esta pesquisa desafia a suposição comum de que grandes modelos de linguagem (LLMs) apresentam um desempenho uniforme em tarefas de contexto longo. Ao expandir o benchmark Needle in a Haystack e introduzir variáveis como correspondência semântica e distrações, os pesquisadores descobriram que, mesmo em condições simplificadas, o desempenho do modelo se degrada à medida que o comprimento da entrada aumenta. Isso foi confirmado em perguntas e respostas conversacionais e em uma tarefa de replicação de palavras repetidas, revelando limitações nas capacidades de contexto longo de LLM e sugerindo potenciais desafios em aplicativos do mundo real.

Leia mais

WhatsApp lança o Processamento Privado: IA com privacidade de ponta a ponta

2025-05-02
WhatsApp lança o Processamento Privado: IA com privacidade de ponta a ponta

O WhatsApp apresenta o Processamento Privado, um recurso opcional que permite o processamento de mensagens por IA em um ambiente seguro e confidencial. Usando Ambientes de Execução Confiáveis (TEEs), essa tecnologia permite que os usuários solicitem recursos com IA, como resumo de mensagens, sem que o Meta ou o WhatsApp acessem seus dados. Construído com base nos princípios de opcionalidade, transparência e controle do usuário, o Processamento Privado emprega medidas de segurança robustas, incluindo processamento confidencial, transparência verificável e não-alvo. O WhatsApp está publicando componentes do Processamento Privado e expandindo seu programa de recompensas por bugs para promover pesquisas de segurança independentes, garantindo que a privacidade do usuário permaneça primordial.

Leia mais
Desenvolvimento

Memes: Imagens Pobres na Era do Conteúdo de Alta Resolução

2025-06-21
Memes: Imagens Pobres na Era do Conteúdo de Alta Resolução

Este artigo explora a natureza dos memes da internet e sua complexa relação com estruturas sociopolíticas e econômicas. Começando com a teoria de Hito Steyerl sobre a "imagem pobre", o autor argumenta que os memes, como uma forma dominante da imagem pobre contemporânea, refletem a condição afetiva das massas e a realidade social. A peça critica a tendência de simplificar e personalizar fenômenos culturais como memes, sugerindo que essa atitude de "não é tão profundo" decorre de individualismo e anti-intelectualismo arraigados, prejudicando a crítica sistêmica e as soluções para os problemas sociais. O autor apela para um engajamento crítico com as tendências culturais e a ação coletiva para enfrentar problemas sistêmicos, em vez de recorrer a julgamentos morais individuais.

Leia mais

O Alto Custo do Plantão: Como Empresas de Tecnologia Exploram Seus Engenheiros

2025-03-27
O Alto Custo do Plantão: Como Empresas de Tecnologia Exploram Seus Engenheiros

Este artigo examina os efeitos generalizados e prejudiciais dos rodízios de engenheiros de plantão em empresas de tecnologia. Usando a experiência de um engenheiro chamado Alex como um estudo de caso, ele destaca o estresse imenso e o esgotamento associados aos deveres de plantão, incluindo disponibilidade constante, privação do sono, limites confusos entre trabalho e vida pessoal e a falta de compensação adequada. O artigo critica a cultura prevalecente que normaliza a exploração inerente a tais sistemas, instando as empresas a reconsiderarem suas políticas de plantão e a fornecerem compensação justa e proteção para o bem-estar de seus engenheiros.

Leia mais

Preços de SSO de SaaS: Imposto de Segurança ou Ganho de Receita?

2025-08-19

Este artigo expõe os preços exorbitantes dos recursos de Single Sign-On (SSO) em vários fornecedores de SaaS. Muitos fornecedores bloqueiam o SSO em planos 'Enterprise' caros, muitas vezes aumentando o preço em várias centenas de por cento ou até mais. O autor argumenta que o SSO é um requisito de segurança crítico e os aumentos de preços massivos não são justificados pelos custos de manutenção, mas sim representam uma oportunidade de lucro. O artigo apela aos fornecedores de SaaS para que incluam o SSO nas ofertas principais ou o ofereçam como um complemento com preço razoável, não como um impedimento para melhores práticas de segurança.

Leia mais
Tecnologia

Emulador de PC Retro no Raspberry Pi Pico: Pico-286

2025-08-19
Emulador de PC Retro no Raspberry Pi Pico: Pico-286

O projeto Pico-286 é uma façanha notável de emulação, trazendo a experiência clássica de PC do final dos anos 80 e início dos anos 90 para o Raspberry Pi Pico. Este projeto leve oferece uma maneira divertida de explorar a computação retro e aprender sobre emulação de sistemas de baixo nível. Ele suporta várias CPUs Intel (até 286), uma variedade de periféricos clássicos (placas de som, placas de vídeo) e vários modos gráficos e de texto. O Pico-286 até emula as cores de artefato produzidas por monitores antigos! Este projeto de código aberto é multiplataforma e roda no Raspberry Pi Pico, Windows e Linux.

Leia mais
Desenvolvimento

Bilhete de transporte público barato da Alemanha: grande vitória ambiental, mas preocupações com a equidade permanecem

2025-04-04
Bilhete de transporte público barato da Alemanha: grande vitória ambiental, mas preocupações com a equidade permanecem

O bilhete de transporte público de baixo custo da Alemanha, o "Deutschlandticket", é uma grande história de sucesso ambiental, reduzindo as emissões de CO2 em 4,2 a 6,5 milhões de toneladas anualmente, de acordo com uma nova pesquisa. Esse sucesso decorre da atração de novos usuários que raramente usavam o transporte público antes, mudando muitas viagens de carro para trem, especialmente para viagens de cerca de 30 quilômetros. No entanto, um estudo separado revela disparidades de preços significativas entre as regiões, com algumas oferecendo descontos substanciais enquanto outras não, tornando o bilhete inacessível para pessoas de baixa renda. Os defensores estão pressionando por um "Sozial Deutschlandticket" subsidiado para resolver essa lacuna de equidade.

Leia mais
Tecnologia equidade social

Sobrecarga de Desempenho do OpenTelemetry: Benchmark de um Aplicativo Go

2025-06-16
Sobrecarga de Desempenho do OpenTelemetry: Benchmark de um Aplicativo Go

Esta publicação avalia a sobrecarga de desempenho do OpenTelemetry em um ambiente de alta carga usando um servidor HTTP Go simples. Os resultados mostram um aumento de aproximadamente 35% no uso da CPU, um pequeno aumento na memória e um aumento significativo no tráfego de rede ao habilitar o OpenTelemetry. O autor compara o uso do SDK do OpenTelemetry com o monitoramento baseado em eBPF, constatando que este último é significativamente mais leve em cenários de alta carga, especialmente quando apenas métricas são coletadas. A conclusão é que a sobrecarga do OpenTelemetry não é proibitiva, mas a escolha da abordagem de monitoramento certa é crucial, exigindo uma compensação entre desempenho e observabilidade com base nas necessidades específicas.

Leia mais
Desenvolvimento Benchmark de Desempenho

Diretório de Exemplos FlashLearn: Guia de Início Rápido para Modelos de IA

2025-02-09
Diretório de Exemplos FlashLearn: Guia de Início Rápido para Modelos de IA

O FlashLearn fornece um diretório de scripts de exemplo para que os usuários possam começar rapidamente a usar seus modelos de IA. Basta instalar o FlashLearn, definir sua chave de API e executar os scripts Python fornecidos (por exemplo, sentiment_classification.py) para experimentar funcionalidades como classificação de sentimento. Os resultados são exibidos no console e em um arquivo results.jsonl.

Leia mais
Desenvolvimento scripts Python

Invenção acidental de TV de raios-X na Alemanha nazista: O Mundo Sem Máscara

2025-02-13
Invenção acidental de TV de raios-X na Alemanha nazista: O Mundo Sem Máscara

Nesta comédia alemã de 1934, o engenheiro eletricista desempregado Harry Palmer (Harry Piel) inventa acidentalmente uma televisão de raios-X enquanto ajuda o inventor Tobias Bern. Embora não tenha as acrobacias perigosas típicas de Piel, os elementos cômicos do filme, em grande parte graças a Kurt Vespermann, compensam. O filme oferece um vislumbre da tecnologia de televisão no início da Alemanha nazista, criticando sutilmente os capitalistas e o mau uso da tecnologia, refletindo o contexto sociopolítico da época. Apesar de uma trama um tanto previsível, é um filme interessante que mostra um período menos conhecido da história do cinema.

Leia mais

Sensores de câmera de smartphones revolucionam a pesquisa de antimatéria

2025-04-07
Sensores de câmera de smartphones revolucionam a pesquisa de antimatéria

A colaboração AEgIS, liderada pela Universidade Técnica de Munique, reutilizou sensores de câmera de smartphones para criar um detector capaz de gerar imagens de aniquilações de antiprótons em tempo real com resolução sem precedentes de 0,6 micrômetros - uma melhoria de 35 vezes. Essa inovação, usando 60 sensores de câmera integrados para um total de 3840 megapixels, supera os métodos anteriores que dependiam de placas fotográficas. A análise humana das imagens, apesar de demorada, foi crucial para alcançar essa precisão. Essa tecnologia abre novas possibilidades para o estudo da aniquilação de antipartículas de baixa energia e os efeitos gravitacionais no anti-hidrogênio.

Leia mais
Tecnologia

A Arte da Comunicação: Como Conselhos Bem-Intencionados Podem Dar Errado

2025-02-27
A Arte da Comunicação: Como Conselhos Bem-Intencionados Podem Dar Errado

O autor relata um desentendimento de comunicação no trabalho: sua avaliação honesta das deficiências da equipe, com a intenção de incentivar melhorias, ofendeu involuntariamente colegas e potencialmente causou consequências negativas. Isso o levou a perceber que, mesmo com boas intenções, as perspectivas individuais e os estilos de comunicação podem levar a mal-entendidos. O artigo enfatiza a importância de evitar críticas pessoais diretas ao defender melhorias, focando na equipe como um todo, usando uma abordagem orientada para oportunidades coletivas, respeitando os sentimentos dos outros e escolhendo cuidadosamente o tempo e o método de comunicação.

Leia mais
Diversos

GraalVM para JDK 24 Lançado: Aumento de Desempenho e Binários Menores

2025-03-18
GraalVM para JDK 24 Lançado: Aumento de Desempenho e Binários Menores

O GraalVM para JDK 24 foi lançado! Esta versão apresenta melhorias significativas, incluindo o GraalNN, uma otimização baseada em aprendizado de máquina que aumenta o desempenho de pico em cerca de 7,9% em média em vários benchmarks de microsserviços; o SkipFlow, que reduz o tamanho dos executáveis nativos em cerca de 6,35%; suporte aprimorado para premain de agentes Java; e otimizações do Vector API que correspondem ao desempenho do JIT. Os recursos de segurança também foram aprimorados, como o suporte SBOM aprimorado, juntamente com aprimoramentos de depuração e monitoramento. No geral, o GraalVM 24 oferece melhorias notáveis em desempenho, tamanho e segurança, tornando-o uma atualização vantajosa para desenvolvedores.

Leia mais
Desenvolvimento

A Revolução da IA Destrói a Entrevista de Tecnologia – E Agora?

2025-06-04
A Revolução da IA Destrói a Entrevista de Tecnologia – E Agora?

A ascensão da IA quebrou fundamentalmente o processo tradicional de entrevista de engenharia de software. Este artigo argumenta que os LLMs agem como espelhos, refletindo a habilidade do operador. Com a IA resolvendo facilmente desafios de codificação, identificar candidatos realmente habilidosos é um grande obstáculo. O autor sugere que as entrevistas devem avaliar não apenas o entendimento teórico dos LLMs (como o Protocolo de Contexto de Modelo), mas também a aplicação prática – observando como os candidatos interagem com os LLMs, gerenciam janelas de contexto, depuram, criticam o código gerado e demonstram pensamento crítico. Agilidade de aprendizado, resiliência e uma mentalidade de engenharia de produto também são cruciais. Embora uma solução perfeita permaneça evasiva, observar as interações dos candidatos com os LLMs é atualmente o método de avaliação mais eficaz. O alto custo desse processo intensivo apresenta um desafio adicional.

Leia mais

Eliminando Vulnerabilidades de Segurança de Memória: Um Compromisso Coletivo com o Design Seguro

2025-02-26
Eliminando Vulnerabilidades de Segurança de Memória: Um Compromisso Coletivo com o Design Seguro

Por décadas, vulnerabilidades de segurança de memória têm assolado a indústria de tecnologia, custando bilhões e corroendo a confiança. Abordagens tradicionais não têm sido suficientes. Esta publicação defende uma mudança fundamental para práticas de "design seguro" para eliminar essas vulnerabilidades. Avanços recentes em linguagens seguras para memória (como Rust) e tecnologias de hardware (como o MTE da ARM) tornam isso alcançável. Os autores propõem uma estrutura padronizada para avaliar objetivamente as garantias de segurança de memória, incentivando os fornecedores a investir e, em última análise, permitindo que os clientes exijam e recompensem a segurança, impulsionando a aquisição de sistemas mais seguros. Isso requer uma estrutura neutra em relação à tecnologia, apoiando abordagens diversas, adaptando os requisitos de segurança com base nas necessidades, visando, em última análise, um mundo digital seguro.

Leia mais
Desenvolvimento design seguro

Os oceanos antigos da Terra eram verdes?

2025-04-27
Os oceanos antigos da Terra eram verdes?

Um novo estudo publicado na Nature Geoscience desafia nossa compreensão dos oceanos da Terra. Os pesquisadores sugerem que, bilhões de anos atrás, os oceanos eram verdes, e não azuis! A alta dissolução de ferro de rochas continentais levou a oceanos ricos em ferro, tornando a luz verde dominante debaixo d'água. As cianobactérias primitivas se adaptaram evoluindo pigmentos que absorviam a luz verde, resultando em um oceano verde. Esta pesquisa revela um capítulo fascinante da história da Terra e sugere a possibilidade de mudanças futuras na cor dos oceanos.

Leia mais
Tecnologia Oceano Cianobactérias

IAPSOP: Um Arquivo Digital de Periódicos Espíritas e Ocultos

2025-08-19

O IAPSOP, uma organização privada com sede nos EUA, preserva digitalmente periódicos espíritas e ocultos publicados entre o Congresso de Viena e a Segunda Guerra Mundial. Gerenciado totalmente por voluntários, eles digitalizam, indexam e fornecem gratuitamente esses periódicos a estudantes e pesquisadores. Eles buscam ativamente doações de materiais e trabalho e recebem consultas de vendedores. O site oferece vários pontos de acesso: pesquisa direta no arquivo, listas temáticas e um arquivo de lições. Entre em contato com o Suporte ao Cliente do IAPSOP para obter ajuda ou em caso de problemas técnicos.

Leia mais
Diversos oculto periódicos

LightCell: Um Motor Revolucionário Acionado por Luz

2025-01-17

A LightSail Energy está desenvolvendo um motor revolucionário chamado LightCell que gera eletricidade usando luz monocromática emitida por sódio quente produzido pela queima de hidrogênio ou outros combustíveis. Este motor combina inteligentemente termofotovoltaica, uma cavidade óptica e um trocador de calor cerâmico para reciclar o calor residual, atingindo até 40% de eficiência de conversão de energia. A tecnologia central utiliza fótons de 2,1 eV de transições atômicas de sódio, capturados eficientemente por células fotovoltaicas com folga de banda ajustada com precisão. O LightCell possui alta densidade de energia, baixo ruído e modularidade, prometendo uma grande inovação na energia do futuro.

Leia mais

Multi-Timer caseiro: Uma história de despertadores e eliminadores de bateria

2025-08-31

Inspirado em um multi-timer baseado em Raspberry Pi de um amigo, o autor embarcou em um projeto DIY usando despertadores facilmente disponíveis. Tentativas iniciais de modificar os relógios diretamente se mostraram infrutíferas, levando a um despertador quebrado. No entanto, uma solução inteligente usando eliminadores de bateria e interruptores permitiu o controle independente de vários relógios. O multi-timer resultante, embora não seja de precisão, serve como uma decoração divertida para o escritório e uma ferramenta para estimativa de tempo aproximada, provando que a criatividade e um pouco de falha podem levar a um hack satisfatório.

Leia mais

Cinder JIT: Representação Eficiente de Tipos Usando Bitsets e Semirreticulados

2025-03-11
Cinder JIT: Representação Eficiente de Tipos Usando Bitsets e Semirreticulados

O compilador JIT Cinder emprega uma representação de tipo inteligente, tratando tipos como conjuntos (mesmo reticulados) e escolhendo uma representação compacta de bitset. Este artigo examina como o Cinder utiliza bitsets e estruturas de semirreticulado para tratamento eficiente de informações de tipo, cobrindo a representação de tipos básicos, uniões de tipos e especialização. Codificando informações de tipo em bitsets, o Cinder representa efetivamente uniões de tipos e permite distinções de tipos mais granulares. Além disso, o Cinder introduz um mecanismo de especialização para rastrear o valor específico de objetos individuais, melhorando ainda mais a eficiência de otimização do compilador. O artigo também discute o tipo Bottom e detalhes sobre a geração da rede de tipos.

Leia mais
Desenvolvimento Sistema de tipos Bitsets

Kiro: O IDE agente da Amazon que revoluciona o desenvolvimento

2025-07-25
Kiro: O IDE agente da Amazon que revoluciona o desenvolvimento

Como um Community Builder da AWS, obtive acesso antecipado ao Kiro, o novo IDE de desenvolvimento com tecnologia de IA da Amazon. O Kiro não é apenas mais uma ferramenta de preenchimento de código; é um IDE 'agente' capaz de entender e executar projetos complexos de várias etapas. Construí um site de portfólio, contribuí para projetos de código aberto e desenvolvi ferramentas internas, demonstrando o aumento significativo de produtividade do Kiro. O núcleo do Kiro é o 'desenvolvimento orientado a especificações': invista tempo antecipadamente definindo requisitos e arquitetura, e deixe o Kiro executar autonomamente grande parte da codificação. Embora o Kiro tenha limitações — pode precisar de intervenção manual em problemas complexos —, ele sinaliza uma mudança fundamental no desenvolvimento de software: de escrever código para direcionar a IA.

Leia mais
Desenvolvimento IDE Agente

Silksong: Uma Delícia para Masoquistas

2025-09-09
Silksong: Uma Delícia para Masoquistas

A dificuldade brutal de Silksong desafia a definição de 'jogo', mas seu movimento suave como manteiga e as lutas contra chefes intensamente desafiadoras criam uma experiência viciante. O autor relata suas próprias lutas e triunfos, destacando a sensação palpável de progresso e a satisfação incomparável de superar probabilidades aparentemente impossíveis. Embora sua dificuldade possa deter muitos, é precisamente isso que define seu apelo: Silksong é uma carta de amor aos perfeccionistas que prosperam no desafio e abraçam a dor.

Leia mais

Ordenha Robótica: Automatizando a Fazenda Leiteira

2025-04-15
Ordenha Robótica: Automatizando a Fazenda Leiteira

Robôs autônomos da Lely estão revolucionando a pecuária leiteira. Esses robôs cuidam da ordenha, alimentação e limpeza, reduzindo significativamente o trabalho dos fazendeiros e aumentando a produção de leite. A ordenha mais frequente por robôs reduz o estresse das vacas, levando a maiores rendimentos. Embora o custo inicial seja alto, os robôs se pagam ao longo do tempo por meio de maior eficiência e menores custos com mão de obra. Essa tecnologia não apenas aumenta a produtividade, mas também melhora o bem-estar das vacas, levando a animais mais felizes e saudáveis. A integração futura de IA promete otimização adicional e insights baseados em dados para um gerenciamento de fazenda mais preciso.

Leia mais
Tecnologia Agrotech

Kimi k1.5 da MoonshotAI: Avanço em RL e LLMs

2025-01-21
Kimi k1.5 da MoonshotAI: Avanço em RL e LLMs

A MoonshotAI revelou o Kimi k1.5, um novo modelo de linguagem grande multimodal treinado com aprendizado por reforço, alcançando resultados de última geração em vários benchmarks. A chave para o sucesso do Kimi k1.5 é sua janela de contexto de 128k e métodos aprimorados de otimização de políticas, permitindo capacidades de raciocínio robustas sem técnicas complexas como a pesquisa de árvore Monte Carlo. Ele supera o GPT-4o e o Claude Sonnet 3.5 em testes como AIME, MATH-500 e Codeforces, mostrando também melhorias significativas no raciocínio de contexto curto. O Kimi k1.5 estará disponível em breve em https://kimi.ai.

Leia mais
IA

arXivLabs: Construindo novos recursos do arXiv com colaboração da comunidade

2025-09-01
arXivLabs: Construindo novos recursos do arXiv com colaboração da comunidade

arXivLabs é uma nova estrutura que permite que desenvolvedores e colaboradores da comunidade criem e compartilhem novos recursos diretamente no site do arXiv. Indivíduos e organizações envolvidos compartilham os valores do arXiv de abertura, comunidade, excelência e privacidade dos dados do usuário. O arXiv está comprometido com esses valores e trabalha apenas com parceiros que os respeitam. Se você tiver uma ideia para um projeto que agregará valor à comunidade arXiv, saiba mais sobre o arXivLabs.

Leia mais
Desenvolvimento

go-msquic: Wrapper Go para a biblioteca QUIC da Microsoft

2025-02-19
go-msquic: Wrapper Go para a biblioteca QUIC da Microsoft

go-msquic é um wrapper Go para a biblioteca QUIC da Microsoft, fornecendo aos desenvolvedores Go uma interface fácil para trabalhar com protocolos baseados em QUIC, como HTTP/3. Sua API é inspirada em quic-go e pode ser usada como uma substituição direta. A menos que você esteja pronto para lidar com bibliotecas C, na verdade, recomendamos quic-go em vez de go-msquic. A instalação requer a construção da biblioteca C MsQuic local primeiro, depois instale com `go get github.com/noboruma/go-msquic`. O código de exemplo está no diretório sample/.

Leia mais
Desenvolvimento

Conjectura matemática de 50 anos finalmente provada: A Conjectura de McKay

2025-02-20
Conjectura matemática de 50 anos finalmente provada: A Conjectura de McKay

A Conjectura de McKay, um problema matemático proposto na década de 1970 sobre grupos finitos e seus normalizadores de Sylow, foi finalmente provada por Britta Späth e Michel Cabanes. A conjectura afirma que uma quantidade crucial para um grupo finito é igual à mesma quantidade para seu normalizador de Sylow (um subgrupo muito menor). Esta prova, décadas em desenvolvimento, se baseia em mais de um século de trabalho classificando grupos finitos e envolve insights profundos na teoria da representação de grupos do tipo Lie. É uma conquista monumental na matemática, simplificando a pesquisa em teoria de grupos e potencialmente levando a aplicações práticas.

Leia mais

O Palácio de Cristal: Um Século de Fotografia, da Glória às Cinzas

2025-08-19
O Palácio de Cristal: Um Século de Fotografia, da Glória às Cinzas

Este artigo reconta a história épica do Palácio de Cristal, desde sua estreia na Grande Exposição de 1851 até sua dramática destruição por incêndio em 1936. Por meio de uma rica coleção de fotografias históricas, ele narra a construção do edifício, a mudança de local, os incêndios e a demolição final. As imagens capturam a grandiosidade e a magnificência do Palácio, bem como seu declínio e o legado duradouro que deixou para trás.

Leia mais

Controle seu telefone Android com IA: codifique seus comandos

2025-04-01
Controle seu telefone Android com IA: codifique seus comandos

O projeto de código aberto `mobile-use` permite que você controle seu telefone Android usando IA. Basta escrever comandos como "Abra o Instagram e envie uma mensagem", e o projeto os executa usando suas ferramentas SDK do Android instaladas localmente (adb). Ele suporta modelos LLM personalizados e oferece métodos de entrada de linha de comando e arquivo, permitindo que você envie instruções facilmente a partir do terminal ou de um arquivo. O projeto é licenciado sob a Licença MIT.

Leia mais
Desenvolvimento
1 2 183 184 185 187 189 190 191 595 596