s1: Escalonamento Simples em Tempo de Teste para Raciocínio Robusto

2025-02-03
s1: Escalonamento Simples em Tempo de Teste para Raciocínio Robusto

Este artigo apresenta s1, um método simples de escalonamento em tempo de teste que alcança um desempenho de raciocínio robusto, igualando o o1-preview usando apenas 1.000 exemplos e restrição de orçamento. O método melhora significativamente o desempenho em modelos de linguagem grandes por meio de estratégias inteligentes em tempo de teste. O código e os dados são de código aberto para reprodutibilidade e exploração adicional.

Leia mais

Alfabeto mais antigo descoberto: Cilindros de argila de 4.400 anos reescrevem a história

2025-01-17
Alfabeto mais antigo descoberto: Cilindros de argila de 4.400 anos reescrevem a história

A professora de história da UC Santa Cruz, Elaine Sullivan, descobriu quatro pequenos cilindros de argila inscritos com símbolos misteriosos em um sítio funerário do início da Idade do Bronze em Umm el-Marra, na Síria. Inicialmente ignorados, esses artefatos foram posteriormente identificados como um alfabeto semítico antigo que precede os exemplos conhecidos anteriormente em pelo menos 500 anos. Essa descoberta desafia nossa compreensão das origens do alfabeto, deslocando sua localização do Egito e do Levante Sul para o Norte da Síria. A pesquisa destaca a importância do trabalho meticuloso de campo e da colaboração interdisciplinar em arqueologia, enfatizando que os artefatos geralmente contêm segredos que apenas as gerações posteriores podem desvendar.

Leia mais

A Europa pode escapar do controle das Big Techs? O debate sobre mídias sociais públicas

2025-05-25
A Europa pode escapar do controle das Big Techs? O debate sobre mídias sociais públicas

Em meio a preocupações sobre os monopólios das Big Techs e violações de privacidade nas mídias sociais, propostas para redes sociais públicas estão ganhando força na Europa. Os proponentes imaginam plataformas neutras para o discurso público, livres de algoritmos manipulativos e coleta de dados. No entanto, especialistas alertam para potenciais riscos, incluindo censura governamental e abuso de poder. O artigo sugere fomentar alternativas descentralizadas e de código aberto em vez de criar grandes plataformas controladas pelo Estado, enfatizando a liberdade do usuário e a segurança de dados como primordiais para escapar do paradigma atual.

Leia mais

tldx: Geração de nomes de domínio ultrarrápida

2025-06-01
tldx: Geração de nomes de domínio ultrarrápida

tldx é uma ferramenta de linha de comando que gera e verifica rapidamente a disponibilidade de nomes de domínio. Permite a personalização de prefixos, sufixos e domínios de nível superior (TLDs), realizando verificações simultâneas para maior eficiência. Basta inserir palavras-chave, e o tldx retorna rapidamente as combinações de domínio disponíveis, uma ótima ferramenta para fundadores e desenvolvedores que buscam o nome perfeito. Com suporte para macOS, Linux e Windows, o tldx oferece instalação fácil por meio do brew ou download manual.

Leia mais

Figma Slides: Um Desastre de Apresentação

2025-06-01
Figma Slides: Um Desastre de Apresentação

O autor tentou usar o Figma Slides para uma apresentação, inicialmente impressionado com sua poderosa visualização de grade, layout automático e componentes. No entanto, a apresentação real foi um desastre: o modo offline falhou, as animações apresentaram falhas e foram necessários cliques repetidos para avançar os slides. Em contraste, o uso de longa data do Keynote pelo autor, embora mais simples, mostrou-se consistentemente confiável. A experiência, finalmente, destacou o valor de uma tecnologia confiável, embora menos chamativa.

Leia mais
Desenvolvimento Software de Apresentação

arXivLabs: Projetos experimentais com colaboradores da comunidade

2025-05-29
arXivLabs: Projetos experimentais com colaboradores da comunidade

arXivLabs é uma estrutura que permite que colaboradores desenvolvam e compartilhem novos recursos do arXiv diretamente em nosso site. Indivíduos e organizações que trabalham com o arXivLabs abraçaram e aceitaram nossos valores de abertura, comunidade, excelência e privacidade dos dados do usuário. O arXiv está comprometido com esses valores e trabalha apenas com parceiros que os respeitam. Tem uma ideia para um projeto que agregará valor à comunidade do arXiv? Saiba mais sobre o arXivLabs.

Leia mais
Desenvolvimento

Corpos e seus Ideais Triviais: Uma Demonstração Elegante

2025-05-31

Este artigo explora o conceito algébrico de ideais em corpos. Um corpo possui apenas dois ideais: o ideal zero e o próprio corpo, ambos chamados de ideais triviais. O artigo demonstra elegantemente dois fatos-chave: primeiro, qualquer corpo possui apenas ideais triviais; segundo, qualquer anel comutativo com identidades aditivas e multiplicativas distintas, possuindo apenas ideais triviais, deve ser um corpo. A demonstração prossegue através de definições, exemplos e uma derivação clara passo a passo, mostrando a beleza e simplicidade do resultado matemático.

Leia mais
Desenvolvimento ideais

arXivLabs: Experimentos com Colaboração da Comunidade

2025-07-02
arXivLabs: Experimentos com Colaboração da Comunidade

arXivLabs é uma estrutura que permite a colaboração no desenvolvimento e compartilhamento de novos recursos do arXiv diretamente no site. Indivíduos e organizações envolvidos compartilham os valores do arXiv de abertura, comunidade, excelência e privacidade de dados do usuário. O arXiv apenas se associa a aqueles que defendem esses valores. Tem alguma ideia para melhorar a comunidade arXiv? Saiba mais sobre o arXivLabs.

Leia mais
Desenvolvimento

Novo Benchmark Expõe o Gargalo de Automação em OCR: Alcançando 98% de Precisão

2025-03-14

O influxo de novos players de OCR, como Mistral e as ofertas de Andrew Ng, dificulta para as empresas distinguirem avanços genuínos de exageros. Benchmarks existentes focam na precisão de OCR e na extração de informações, negligenciando os níveis de automação. A Nanonets introduz um novo benchmark enfatizando a automação com 98% de precisão. Usando um conjunto de dados de 1000 imagens e 16.639 pontos de dados anotados, eles medem o desempenho do modelo com base em pontuações de confiança – a proporção de dados processados com precisão sem intervenção humana. Embora os LLMs se destaquem na precisão geral, pontuações de confiança confiáveis ​​permanecem evasivas. O Gemini 2.0 Flash atingiu 98% de precisão, mas automatizou apenas 8% dos dados. Este benchmark visa ajudar as empresas a encontrar soluções que realmente reduzam o esforço manual no processamento de documentos.

Leia mais
Desenvolvimento

A Crise de Despersonalização: Não é Solidão, é Invisibilidade

2025-06-20
A Crise de Despersonalização: Não é Solidão, é Invisibilidade

Este artigo argumenta que a sociedade contemporânea enfrenta uma crescente crise de "despersonalização", distinta da solidão. É a sensação de ser invisível e não ouvido, decorrente de interações padronizadas, uso excessivo de tecnologia e exclusão social. Através de entrevistas com trabalhadores autônomos, terapeutas e médicos, o autor revela como esses fatores corroem a sensação de ser reconhecido em relacionamentos humanos. A solução, sugere o autor, reside em abordar as causas raízes — interações padronizadas, marginalização e tempo excessivo de tela — e priorizar a conexão humana nos avanços tecnológicos, evitando a simples mecanização da interação humana.

Leia mais

Programa Fulbright: Uma colaboração que superou as expectativas

2025-08-03

O autor relata sua experiência colaborando com Emily Simons por meio do Programa Fulbright. Um projeto inicial foi interrompido devido a preocupações com privacidade, levando a uma mudança para o aprendizado de grafos, culminando em um artigo conjunto do ICML 2025. As contribuições de Emily se estenderam além da pesquisa, abrangendo estratégias de disseminação, melhorias no repositório e aprimoramentos no site. O autor defende o reconhecimento do valor de longo prazo da pesquisa fundamental, argumentando que o Programa Fulbright promove conexões inestimáveis e impactos positivos que são difíceis de quantificar imediatamente.

Leia mais

Análise de PDF: Uma Batalha Contra a Especificação

2025-08-04

Analisar um PDF parece simples: encontre o cabeçalho da versão, a tabela de referência cruzada, os deslocamentos de objeto e, finalmente, construa o dicionário do catálogo. No entanto, a realidade é brutal. A especificação PDF não é uma regra rígida; arquivos do mundo real estão cheios de situações não conformes, como locais de ponteiros `startxref` incorretos, dados lixo no início do arquivo e tabelas de referência cruzada malformadas. O autor, analisando um grande número de arquivos PDF reais, revela esses problemas e aponta que os visualizadores de PDF existentes funcionam porque lidam com situações não conformes. Este artigo explica os desafios da análise de PDF de uma forma fácil de entender e fornece experiência valiosa para desenvolvedores.

Leia mais

Resolvendo o Wordle com uv e pacotes Python

2025-07-07

O autor anteriormente escreveu um solucionador de Sudoku usando o resolvedor de dependências do Poetry e agora tenta resolver o Wordle usando o uv mais avançado. O artigo detalha como traduzir o problema do Wordle para um problema de dependência de pacote Python, usando inteligentemente o resolvedor de dependências do uv para encontrar a solução. Ao criar uma série de pacotes representando posições de letras e feedback, e definindo dependências entre eles, o autor resolve com sucesso o Wordle usando uv.

Leia mais
Desenvolvimento

Blog de Álgebra Linear Gráfica: Uma Abordagem Diagramática para Álgebra Linear

2025-07-11
Blog de Álgebra Linear Gráfica: Uma Abordagem Diagramática para Álgebra Linear

Este blog explora a álgebra linear por meio de uma abordagem visual e diagramática. Ele explica conceitos matemáticos complexos de forma acessível, usando ilustrações para esclarecer tópicos desafiadores. O conteúdo abrange desde operações básicas até conceitos avançados, como matrizes, homomorfismos e relações, tudo explicado passo a passo com diagramas. O blog também anuncia uma escola de pesquisa em Teoria de Categorias Aplicada e oportunidades de pesquisa relacionadas, tornando-o valioso para estudantes e pesquisadores interessados em álgebra linear.

Leia mais
Desenvolvimento matemática visual

A América está em declínio? Ou é uma guerra de informações?

2025-01-07
A América está em declínio? Ou é uma guerra de informações?

Este artigo examina o paradoxo da economia aparentemente próspera da América em comparação com a ansiedade generalizada do público, a desconfiança no governo e o pessimismo em relação ao futuro. O autor argumenta que isso não é um declínio genuíno, mas sim o resultado de uma guerra de informações travada por forças externas, ligadas à Rússia. Essas forças utilizam campanhas de desinformação, manipulação de mídia social e outras táticas para semear discórdia e instabilidade. O artigo destaca o papel de organizações 'anti-seita' que empregam terrorismo de informação, demonizando grupos por meio da mídia, fomentando a divisão e até contribuindo para eventos extremos como tiroteios em escolas. O objetivo final, afirma o autor, é incitar uma guerra civil. O artigo apela para a vigilância contra a desinformação, a exposição de organizações anti-seita e medidas para proteger a estabilidade americana.

Leia mais

Incentivos, não educação: a chave para resolver problemas de qualidade de código

2025-02-15
Incentivos, não educação: a chave para resolver problemas de qualidade de código

O Google tentou usar um programa de código de cores de alimentos para incentivar hábitos alimentares saudáveis entre seus funcionários, ignorando o impacto das restrições de tempo e estresse. Da mesma forma, abordar problemas de qualidade de código não deve se concentrar apenas em educar os engenheiros sobre padrões de codificação. Em vez disso, é crucial considerar os mecanismos de incentivo. Engenheiros que escrevem código ruim não estão necessariamente faltando conhecimento; eles podem estar sob pressão para atender prazos ou sobrecarregados com tarefas exigentes. Portanto, a chave para melhorar a qualidade do código está em melhorar o ambiente de trabalho, fornecer tempo adequado e estabelecer sistemas de incentivo razoáveis, em vez de simplesmente enfatizar a educação.

Leia mais

Altair 8800: O Computador Pessoal que Mudou Tudo

2025-05-02
Altair 8800: O Computador Pessoal que Mudou Tudo

Antes da Apple e da Commodore, existia o MITS Altair 8800. Lançado em 1975 e destaque na capa da revista Popular Electronics, este computador em kit é considerado o primeiro computador pessoal comercialmente bem-sucedido. Com preço de US$ 397, ele não possuía teclado nem monitor, utilizando chaves e luzes. Sua popularidade, com mais de 25.000 unidades vendidas, impulsionou a criação da Microsoft (Bill Gates e Paul Allen desenvolveram o BASIC para ele) e inspirou o Apple I de Steve Wozniak. O legado do Altair se estende ao padrão de barramento S-100, consolidando seu lugar como um momento crucial na história da computação.

Leia mais
Tecnologia computador pessoal

LVGL: Biblioteca de gráficos embarcados leve e versátil

2025-03-29
LVGL: Biblioteca de gráficos embarcados leve e versátil

LVGL é uma biblioteca gráfica embarcada de código aberto popular para criar interfaces de usuário bonitas para qualquer MCU, MPU e tipo de display. Possui mais de 30 widgets integrados, um sistema de estilo poderoso, gerenciadores de layout inspirados na web e suporta vários idiomas. Requerendo recursos mínimos (32kB de RAM e 128kB de Flash), o LVGL simplifica o desenvolvimento da IU. A equipe LVGL também oferece serviços de design, implementação e consultoria para ajudar os desenvolvedores a criar interfaces gráficas de usuário de alta qualidade.

Leia mais

ESET Recomenda Linux com o Fim do Suporte ao Windows 10

2025-01-05
ESET Recomenda Linux com o Fim do Suporte ao Windows 10

Com o fim do suporte ao Windows 10 se aproximando, a ESET alerta para riscos significativos de segurança para milhões que ainda usam o sistema operacional. A empresa recomenda a atualização para o Windows 11, mas sugere uma distribuição Linux como alternativa para hardware mais antigo que não pode ser atualizado. O artigo também discute o alto custo das Atualizações de Segurança Estendidas (ESU) da Microsoft para o Windows 10 e o potencial para cibercriminosos explorarem essa situação.

Leia mais

Goldfish Swim School: Construindo um Império de Escolas de Natação em Shoppings

2025-08-03
Goldfish Swim School: Construindo um Império de Escolas de Natação em Shoppings

A Goldfish Swim School, uma franquia de escolas de natação para crianças, cresceu de uma única localização em Michigan em 2006 para quase 200 locais atualmente, tornando-se um grande ator em um setor multibilionário. Seu sucesso reside em um modelo de negócios único: localizar escolas em shoppings, criar piscinas com tema tropical e quentes, e manter uma operação familiar que prioriza flexibilidade e foco no cliente. Apesar da concorrência de rivais apoiados por private equity e da queda nas taxas de vacância de shoppings, a Goldfish planeja continuar sua expansão, visando 400 locais até 2033, tornando-se um elemento básico dos shoppings.

Leia mais

JSAR: Um poderoso motor para construir o futuro da Web espacial

2025-08-03
JSAR: Um poderoso motor para construir o futuro da Web espacial

A estrutura JSAR oferece suporte abrangente para os padrões modernos da Web, incluindo JavaScript ES2023 completo, compilação nativa do TypeScript, módulos ECMAScript, WebAssembly e Web Workers. Em gráficos 3D, ele suporta totalmente WebGL 1.0 e 2.0, com suporte WebGPU em desenvolvimento. O JSAR também oferece suporte completo à API de dispositivos WebXR, incluindo espaços, renderização estéreo, fontes de entrada e rastreamento de mão. Embora o suporte a DOM API, HTML5 e CSS3 esteja em andamento, sua renderização Canvas 2D está totalmente implementada. O JSAR fornece guias de início rápido e tutoriais de exemplo e possui uma comunidade crescente de desenvolvedores.

Leia mais
Desenvolvimento

A Fragilidade do Mercado Imobiliário: Construir Mais é a Solução?

2025-07-21
A Fragilidade do Mercado Imobiliário: Construir Mais é a Solução?

A crença predominante é que aumentar a oferta de moradias reduzirá os preços e resolverá a crise de acessibilidade. No entanto, quedas recentes de preços em várias cidades dos EUA desencadearam pânico, não comemorações. Empreendedores estão desistindo, os credores estão apertando o cinto e os formuladores de políticas estão correndo para salvar o sistema. O artigo argumenta que o problema não é a falta de oferta, mas a fragilidade do sistema financeiro. O mercado imobiliário atual trata as casas como produtos financeiros, não abrigos; quedas de preços são vistas como sinais de risco, levando a uma diminuição, e não a um aumento, da oferta. O artigo apela para uma abordagem de baixo para cima, focando em moradias acessíveis em pequena escala e locais para construir um ecossistema de moradias mais saudável e resiliente, em vez de depender de engenharia financeira e subsídios em nível nacional.

Leia mais

Não deixe LLMs tomarem decisões: elas são péssimas nisso

2025-04-01
Não deixe LLMs tomarem decisões: elas são péssimas nisso

O autor, desenvolvedor de NPCs para um jogo online, argumenta contra o uso de Modelos de Linguagem Grandes (LLMs) para lógica de negócios e tomada de decisões. Em vez disso, LLMs devem servir como uma interface de usuário, traduzindo solicitações do usuário em chamadas de API e resultados de volta para linguagem natural. LLMs são demonstrados como inferiores em desempenho, depuração e ajuste em comparação com sistemas especializados, usando um exemplo de bot de xadrez. O autor defende o uso de LLMs para tarefas como transformação de texto, categorização e compreensão da intenção do usuário, enquanto se baseia em sistemas especializados para a lógica central. Embora os LLMs continuem a melhorar, este princípio arquitetônico permanece crucial.

Leia mais
Desenvolvimento

YouTube: TV ultrapassa dispositivos móveis como principal meio de visualização nos EUA

2025-02-11
YouTube: TV ultrapassa dispositivos móveis como principal meio de visualização nos EUA

O YouTube divulgou um relatório indicando que, nos EUA, a TV superou os dispositivos móveis como o principal meio pelo qual as pessoas assistem ao seu conteúdo. Apesar do aumento do uso de smartphones, as TVs de tela grande e seus controles remotos permanecem dominantes, com base nos dados de tempo de visualização do YouTube. A Nielsen confirma a posição de liderança do YouTube em tempo de visualização de streaming por dois anos consecutivos. Além disso, o YouTube anunciou um novo recurso, "Watch With", permitindo que os criadores forneçam comentários e reações ao vivo a jogos e eventos, atualmente em fase de teste.

Leia mais

Tribunal ordena que Cloudflare bloqueie serviços de streaming pirata

2024-12-24

Um tribunal de Milão ordenou que a Cloudflare bloqueie serviços de streaming pirata que oferecem partidas de futebol da Serie A em todos os seus serviços, incluindo CDN, DNS, WARP e proxy. O tribunal decidiu que os serviços da Cloudflare facilitam o acesso a transmissões ilegais, prejudicando a legislação italiana do 'Escudo contra a Pirataria'. A ordem também exige ampla divulgação de dados, exigindo que a Cloudflare identifique os clientes que usam seus serviços para pirataria. Essa decisão histórica destaca a responsabilidade dos intermediários de terceiros no combate à pirataria digital e representa um passo significativo para frente nos esforços antipirataria.

Leia mais
Tecnologia

Google Gemma 3: Uma grande atualização para seu modelo de IA de único acelerador

2025-03-20
Google Gemma 3: Uma grande atualização para seu modelo de IA de único acelerador

Mais de um ano após o lançamento dos modelos de IA Gemma iniciais, o Google apresenta o Gemma 3, com desempenho superior em comparação com concorrentes como Llama e OpenAI, especialmente em sistemas com uma única GPU. Este modelo aprimorado suporta mais de 35 idiomas e processa texto, imagens e vídeos curtos. O Gemma 3 possui um codificador de visão atualizado para imagens de alta resolução e não quadradas e inclui o novo classificador de segurança de imagem ShieldGemma 2 para filtrar conteúdo inadequado. Embora a definição de 'aberto' ainda seja debatida em relação à sua licença, o Google continua a promover o Gemma 3 por meio de créditos do Google Cloud e um programa acadêmico que oferece US$ 10.000 em créditos para pesquisa.

Leia mais
IA

Walmart testa câmeras corporais para segurança dos funcionários

2024-12-20
Walmart testa câmeras corporais para segurança dos funcionários

A Walmart está testando o uso de câmeras corporais por seus funcionários em algumas lojas, como forma de dissuadir conflitos e roubos. Embora a empresa não revele detalhes específicos, fotos surgiram mostrando funcionários usando as câmeras e estações de carregamento nas lojas. A iniciativa, atualmente um programa piloto em um mercado, prioriza a segurança dos funcionários em vez da prevenção de perdas. Isso segue uma tendência entre os varejistas de melhorar a segurança, com empresas como TJX e Greggs também adotando medidas semelhantes. A medida surge após mais de 200 incidentes violentos em lojas da Walmart em 2023, segundo um grupo de direitos trabalhistas.

Leia mais

Gerando gráficos de funções como árvores binárias

2025-02-01

Esta postagem descreve um algoritmo que usa Python e a biblioteca NetworkX para gerar uma árvore binária. O algoritmo é baseado em uma função f(x) = [(x << 1) + 2, (x << 1) + 3], construindo um gráfico iterando sobre um domínio numérico e usando a saída da função para definir conexões entre nós. A postagem inclui implementação de código detalhada e explicações matemáticas, demonstrando como uma função matemática pode ser transformada em uma representação gráfica.

Leia mais
Desenvolvimento

Codec PNG de Alto Desempenho do Blend2D: Mais Rápido que C/C++

2025-03-26
Codec PNG de Alto Desempenho do Blend2D: Mais Rápido que C/C++

A biblioteca Blend2D apresenta um novo codec PNG de alto desempenho que supera significativamente outras implementações em C/C++. Otimizado para as limitações inerentes do algoritmo DEFLATE, este decodificador consegue melhorias de velocidade através da construção de tabelas de decodificação rápidas, loops de decodificação otimizados e uso inteligente de técnicas de pares literais. Os benchmarks demonstram desempenho superior na decodificação de imagens PNG, superando até mesmo a velocidade de alguns decodificadores QOI em certos casos. O projeto é totalmente de código aberto e aceita contribuições.

Leia mais
Desenvolvimento

Os Custos Ocultos do SaaS: Mais do que Você Imagina

2025-06-06
Os Custos Ocultos do SaaS: Mais do que Você Imagina

Desenvolvedores costumam ser orientados a se concentrar em seus produtos e deixar o resto para os fornecedores de SaaS. Mas a integração de serviços de terceiros (autenticação, filas, armazenamento de arquivos, otimização de imagens etc.) tem um custo, não apenas em dólares, mas também em tempo, atrito e sobrecarga mental. Este artigo descreve cinco impostos ocultos: imposto de descoberta (avaliação de serviços), imposto de inscrição (registro e pagamento), imposto de integração (integração de código e depuração), imposto de desenvolvimento local (configuração do ambiente local) e imposto de produção (implementação e manutenção de produção). O autor argumenta que, em vez de integrar constantemente vários serviços SaaS, é melhor escolher uma plataforma integrada (como Cloudflare ou Supabase) para evitar custos e problemas repetitivos, melhorando assim a eficiência do desenvolvimento.

Leia mais
Desenvolvimento
1 2 363 364 365 367 369 370 371 595 596