Por que o HNSW não é a resposta para bancos de dados vetoriais: A ascensão do IVF

2024-12-23

O algoritmo HNSW é popular em bancos de dados vetoriais por sua velocidade e precisão na busca de similaridade vetorial, mas suas limitações em aplicações de grande escala devido à sua natureza intensiva em memória são evidentes. Este artigo argumenta que alternativas baseadas em disco, como o IVF (índice de arquivo invertido), especialmente quando combinadas com técnicas de quantização (RaBitQ, PQ, SQ, ScaNN), oferecem velocidade e escalabilidade superiores para conjuntos de dados massivos. O IVF, quantizando e comprimindo vetores, reduz a pegada de memória e utiliza pré-busca e varreduras sequenciais eficientes para uma busca significativamente mais rápida. Os custos de inserção e exclusão também são menores. Embora o HNSW se destaque em aplicações de menor escala, o IVF com quantização surge como a escolha mais vantajosa para conjuntos de dados massivos.

Leia mais
Desenvolvimento banco de dados vetorial

Retrocomputação: Substituindo a bateria CMOS de um 386/486

2024-12-23

Placas-mãe antigas de 386/486 costumam ter baterias de NiCd ou NiMH que vazam e danificam a placa. Este guia detalha uma alternativa simples: usar três pilhas AA e um suporte para pilhas. O autor compara o uso de uma célula CR2032 e uma célula de lítio Tadrian 3.6V, optando finalmente por três pilhas AA devido à facilidade de uso, à ausência de modificação na placa-mãe e à possibilidade de usar pilhas recarregáveis. Outros métodos de substituição são mencionados, incluindo o uso de um suporte para CR2032 e um diodo Schottky, e a utilização de um conector de bateria externo na placa-mãe, se presente.

Leia mais

Apple Direciona Vítimas de Spyware para Laboratório de Segurança Sem Fins Lucrativos

2024-12-23

Em vez de conduzir suas próprias investigações, a Apple direciona as vítimas de ataques suspeitos de spyware governamental em iPhones para a organização sem fins lucrativos Access Now para obter assistência. Essa abordagem é apoiada por especialistas em segurança cibernética que acreditam que a Access Now está melhor equipada para investigação e suporte sistemáticos. O serviço de ajuda digital da Access Now recebeu 4.337 solicitações em 2024, tornando-se uma ferramenta crucial no combate ao spyware. Embora a Apple também empregue outras medidas de segurança, como o Modo de Bloqueio, essa parceria oferece suporte inestimável para aqueles afetados por spyware governamental.

Leia mais

Nix Home Manager: Um guia para gerenciamento de dotfiles

2024-12-22

Este artigo mergulha nas vantagens e técnicas de usar o Nix Home Manager para gerenciamento de dotfiles. O autor começa reconhecendo a curva de aprendizado íngreme do Nix e do Home Manager, recomendando uma abordagem gradual para dominar seus recursos. O artigo explica vários casos de uso do Home Manager, incluindo instalação de software, configuração de programas e serviços declarativos e gerenciamento de dotfiles. O foco principal é na função `mkOutOfStoreSymlink`, que cria links simbólicos para dotfiles, permitindo modificações sem reconstruir todo o sistema. Um exemplo de módulo personalizado é fornecido para facilitar a alternância entre configurações mutáveis e imutáveis. Por fim, o autor compara o Home Manager com outras ferramentas de gerenciamento de dotfiles, destacando seus benefícios de reprodutibilidade.

Leia mais
Desenvolvimento

Carga Cognitiva: O Assassino Silencioso no Desenvolvimento de Software

2024-12-25

Este artigo explora a importância da carga cognitiva no desenvolvimento de software. Carga cognitiva refere-se à quantidade de esforço mental que um desenvolvedor precisa para concluir uma tarefa; alta carga cognitiva leva à confusão, perda de tempo e dinheiro. O artigo analisa a carga cognitiva intrínseca e extrínseca, ilustrando como reduzir a carga extrínseca por meio de exemplos de código, como usar variáveis intermediárias significativas, evitar instruções if aninhadas e priorizar a composição em vez de herança. Também enfatiza evitar microserviços excessivos, escolher recursos de linguagem apropriados e aderir ao Princípio da Responsabilidade Única, observando que a abstração excessiva e arquiteturas em camadas podem aumentar a carga cognitiva. Finalmente, o artigo aconselha os desenvolvedores a se concentrarem na legibilidade do código e a colaborarem com desenvolvedores juniores para identificar e melhorar problemas de carga cognitiva.

Leia mais

Ciclovía de Bogotá: 50 anos de ruas abertas

2024-12-22

A Ciclovía de Bogotá, um programa semanal que fecha 75 milhas de ruas para carros por sete horas, comemorou seu 50º aniversário. Nascida de um protesto de 1974 contra o trânsito e a poluição, a Ciclovía se tornou uma tradição querida, atraindo mais de 1,5 milhão de pessoas todos os domingos. Seu sucesso inspirou mais de 400 cidades em todo o mundo a adotar programas semelhantes. A Ciclovía é mais do que um evento recreativo; é um testemunho da construção da comunidade, da melhoria da saúde pública e de uma solução única para os desafios urbanos. A longevidade e o impacto do programa destacam seu poder surpreendente para promover a coesão social, promover a igualdade e até mesmo resolver conflitos políticos, demonstrando o potencial de intervenções urbanas transformadoras.

Leia mais

arXiv: Como as pré-impressões revolucionaram o compartilhamento de pesquisas

2024-12-26

Do papiro às pré-impressões, a disseminação de pesquisas científicas passou por uma transformação dramática. Este artigo traça a história da revisão por pares e destaca o surgimento do arXiv e seu impacto na comunidade científica. O arXiv, como um servidor de pré-impressões, quebrou as barreiras das revistas tradicionais, permitindo o compartilhamento rápido e aberto de descobertas de pesquisas. No entanto, também enfrenta desafios relacionados ao controle de qualidade e à sobrecarga de informações. O autor explora o conflito e a convergência entre a cultura de pré-impressões e os modelos tradicionais de publicação acadêmica, e o profundo impacto que isso tem no futuro da pesquisa científica.

Leia mais

PGP Operacional: Um Guia para Comunicação Segura por E-mail

2024-12-24

Este guia não é sobre instalar ou usar PGP; é sobre usá-lo com segurança. Ele enfatiza a segurança operacional além de apenas criptografar o conteúdo do e-mail, cobrindo a composição do e-mail, armazenamento, gerenciamento de chaves e muito mais. Recomenda-se compor e-mails em um editor de texto, evitando salvar rascunhos em clientes de e-mail; gerar e destruir chaves com frequência; evitar publicar chaves em servidores de chaves; manter os assuntos de e-mail em branco para minimizar o vazamento de metadados; usar a opção `gpg --throw-keys` durante a criptografia; habilitar a criptografia por padrão e escolher explicitamente se deseja assinar e-mails. O objetivo é maximizar o potencial de segurança do PGP.

Leia mais

Aplicativo de monitoramento em tempo real do tanque de urina da ISS lançado

2024-12-24

Um desenvolvedor criou o pISSStream, um aplicativo para a barra de menu do macOS que mostra o nível de enchimento do tanque de urina da Estação Espacial Internacional em tempo real. Embora o estilo de codificação não seja perfeito, o conceito único do aplicativo oferece um olhar divertido sobre um detalhe da vida no espaço. O desenvolvedor afirmou que não adicionará outros dados, focando apenas no nível de enchimento do tanque de urina.

Leia mais

Leituras no Postgres que causam escritas: MVCC, Limpeza de páginas e bits de dica

2024-12-25

Este artigo investiga o comportamento aparentemente paradoxal no PostgreSQL, onde consultas SELECT simples podem disparar gravações de dados. Começando com o mecanismo de Controle de Concorrência de Versões Múltiplas (MVCC), ele explica conceitos como versões de linhas, páginas e tuplas. Através de exemplos de código, ele analisa como as atualizações de bits de dica e a limpeza de páginas fazem com que operações de leitura modifiquem páginas, levando em última análise a gravações em disco. O artigo também discute a estratégia de otimização de atualização HOT e usa ferramentas de inspeção de páginas para ilustrar como os dados são armazenados e atualizados dentro das páginas.

Leia mais

Mini-buracos negros podem ter deixado túneis nas rochas da Terra

2024-12-19

Cientistas propõem uma hipótese ousada: mini-buracos negros primordiais, formados no início do universo, podem ter atravessado rochas terrestres, deixando para trás túneis microscópicos invisíveis a olho nu. Embora esses túneis sejam minúsculos, microscópios poderosos podem detectá-los, oferecendo um caminho potencial para a descoberta desses objetos evasivos. Os pesquisadores sugerem que a busca por esses túneis, apesar da baixa probabilidade de sucesso, pode trazer recompensas imensas. Além disso, eles hipotetizam que mini-buracos negros primordiais podem estar escondidos dentro de certos planetas, esvaziando-os ao consumir seus núcleos líquidos. Essa pesquisa oferece uma abordagem nova para encontrar mini-buracos negros primordiais, representando um passo significativo na exploração das origens do universo.

Leia mais

Go: Quando dizer não

2024-12-14

Um desenvolvedor, após anos usando Go, está voltando para Java. Ele considera o Go deficiente em várias áreas: opções de loop limitadas, ausência de funções de ordem superior, tratamento de erros complicado, estilo de codificação excessivamente restritivo levando a código verboso e difícil de manter, e um ecossistema de pacotes imaturo. Embora reconheça a adequação do Go para projetos de infraestrutura, ele desaconselha seu uso em aplicativos empresariais complexos.

Leia mais
Desenvolvimento desenvolvimento

A Era de Ouro dos Antibióticos e Como Reacendê-la

2024-12-25

Este artigo explora a "Era de Ouro dos Antibióticos" (início da década de 1940 até meados da década de 1960), um período de rápida descoberta de antibióticos. Ele explica o declínio no desenvolvimento de antibióticos desde a década de 1970 devido às empresas farmacêuticas mudarem o foco para áreas mais lucrativas e ao aumento da resistência aos antibióticos. O artigo propõe estratégias para reviver a descoberta de antibióticos, como mineração de genomas, exploração de novas bactérias e terapias combinadas. Ele destaca o papel crucial do financiamento governamental e organizacional e modelos colaborativos inovadores para incentivar o desenvolvimento de novos antibióticos, essenciais no combate às infecções resistentes a medicamentos.

Leia mais

Mergulho profundo em golpes de criptomoedas na BSC

2024-12-24

Durante o mercado de alta de criptomoedas de 2021, a Binance Smart Chain (BSC) foi inundada com vários golpes. O autor analisa vários casos, expondo táticas comuns empregadas por golpistas, incluindo: criação de contratos inteligentes que tornam os tokens invendáveis; manipulação de funções de aprovação para falhar transações ou aprovar por quantias mínimas; definição de taxas de transação ajustáveis, eventualmente para 100%; alegação falsa de renúncia de propriedade ou bloqueio de liquidez; e uso de marketing enganoso. Esses golpes se aproveitaram da falta de conhecimento de muitos investidores iniciantes, fraudando com sucesso fundos significativos. O artigo conclui com um aviso contra a busca de aconselhamento financeiro em plataformas de mídia social como o Reddit.

Leia mais

Aprendizado por Reforço Offline Melhora o Raciocínio em Múltiplas Etapas de LLMs

2024-12-23

Pesquisadores apresentam OREO, um método de aprendizado por reforço offline projetado para aprimorar as capacidades de raciocínio em múltiplas etapas de modelos de linguagem grandes (LLMs). Baseado no aprendizado por reforço de entropia máxima, OREO aprende conjuntamente um modelo de política e uma função de valor otimizando a equação de Bellman suave. Isso resolve as limitações da Otimização Direta de Preferências (DPO) no raciocínio em múltiplas etapas, especificamente a necessidade de dados de preferência pareados extensos e o desafio da atribuição de crédito eficaz. Experimentos demonstram a superioridade do OREO sobre os métodos de aprendizado offline existentes em benchmarks envolvendo raciocínio matemático e controle de agente incorporado.

Leia mais

IA avança em matemática: Modelo o3 da OpenAI obtém pontuação notável no conjunto de dados FrontierMath

2024-12-23

O novo modelo de linguagem da OpenAI, o o3, alcançou uma taxa de precisão de 25% no conjunto de dados FrontierMath, gerando um debate na comunidade matemática sobre as capacidades matemáticas da IA. FrontierMath é um conjunto de dados secreto contendo centenas de problemas matemáticos complexos que exigem o cálculo de valores numéricos específicos, em vez de simplesmente provar teoremas. O desempenho do o3 é surpreendente, pois supera as limitações anteriores da IA, que só conseguia resolver problemas no nível de olimpíadas de matemática ou estudos de graduação. Embora a dificuldade e a representatividade da amostra do conjunto de dados ainda sejam debatidas, essa conquista representa um progresso significativo para a IA na matemática, levando a reflexões sobre o desenvolvimento futuro da IA e a direção da pesquisa matemática.

Leia mais

38C3 Chaos Communication Congress: Uma Celebração Digital

2024-12-25

De 27 a 30 de dezembro de 2021, o 38º Chaos Communication Congress (38C3) ocorreu em Hamburgo, Alemanha. O evento ofereceu uma ampla gama de atividades, incluindo palestras, sessões auto-organizadas, palestras relâmpago e muito mais. Informações foram divulgadas através do site oficial, blog do evento e mapa digital. O registro de voluntários, um balcão de informações e suporte de acessibilidade também foram fornecidos para promover uma atmosfera inclusiva e acolhedora.

Leia mais

SCCS: O Motel de Código-Fonte Após 50 Anos

2024-12-13

Este artigo analisa retrospectivamente a influência do Sistema de Controle de Código-Fonte (SCCS) nos últimos 50 anos. O autor, Larry McVoy, detalha o formato exclusivo de tecelagem do SCCS, que permite a mesclagem por referência, evitando as ineficiências da cópia baseada em patches encontrada em outros sistemas. Ele explica como o SCCS usa essa tecelagem para recuperar qualquer versão de arquivo em tempo constante e preserva a autoria entre as versões. Embora reconheça desvantagens como bloqueios de longo prazo e orientação a arquivos, McVoy destaca a eficiência do formato de tecelagem e sua preservação da autoria como inovadoras, lançando as bases para sistemas posteriores como o BitKeeper.

Leia mais

Programador cria visualizador de Flame Graph nativo: superando o Xlib e gargalos de desempenho

2024-12-25

Um programador Rust, precisando depurar o Rust Analyzer, começou a construir um visualizador de Flame Graph nativo. Tentativas iniciais usando vários kits de ferramentas GUI se mostraram muito intensivas em memória. Em vez disso, ele usou o Xlib de forma inteligente, superando desafios como desempenho de rolagem, renderização de milhares de botões e tratamento de interações com o mouse. O resultado: um visualizador de Flame Graph leve e eficiente. Este projeto demonstra excelentes habilidades de programação e um profundo conhecimento de otimização de desempenho, oferecendo lições valiosas para outros desenvolvedores.

Leia mais
Desenvolvimento gráfico de chamas

Descompilação Completa de LEGO Island (1997)

2024-12-23

O projeto isle conseguiu uma descompilação funcionalmente completa do jogo clássico LEGO Island (Versão 1.1, inglês) lançado em 1997. O objetivo é criar uma representação precisa do código original do jogo, combinando instruções recompiladas com o código de máquina original. Tanto ISLE.EXE quanto LEGO1.DLL foram totalmente descompilados e são funcionalmente idênticos aos originais. Trabalhos futuros se concentram em melhorar a precisão do código, nomenclatura, documentação e estrutura. Embora alguns bugs possam permanecer, o jogo é jogável. O projeto usa CMake e recomenda o Microsoft Visual C++ 4.2 para compilação para precisão ideal.

Leia mais

Resgate Internacional! A Busca Épica para Salvar uma TV CRT Sony de 43 Polegadas

2024-12-23

O criador do YouTube, Shank Mods, embarcou em uma missão épica de resgate para salvar uma lendária televisão CRT Sony KX-45ED1 de 43 polegadas. Esta máquina colossal, pesando 440 libras e lançada em 1989 por impressionantes US$ 40.000 (mais de US$ 100.000 hoje), era considerada uma mera lenda. Seguindo uma pista de uma foto em um restaurante de soba japonês, Shank coordenou um esforço internacional, superando inúmeros obstáculos logísticos para transportar a TV para os EUA. O processo de restauração, detalhado em um vídeo recente do YouTube, foi igualmente desafiador, mostrando a dedicação de uma comunidade global de entusiastas de tecnologia retro.

Leia mais

Novo predador oceânico descoberto na Fossa do Atacama

2024-12-21

Cientistas descobriram um novo anfípode predador de grande porte, *Dulcibella camanchaca*, na Fossa do Atacama, a profundidades superiores a 8.000 metros. Este é o primeiro anfípode predador grande e ativo encontrado neste ambiente extremo. O crustáceo, com quase 4 centímetros de comprimento, usa apêndices especializados para caçar anfípodes menores. A descoberta destaca a Fossa do Atacama como um ponto crítico de biodiversidade e sublinha a importância da exploração contínua das profundezas oceânicas.

Leia mais

Baterias de carros elétricos duram muito mais do que se pensa

2024-12-24

Estudos com milhares de veículos elétricos revelam que as baterias de EVs estão durando muito mais do que o previsto, potencialmente ultrapassando 20 anos. Ao contrário da crença comum de que as baterias de EVs precisam de substituições caras após alguns anos, pesquisas mostram que elas podem reter 87% de sua capacidade original mesmo após 300.000 quilômetros. Isso se deve em grande parte à menor frequência de carregamento e às melhorias nos sistemas de gerenciamento de baterias. Embora o carregamento rápido e climas quentes acelerem a degradação da bateria, a tendência geral é positiva, com alguns modelos apresentando uma taxa de degradação anual de apenas 1,8%. Isso pode afetar significativamente a indústria automotiva, pois os EVs oferecem custos de manutenção mais baixos e maior vida útil, potencialmente revolucionando a vida útil tradicional de 15 anos dos carros.

Leia mais

Por que fazer amizades verdadeiras na idade adulta é mais difícil do que nunca

2024-12-24

O artigo explora os desafios de formar amizades genuínas na idade adulta. À medida que envelhecemos, nossas vidas ficam mais ocupadas, cheias de responsabilidades de trabalho e familiares, deixando menos tempo e energia para nutrir conexões profundas. A mudança na dinâmica social e as complexidades dos relacionamentos adultos tornam ainda mais difícil a busca por companheiros com ideias semelhantes. O artigo sugere que investir tempo e esforço proativamente e participar ativamente de atividades sociais são essenciais para superar esses obstáculos e construir amizades duradouras na idade adulta.

Leia mais

A Essência da Ciência da Computação: Elegância sobre Complexidade

2024-12-24

Este ensaio de Edsger W. Dijkstra explora a natureza da ciência da computação. Dijkstra argumenta que a ciência da computação deve ser um ramo altamente formalizado da matemática, enfatizando a metodologia em vez do conhecimento factual, aproximando assim a teoria e a prática. Ele critica a busca atual do mundo acadêmico por complexidade e a consequente negligência de soluções simples e eficazes, e conclama os cientistas da computação a buscarem soluções elegantes e encontrarem prazer no processo.

Leia mais

O Verdadeiro Custo do PMI: Por Que Você Deve Pagar Sua Hipoteca de Juros Baixos

2024-12-24

O autor obteve um retorno garantido de 10,66% ao pagar antecipadamente sua hipoteca de baixo juro para eliminar o PMI (seguro hipotecário privado). O artigo analisa as compensações entre pagar antecipadamente uma hipoteca de baixo juro e investir, destacando que, embora as taxas de juros baixas ofereçam retornos modestos, o custo do PMI é significativo. O autor calculou um retorno efetivo de 10,66% ao eliminar o PMI, superando a maioria dos retornos de investimento. Os leitores são encorajados a fazer seus próprios cálculos para avaliar o valor do pagamento antecipado de sua hipoteca.

Leia mais

A reação negativa à IA: Uma correção necessária para a implementação prática

2024-12-24

A InfoWorld relata uma crescente frustração dos desenvolvedores com o hype em torno da IA, enfatizando a necessidade de ferramentas práticas e facilmente integráveis. O artigo usa o projeto RamaLama como exemplo, mostrando como a tecnologia de contêineres simplifica a implantação e o uso de modelos de IA, e destaca a importância de modelos de IA menores e mais fáceis de entender. Os desenvolvedores querem que a IA se integre perfeitamente aos seus fluxos de trabalho, não como uma entidade separada. Essa "reação negativa à IA" representa uma oportunidade para uma implementação eficaz da IA.

Leia mais

Relatórios de bugs gerados por IA inundam projetos de código aberto

2024-12-24

Manutensores de projetos de código aberto estão sendo inundados por relatórios de bugs de baixa qualidade gerados por IA. Esses relatórios geralmente desperdiçam tempo e recursos valiosos, pois os sistemas de IA atualmente não conseguem entender o código e frequentemente produzem relatórios falsos ou até mesmo maliciosos. Seth Larson, da Python Software Foundation, e Daniel Stenberg, do projeto Curl, destacaram o problema, enfatizando a sobrecarga para os mantenedores voluntários e o risco de ignorar vulnerabilidades genuínas. O problema requer um esforço em toda a comunidade para melhorar o financiamento, aumentar a eficiência e desenvolver mecanismos de filtragem melhores para identificar e lidar com relatórios de lixo gerados por IA.

Leia mais
Desenvolvimento Relatórios de Bugs

A Ascensão da História Pós-Alfabetizada: Uma Lacuna Crescente entre Acadêmicos e o Público

2024-12-26

Este artigo explora o crescente abismo entre as descobertas de historiadores profissionais e a compreensão pública da história. Usando a interpretação controversa de Darryl Cooper da Segunda Guerra Mundial como exemplo, o autor destaca que a compreensão pública da história muitas vezes permanece simplista e unilateral, ignorando anos de pesquisa acadêmica aprofundada. O artigo compara as diferentes versões das Cruzadas por Runciman e Riley-Smith, enfatizando como o estilo mais literário de Runciman ressoou mais com o público, enquanto a pesquisa rigorosa de Riley-Smith permaneceu amplamente desconhecida. O autor argumenta que as limitações da publicação acadêmica moderna, a queda nos níveis de cultura pública e a diminuição da capacidade de atenção contribuem para a dificuldade de disseminar trabalhos históricos de qualidade, potencialmente levando ao declínio da pesquisa histórica.

Leia mais

Racket School 2019: Projetando Suas Próprias Linguagens

2024-12-26

A trilha "Como Projetar Linguagens" da Racket School 2019 ofereceu um mergulho profundo na programação orientada a linguagem e na construção de linguagens usando Racket. O currículo abordou conceitos essenciais como expansão de macros, módulos e verificação de tipos, reforçados por laboratórios práticos. Os participantes construíram macros simples e linguagens tipadas, obtendo uma compreensão prática dos princípios de design de linguagem. As palestras e os laboratórios proporcionaram uma experiência de aprendizagem equilibrada, culminando na capacidade de projetar e construir linguagens personalizadas.

Leia mais
1 2 34 35 36 38 40 41 42 62 63