A Web Efémera: Preservando seu Legado Digital

2025-02-25
A Web Efémera: Preservando seu Legado Digital

O conteúdo online é efêmero. Este artigo destaca a importância da preservação de informações digitais e defende o uso de arquivos de texto simples em Markdown como uma solução robusta. A legibilidade do Markdown, a compatibilidade entre plataformas e a acessibilidade a longo prazo são vantagens importantes. O autor compartilha estratégias pessoais, incluindo o uso do Obsidian para anotações, geradores de sites estáticos para blogs e scripts Python automatizados para conversão de conteúdo. Cópias de segurança regulares e downloads de dados são enfatizados, juntamente com um pedido por ferramentas de exportação de dados de mídia social melhores.

Leia mais
Diversos

Não use a similaridade de cosseno descuidadamente!

2025-01-14
Não use a similaridade de cosseno descuidadamente!

Este artigo explora os riscos de depender excessivamente da similaridade de cosseno para comparações vetoriais em ciência de dados. O autor argumenta que, embora computacionalmente simples, a similaridade de cosseno frequentemente falha em capturar a similaridade semântica e pode ser facilmente enganada por padrões superficiais, como estilo de escrita e erros de digitação. O artigo usa exemplos para ilustrar esse problema e propõe vários métodos aprimorados, incluindo: usar diretamente LLMs para comparação, ajuste fino ou aprendizado por transferência para criar embeddings específicos da tarefa, engenharia de prompts prévios e pré-processamento de texto. O autor enfatiza a importância de escolher métricas de similaridade apropriadas com base em necessidades específicas, em vez de usar cegamente a similaridade de cosseno.

Leia mais