Desafio de OCR: Digitalizando as Memórias de Saint-Simon

2024-12-17

O autor passou várias semanas usando OCR para digitalizar uma edição do final do século XIX das memórias francesas do século XVIII, *Les Mémoires de Saint-Simon*. Este gigante de 45 volumes, contendo mais de 3 milhões de palavras, está disponível online como imagens, mas é difícil de ler. O objetivo era criar uma versão de texto legível, pesquisável e copiável. Os desafios incluíram a baixa qualidade da imagem e a análise de diferentes zonas da página (cabeçalhos, texto principal, comentários na margem, notas de rodapé, etc.). A API do Google Vision foi usada para OCR, com um programa Python processando os resultados para identificar e separar o texto de diferentes áreas. Embora os LLMs não tenham conseguido lidar de forma confiável com as referências de notas de rodapé, o autor melhorou o programa e incorporou revisão manual, resultando no lançamento do primeiro volume.

Leia mais

Segunda vida de um servidor de arquivos de uma década: solução de armazenamento de baixo custo

2024-12-17

Uma empresa ainda está executando em produção uma máquina, um servidor de arquivos com mais de uma década de idade. Embora desatualizado, com um BMC que requer Java para KVM-over-IP, seus 16 compartimentos de disco e portas Ethernet de 10G o tornam ideal para reaproveitamento. Usado como um servidor de armazenamento de baixo custo com disco próprio, ele atende à necessidade de armazenamento de alta capacidade e baixo desempenho, apesar da sua idade e RAM limitada. Isso destaca o valor do reaproveitamento de hardware antigo quando os requisitos se alinham.

Leia mais

PipeGate: Proxy leve e auto-hospedado - seu 'ngrok' de baixo custo

2024-12-17

PipeGate é um proxy leve e auto-hospedado, construído com FastAPI, projetado como um 'ngrok' de baixo custo. Ele permite que você exponha seus servidores locais à internet, fornecendo uma maneira simples de criar túneis da sua máquina local para o mundo externo. É uma excelente ferramenta para desenvolvedores que querem entender como os serviços de tunelamento como o ngrok funcionam internamente ou precisam de uma alternativa personalizável hospedada em sua própria infraestrutura. Recursos-chave incluem auto-hospedagem, conexões únicas, personalização, design leve e facilidade de aprendizado. A instalação é simples, via git clone ou pip.

Leia mais

Bruin: Construa pipelines de dados com SQL e Python

2024-12-17

Bruin é uma poderosa ferramenta de pipeline de dados que combina ingestão de dados, transformação de dados com SQL e Python e verificações de qualidade de dados em uma única estrutura. Funciona com as principais plataformas de dados e é executado em sua máquina local, em uma instância EC2 ou em GitHub Actions. Recursos importantes incluem ingestão de dados, transformações SQL e Python, verificações de qualidade de dados, modelos Jinja, validação de ponta a ponta e suporte para vários ambientes. Os pipelines são facilmente definidos usando um simples arquivo pipeline.yml.

Leia mais
Desenvolvimento pipeline de dados

Guerras de Brilho dos Faróis: Uma Batalha Impulsionada pelo Reddit Sobre Tecnologia e Segurança

2024-12-17

A questão dos faróis de carro excessivamente brilhantes, particularmente aqueles que usam LEDs, tornou-se cada vez mais contenciosa. O subreddit r/FuckYourHeadlights serve como um centro central para motoristas frustrados, liderados por um desenvolvedor front-end e um engenheiro mecânico. Eles estão usando dados, pesquisas e advocacy para pressionar fabricantes de automóveis e reguladores a resolver o problema. O argumento central gira em torno dos fabricantes de automóveis que exploram brechas em regulamentos de segurança desatualizados para criar faróis excessivamente brilhantes, enquanto ainda atendem aos padrões mínimos. O debate centra-se no equilíbrio entre brilho, visibilidade e riscos de segurança relacionados ao ofuscamento. Embora uma solução permaneça evasiva, esta campanha impulsionada pelo Reddit gerou uma conversa crucial sobre a tecnologia de iluminação automotiva e suas consequências imprevistas.

Leia mais

A Lua: Uma Jornada Cósmica Cativante

2024-12-17

Este artigo nos leva em uma jornada cativante pelas intrincadas nuances do movimento da Lua, o sistema Terra-Lua e a dinâmica de um sistema de três corpos em nosso sistema solar. Usando demonstrações interativas, o autor explica fenômenos como órbitas lunares, marés, eclipses solares e lunares e revela a formação de características da superfície lunar e as razões por trás do brilho da Lua. Abrangendo conceitos como gravidade e a conservação do momento angular, o artigo explica fenômenos astronômicos complexos de forma acessível, tornando-se uma leitura científica envolvente e divertida.

Leia mais
Diversos

SpiceNice: Um Banco de Dados de Especiarias de Código Aberto

2024-12-17

O SpiceNice é um novo site de código aberto que oferece um banco de dados abrangente de especiarias culinárias. Ele fornece informações detalhadas sobre cada especiaria, incluindo seu nome botânico, usos culinários e origem, juntamente com detalhes sobre a planta correspondente. Construído usando Strapi (backend), PostgreSQL (banco de dados) e Astro (frontend), o SpiceNice visa se tornar um recurso central para cozinheiros, biólogos, agricultores e entusiastas de especiarias. Os planos futuros incluem uma API da web, suporte multilíngue e um fórum da comunidade.

Leia mais
Desenvolvimento especiarias

Discourse Comemora Uma Década de Comunidades Online

2024-12-17

O Discourse, software de fórum de código aberto, comemorou seu 10º aniversário em 26 de agosto de 2024. Lançado com a visão de elevar o padrão do discurso online, ele cresceu de uma pequena equipe de quatro para mais de 100 funcionários em 25 países. A plataforma possui mais de 20.000 comunidades, 107 milhões de tópicos e quase 1,65 bilhão de postagens. O desenvolvimento contínuo incluiu a adição de 49 plugins, recursos de bate-papo e ferramentas com tecnologia de IA para moderação e aprimoramento da experiência do usuário. Esse sucesso é um testemunho de sua natureza de código aberto, compromisso com o feedback do usuário e a dedicação de sua equipe.

Leia mais

Langfuse: Plataforma de Engenharia de LLM de código aberto simplifica o desenvolvimento

2024-12-17

Langfuse é uma plataforma de engenharia de LLM de código aberto projetada para simplificar o desenvolvimento e a implantação de aplicativos de modelos de linguagem grandes (LLM). Ela oferece recursos como observabilidade de LLM, métricas, avaliações, gerenciamento de prompts, um playground e conjuntos de dados, integrando-se perfeitamente com ferramentas como LlamaIndex, Langchain, OpenAI SDK e LiteLLM. Os desenvolvedores podem usar o Langfuse para monitorar o desempenho do LLM, gerenciar prompts, avaliar a eficácia do modelo e, finalmente, acelerar o desenvolvimento de aplicativos LLM.

Leia mais

Firmware de código aberto: necessidade e escolhas estratégicas

2024-12-17

Este artigo explora a necessidade de firmware de código aberto. O autor argumenta que o firmware, como software que controla o hardware, deve aderir aos princípios de software livre. Isso não se trata apenas de liberdade em si, mas também está diretamente relacionado aos interesses práticos dos usuários. Firmware não livre pode restringir a funcionalidade do hardware, ocultar vulnerabilidades de segurança e até impedir que os usuários corrijam problemas de segurança. O artigo analisa dois pontos de vista: um considera o firmware de código aberto desejável, mas não necessário; o outro defende que todo o software do sistema deve ser de código aberto. O autor inclina-se para o primeiro, acreditando que priorizar a liberdade do kernel do sistema operacional é mais importante, mas simultaneamente enfatiza os benefícios do firmware de código aberto e discute como promovê-lo por meio de meios estratégicos.

Leia mais
Desenvolvimento software livre

Equipe de Desenvolvimento de Uma Pessoa atinge Dois Milhões de Usuários

2024-12-17

Nadia Odunayo, uma engenheira de software, criou o StoryGraph, um aplicativo de comunidade de leitura com mais de um milhão de usuários, como desenvolvedora solo. O StoryGraph ajuda os usuários a rastrear suas leituras e recomenda livros com base no humor e nas preferências. Essa história inspiradora destaca a determinação, as habilidades técnicas e a 'estrutura de uma pessoa' que Odunayo usou para alcançar esse feito impressionante. Oferece insights valiosos para aspirantes a desenvolvedores solo.

Leia mais

O Guia de Som do Grug: Uma Abordagem de Cavernícola para Alta Fidelidade

2024-12-17

Grug, um engenheiro de som experiente (embora um pouco confuso), escreveu este guia para ajudar os jovens Grugs a construir o sistema de som perfeito para sua caverna. O guia cobre todos os componentes da cadeia de sinal, de streamers a alto-falantes, explicando parâmetros importantes como impedância, sensibilidade e distorção. Grug enfatiza o baixo ruído e a baixa distorção, aconselhando a priorização de alto-falantes de alta qualidade. Por fim, Grug recomenda um sistema básico acessível, permitindo que os jovens Grugs desfrutem de música de alta fidelidade em suas cavernas.

Leia mais
Diversos áudio

Álgebra Linear Potencializa Editor de Diagramas Interativo

2024-12-17

Ivan Shubin, ao desenvolver seu editor de diagramas interativo Schemio, utilizou de forma inteligente operações matriciais da álgebra linear para resolver uma série de problemas desafiadores. Inicialmente, o Schemio suportava apenas a criação e manipulação de formas simples. No entanto, ao introduzir uma estrutura hierárquica, as transformações de coordenadas se tornaram complexas. O autor inicialmente utilizou uma abordagem recursiva, mas encontrou problemas com escala e pontos de pivô. Por fim, Shubin utilizou matrizes para representar transformações (translação, rotação, escala), usando a multiplicação de matrizes para conversão de coordenadas e empregando de forma engenhosa a inversão de matrizes para resolver o problema de conversão de coordenadas do mundo para coordenadas locais. Além disso, as operações matriciais abordaram o ajuste preciso da posição e rotação de um objeto ao se mover dentro da hierarquia, evitando saltos inesperados. O código-fonte do Schemio é de código aberto e está disponível no GitHub.

Leia mais

Conjunto de Xadrez de Duna Impresso em 3D: Uma Obra-Prima de Design Tátil

2024-12-17

O arquiteto Rory Noble-Turner criou um conjunto de xadrez de Duna único usando impressão 3D de quartzo avançada. A peça visa proporcionar uma experiência tátil envolvente por meio de texturas intrincadas, capturando a forma crua e elementar da areia. Noble-Turner utilizou habilmente ferramentas de modelagem 3D para controlar precisamente as texturas das dunas, resultando em um design naturalmente fluido que usa diferenças de textura para distinguir as peças e o tabuleiro. Mais do que apenas uma obra de arte, é uma exploração da experiência tátil e sensorial, incentivando uma reconexão com a sensação física em nossa era digital.

Leia mais

Tig: Interface de modo texto para Git

2024-12-17

Tig é uma interface de modo texto baseada em ncurses para Git, funcionando principalmente como um navegador de repositório Git. Também auxilia na preparação de alterações para confirmação em nível de bloco e atua como um paginador para saídas de vários comandos Git. Instruções de instalação, notas de lançamento detalhando novos recursos e correções de bugs, e recursos como a página inicial, manual e seção de perguntas e respostas no Stack Overflow estão prontamente disponíveis. Relatórios de bugs e solicitações de recursos podem ser enviados por meio do rastreador de problemas ou por e-mail.

Leia mais

Programadores criam um jogo de programação fantástico: Droste's Lair

2024-12-17

Dois programadores passaram duas semanas desenvolvendo Droste's Lair, um jogo de ambiente de programação fantástico. Os jogadores constroem e contam estruturas matemáticas por meio de interações intuitivas de arrastar e soltar, usando um mecanismo "amb" para execução ramificada e recursão. O jogo, temático em torno de espadas e feitiçaria, apresenta desafios como inverter elementos de lista, gerar todas as combinações de cartas e contar as maneiras de cobrir um tabuleiro de damas com dominós. Droste's Lair combina habilmente elementos de programação e jogo, oferecendo uma maneira nova e envolvente de aprender conceitos de programação e matemática.

Leia mais

Valhalla: A Reestruturação Épica do Java se Aproxima do Fim

2024-12-17

Após uma jornada de uma década, o Projeto Valhalla, a ambiciosa reestruturação do Java, está se aproximando do fim. Com o objetivo de preencher a lacuna entre classes e primitivos, o Valhalla introduz classes de valor que oferecem a conveniência de codificação das classes com o desempenho dos primitivos, resultando em um layout de memória plano e compacto. Na Devoxx 2024, o arquiteto de linguagem Java Brian Goetz forneceu uma atualização abrangente, destacando recursos-chave como classes de valor, tipos com restrição de nulos, análise de atribuição definida aprimorada e inicialização estrita.

Leia mais
Desenvolvimento Classes de Valor

Nova estrutura Forked do Swift simplifica o gerenciamento de dados compartilhados

2024-12-17

O desenvolvedor Drew McCormack lançou o Forked, uma nova estrutura Swift para simplificar o gerenciamento de dados compartilhados em dispositivos únicos e múltiplos. Inspirado no mecanismo de mesclagem do Git, o Forked suporta ramificação e mesclagem em um único arquivo, alcançando consistência eventual. Ele não requer um histórico completo de alterações, apenas versões suficientes para mesclagem de três vias. O Forked usa structs em vez de classes, suporta Codable e se integra perfeitamente a serviços em nuvem como o iCloud. Ele também aborda condições de corrida de acesso concorrente e suporta lógica de mesclagem personalizada ou algoritmos CRDT integrados. A sincronização do CloudKit é alcançada com apenas algumas linhas de código.

Leia mais

Novo compilador do CHICKEN Scheme: CRUNCH – Um compilador Scheme estaticamente tipado

2024-12-17

Este artigo apresenta o CRUNCH, um novo compilador para um subconjunto estaticamente tipado da linguagem de programação Scheme. Construído sobre o sistema CHICKEN Scheme, ele compila código Scheme em código C99 portátil. O CRUNCH visa fornecer um compilador Scheme de alto desempenho e leve, abordando as deficiências dos sistemas Scheme existentes em termos de desempenho e portabilidade. É particularmente adequado para desenvolvimento de jogos, criação de máquinas virtuais e programação de sistemas embarcados. Embora o CRUNCH tenha limitações nas funcionalidades da linguagem Scheme suportadas, ele alcança geração de código eficiente por meio de inferência de tipos e várias otimizações, integrando-se perfeitamente ao ecossistema CHICKEN Scheme.

Leia mais
Desenvolvimento Estaticamente Tipado

Zaymo, Startup apoiada pela YC, procura Engenheiro Fundador

2024-12-17

A Zaymo, uma startup de marketing de e-mail para comércio eletrônico apoiada pela Y Combinator, está contratando um Engenheiro Fundador. A Zaymo transforma e-mails de comércio eletrônico em páginas de destino para compras, permitindo compras sem sair da caixa de entrada. A empresa está em crescimento acelerado e procura um engenheiro full-stack experiente para ajudar a construir o futuro do marketing por e-mail. O candidato ideal tem mais de 2 anos de experiência em engenharia em startups, proficiência em TypeScript, Remix e AWS, e uma atitude positiva, rápida e colaborativa. A Zaymo oferece salário competitivo, participação acionária e auxílio de mudança.

Leia mais
Startup Engenheiro

Relatório de Stanford Adverte sobre a Viabilidade e os Riscos de Bactérias Espelho

2024-12-17

Um relatório técnico da Universidade de Stanford detalha a viabilidade de criar 'bactérias espelho' e seus riscos potenciais. Bactérias espelho, com todas as moléculas quirais (proteínas, ácidos nucléicos e metabólitos) substituídas por suas imagens espelhadas, não podem evoluir naturalmente, mas estão se tornando cada vez mais sintetizáveis. Sistemas imunológicos e predação dependem de interações de moléculas quirais, o que significa que bactérias espelho podem escapar da detecção e do controle, potencialmente se espalhando sem controle e representando sérias ameaças a humanos, animais, plantas e ao meio ambiente. O relatório avalia de forma abrangente a síntese, a biosegurança, os impactos na saúde humana, as contramedidas médicas e as consequências ecológicas, instando a atenção para esse risco potencial de biosegurança.

Leia mais

Framework Lança Novo Módulo para Bay de Expansão e Mais

2024-12-17

A Framework lançou o primeiro novo módulo para o sistema Expansion Bay do Framework Laptop 16: o Adaptador Dual M.2, permitindo que os usuários adicionem unidades de armazenamento extras ou outros dispositivos de alta velocidade. Além disso, eles atualizaram a solução térmica da CPU do Framework Laptop 16, introduziram as 'Caixas Misteriosas' contendo peças aleatórias para reduzir o lixo eletrônico, adicionaram módulos de memória DDR5 de 48 GB, novos produtos e expandiram o envio para mais regiões. Essas atualizações aprimoram tanto a linha de produtos quanto a experiência do usuário.

Leia mais

Comer Espaguete com a Mão: Um Espetáculo de Rua Napolitano

2024-12-17

Em Nápoles do século XIX, comer espaguete tornou-se um espetáculo único. As pessoas pegavam punhados de espaguete e os colocavam na boca com velocidade surpreendente. Esse costume incomum atraiu muitos turistas e se tornou uma especialidade napolitana. O artigo traça a história dessa prática, desde a queda do preço da massa no século XVII, até seu papel como importante fonte de alimento para os pobres, e seu eventual desaparecimento com as mudanças sociais.

Leia mais

A Duzia de Datasaurus: Expondo as Armadilhas da Estatística

2024-12-17

Treze conjuntos de dados, com estatísticas descritivas simples quase idênticas, mas com distribuições e visualizações muito diferentes! Esta é a fascinante Duzia de Datasaurus. Compreendendo um conjunto de dados em forma de dinossauro e outros doze com formas variadas, todos compartilham quase as mesmas médias, variâncias e correlações. Isso demonstra poderosamente o perigo de depender apenas de estatísticas descritivas básicas; a visualização é crucial. A Duzia de Datasaurus serve como um conto de advertência, incentivando os analistas de dados a priorizar a visualização antes da análise para evitar conclusões enganosas.

Leia mais

Microsoft irá excluir senhas de 1 bilhão de usuários, promovendo passkeys

2024-12-17

Em resposta a um aumento nos ciberataques, a Microsoft anunciou planos para excluir senhas de 1 bilhão de usuários e promover agressivamente as passkeys mais seguras. Com os ataques a senhas quase dobrando ano a ano, a Microsoft bloqueia 7.000 ataques por segundo. As passkeys, que usam biometria ou PINs, oferecem segurança e conveniência superiores em comparação com as senhas tradicionais. A Microsoft está ativamente incentivando os usuários a adotarem as passkeys, visando um futuro sem senhas e mais seguro.

Leia mais
Tecnologia cibersegurança senhas

Microsoft lança Multilspy: biblioteca Python para simplificar clientes de servidores de linguagem

2024-12-17

A Microsoft lançou o Multilspy, uma biblioteca Python que simplifica a construção de aplicativos em torno de servidores de linguagem. Com suporte para Java, Rust, C# e Python, o Multilspy automatiza o download de binários de servidor, configuração/desmontagem e fornece uma API simples. Ele interage com servidores de linguagem para obter resultados de análise estática, como conclusão de código, definições de símbolos e referências — essenciais para técnicas de geração de código assistida por IA, como Monitor-Guided Decoding.

Leia mais

Klarna para de contratar, CEO afirma que IA já pode fazer todos os trabalhos

2024-12-17

O CEO da Klarna, Sebastian Siemiatkowski, afirmou que a IA já pode realizar todos os trabalhos atualmente feitos por humanos, levando a empresa de tecnologia financeira a interromper as contratações há um ano. A força de trabalho da empresa encolheu de 4.500 para 3.500 funcionários devido à rotatividade. Embora o site da Klarna ainda anuncie vagas abertas, um porta-voz esclareceu que a empresa não está recrutando ativamente para expandir, mas sim preenchendo funções essenciais, principalmente na área de engenharia. Este anúncio gerou preocupações sobre o impacto da IA no mercado de trabalho.

Leia mais
Tecnologia Emprego

Melhores Práticas para Representar Herança em Bancos de Dados SQL Server

2024-12-17

Este artigo explora as melhores práticas para representar relacionamentos de herança em bancos de dados SQL Server. Três abordagens comuns são apresentadas: herança de tabela única, herança de tabela concreta e herança de tabela de classe. As vantagens e desvantagens de cada uma são detalhadas. A herança de tabela única é simples, mas apresenta problemas de escalabilidade e integridade de dados; a herança de tabela concreta resolve esses problemas, mas apresenta consultas ineficientes; a herança de tabela de classe equilibra simplicidade e eficiência, tornando-a a escolha preferida na maioria dos cenários. Abordagens alternativas usando JSON para campos específicos de subtipo e design de banco de dados normalizado também são discutidas.

Leia mais

Estudo do MIT explica por que leis são escritas em estilo incompreensível

2024-12-17

Um novo estudo de cientistas cognitivos do MIT revela por que documentos legais são notoriamente difíceis de entender. Ao contrário da crença de que a complexidade decorre de edições iterativas, a pesquisa sugere que a linguagem jurídica complexa serve para transmitir autoridade, semelhante a um 'feitiço mágico'. Experimentos mostraram que mesmo não advogados instintivamente usam estruturas de linguagem complexas ao escrever leis. Essa descoberta pode inspirar legisladores a simplificar a linguagem jurídica para melhor compreensão pública.

Leia mais

Executando NetBSD em um ThinkPad 380Z Clássico: Uma Aventura Retro

2024-12-17

O autor adquiriu um IBM ThinkPad 380Z de 1998 e se aventurou a instalar um sistema operacional nele. Após testar várias opções, o NetBSD se mostrou a melhor escolha devido ao seu excelente desempenho, suporte de hardware e estabilidade. O artigo detalha o processo de atualização do disco rígido, conexão à rede, instalação do NetBSD e configuração de vários componentes de software, incluindo o sistema X Window, WireGuard e um emulador de terminal. O autor transformou com sucesso este ThinkPad antigo em uma máquina funcional adequada para programação leve, anotações e outras tarefas.

Leia mais
1 2 7 8 9 11 13 14 15 21 22