VLM Run Hub: Esquemas Pydantic pré-definidos para extração simplificada de dados visuais

2025-02-20
VLM Run Hub: Esquemas Pydantic pré-definidos para extração simplificada de dados visuais

O VLM Run Hub é um repositório abrangente de esquemas Pydantic pré-definidos para extrair dados estruturados de domínios visuais não estruturados, como imagens, vídeos e documentos. Projetado para modelos de linguagem visual (VLMs) e otimizado para casos de uso do mundo real, ele simplifica a integração do ETL visual em seus fluxos de trabalho. Oferece vários esquemas predefinidos, como um esquema de Fatura para extrair metadados de faturas, e suporta vários VLMs, incluindo GPT-4o do OpenAI e Claude Vision do Anthropic. O uso de esquemas Pydantic garante a extração precisa e confiável de dados e simplifica os fluxos de trabalho a jusante.

Leia mais
Desenvolvimento Modelos de Linguagem Visual

Algoritmo revolucionário resolve o 'Problema de Ordenação de Biblioteca'

2025-02-20
Algoritmo revolucionário resolve o 'Problema de Ordenação de Biblioteca'

Um problema que atormenta cientistas da computação há décadas – o 'problema de ordenação de biblioteca' (ou 'problema de rotulagem de lista') – finalmente teve um grande avanço. O desafio é projetar uma estratégia ideal para organizar livros (ou dados) para minimizar o tempo necessário para adicionar um novo item. Enquanto algoritmos anteriores tinham um tempo médio de inserção proporcional a (log n)², a nova abordagem se aproxima surpreendentemente do ideal teórico. Ela combina inteligentemente uma pequena quantidade de conhecimento sobre o conteúdo passado da estante com o surpreendente poder da aleatoriedade, resultando em uma melhoria notável na eficiência. Esta pesquisa tem implicações significativas para a otimização do gerenciamento de bancos de dados e arquivos de disco rígido, potencialmente reduzindo drasticamente os tempos de espera e a sobrecarga computacional.

Leia mais
Desenvolvimento

México ameaça processar o Google pela mudança de nome do 'Golfo do México'

2025-02-20
México ameaça processar o Google pela mudança de nome do 'Golfo do México'

Após uma ordem executiva da era Trump renomeando o Golfo do México para 'Golfo da América', o Google Maps atualizou seus mapas, gerando uma forte reação do México. A presidente Claudia Sheinbaum anunciou que o México processará o Google se a mudança de nome não for limitada às águas sob jurisdição dos EUA. Sheinbaum argumenta que a ordem executiva se aplica apenas à plataforma continental dos EUA, não a todo o golfo, e que as ações do Google infringem a soberania mexicana. O México enviou uma carta ao Google exigindo uma correção.

Leia mais

Yaak 2.0: Cliente API recebe atualização principal

2025-02-20
Yaak 2.0: Cliente API recebe atualização principal

Yaak, um cliente API popular, recebeu uma grande atualização 2.0. Baseada em feedback do usuário, esta versão inclui sincronização de diretório local, uma interface gráfica do Git integrada, suporte a WebSocket, autenticação OAuth 2.0 e JWT com um sistema de plug-ins e melhorias significativas de desempenho. O modo Vim também foi adicionado. O desenvolvedor Greg agradece a todos os colaboradores e expressa entusiasmo pelo futuro do Yaak.

Leia mais

Animate Anyone 2: Animação de Personagens com Percepção Ambiental

2025-02-20
Animate Anyone 2: Animação de Personagens com Percepção Ambiental

Baseado em métodos anteriores de animação de personagens baseados em modelos de difusão, como o Animate Anyone, o Animate Anyone 2 introduz a consciência ambiental. Em vez de focar apenas no movimento do personagem, ele incorpora representações ambientais como entradas condicionais, gerando animações que se alinham melhor com o contexto circundante. Uma estratégia de máscara independente da forma e um guia de objetos melhoram a fidelidade da interação entre personagens, objetos e o ambiente. Uma estratégia de modulação de pose aprimora a capacidade do modelo de lidar com padrões de movimento diversos. Experimentos mostram as melhorias significativas alcançadas por essa abordagem.

Leia mais

Kernel Linux abraça Rust: O fim dos pesadelos de segurança de memória do C?

2025-02-20

Greg KH, mantenedor de longa data do kernel Linux, defende o uso de Rust para reescrever partes do kernel em uma postagem do LKML. Ele argumenta que uma parte significativa dos bugs do kernel decorre de falhas sutis em C, que os recursos de segurança de memória do Rust impediriam efetivamente. Embora uma migração completa para Rust seja irrealista, escrever novos códigos e drivers em Rust reduziria drasticamente os bugs e melhoraria a eficiência do desenvolvimento. Greg insta os desenvolvedores do kernel a abraçarem o Rust para a saúde a longo prazo do projeto Linux.

Leia mais
Desenvolvimento

Screwball Scramble: Sucesso Viral, Remoção por Direitos Autorais e Legado de 50 Anos

2025-02-20
Screwball Scramble: Sucesso Viral, Remoção por Direitos Autorais e Legado de 50 Anos

O brinquedo clássico Screwball Scramble está experimentando um ressurgimento viral. Uma avaliação engraçada no TikTok por Drinks On Me obteve mais de 15.000 visualizações, enquanto um usuário do Reddit, captainepeper, criou uma versão na web antes de ser obrigado a removê-la pela TOMY devido à violação de direitos autorais. Apesar disso, o design engenhoso e a jogabilidade desafiadora do brinquedo continuam a cativar os jogadores, com Michael do Vsauce até mesmo criando um vídeo que acumulou mais de 12 milhões de visualizações. O legado de 50 anos do Screwball Scramble é um testemunho de seu apelo duradouro, desafiando a habilidade e a paciência dos jogadores e despertando nostalgia por memórias de infância e brinquedos clássicos.

Leia mais

Velas perfumadas: A poluição do ar interno rivaliza com o escapamento do carro

2025-02-20
 Velas perfumadas: A poluição do ar interno rivaliza com o escapamento do carro

Uma nova pesquisa da Universidade Purdue revela que o uso de produtos perfumados em ambientes fechados altera significativamente a química do ar, produzindo poluição do ar comparável à exaustão de carros. Usando um laboratório de 'casa minúscula', os pesquisadores mediram as nanopartículas liberadas por velas sem chama, encontrando concentrações assustadoramente altas capazes de atingir profundamente os pulmões e representar riscos à saúde respiratória. Essas nanopartículas atingiram níveis comparáveis ​​aos emitidos por velas tradicionais, fogões a gás e até mesmo escapamento de veículos, com bilhões de partículas depositadas no trato respiratório por minuto. O estudo destaca a importância da qualidade do ar interno e sugere considerar esses fatores no projeto de edifícios e sistemas de ventilação para reduzir os riscos à saúde.

Leia mais

arXivLabs: Projetos Experimentais com Colaboradores da Comunidade

2025-02-20
arXivLabs: Projetos Experimentais com Colaboradores da Comunidade

arXivLabs é uma estrutura que permite a colaboradores desenvolverem e compartilharem novos recursos do arXiv diretamente no nosso site. Indivíduos e organizações que trabalham com o arXivLabs abraçaram e aceitaram nossos valores de abertura, comunidade, excelência e privacidade dos dados do usuário. O arXiv está comprometido com esses valores e trabalha apenas com parceiros que os respeitam. Tem uma ideia para um projeto que agregará valor à comunidade do arXiv? Saiba mais sobre o arXivLabs.

Leia mais
Desenvolvimento

O Impacto Disruptivo da IA na Contratação de Tecnologia

2025-02-20

O processo de contratação de tecnologia, particularmente as entrevistas técnicas, é universalmente odiado. As entrevistas tradicionais se concentram em algoritmos e estruturas de dados, mas ferramentas de IA como GitHub Copilot e LLMs estão tornando fácil para os candidatos falsificarem habilidades e passarem nesses testes. Este artigo explora o impacto da IA em vários tipos de entrevistas - avaliações de codificação online, fundamentos de ciência da computação e design de arquitetura - e propõe soluções. Essas incluem mudar para entrevistas presenciais, usar software anti-trapaça e mudar fundamentalmente as entrevistas para avaliar a proficiência em ferramentas de IA e habilidades de refatoração de código. Em última análise, o artigo sugere que as entrevistas de tecnologia futuras priorizarão a resolução de problemas complexos, o trabalho em equipe e a experiência em projetos do mundo real.

Leia mais
Desenvolvimento Entrevistas Técnicas

Construindo um Avaliador de Consultas SQL Simples

2025-02-19
Construindo um Avaliador de Consultas SQL Simples

Este post descreve a construção de um avaliador de consultas SQL simples capaz de lidar com instruções SELECT básicas. O autor começa criando um banco de dados de teste simples, então melhora o trabalho anterior em análise de formato de arquivo SQLite e análise SQL para lidar com consultas mais complexas. O núcleo é a implementação de `Operator` e `Planner`; `Operator` executa operações de banco de dados, e `Planner` traduz SQL analisado em `Operator`. Atualmente, falta suporte para filtragem, classificação, agrupamento e junções, mas estabelece a base para adicionar esses recursos. Melhorias no `Pager` para acesso concorrente também são descritas.

Leia mais
Desenvolvimento Avaliador de Consultas

Computação Retro: Uma Jornada nostálgica com o TI-99/4A

2025-02-19
Computação Retro: Uma Jornada nostálgica com o TI-99/4A

Este artigo documenta a exploração do autor do computador retro TI-99/4A, uma máquina lançada na mesma época que o Atari 800 e o Commodore VIC-20. Sua arquitetura única combina elementos de um console de videogame e um minicomputador. O autor começa com a história do TI-99/4A e seus chips gráficos e de som distintos, que foram usados posteriormente em muitos consoles e computadores. O artigo então usa um emulador para demonstrar a programação em TI BASIC, criando gráficos e animações simples. O autor mostra os recursos aprimorados do Extended BASIC, incluindo velocidade aumentada e gráficos aprimorados. Finalmente, o autor aborda brevemente o sistema de sprites do TI-99/4A e anuncia um artigo futuro que mergulhará no desenvolvimento de software de cartucho.

Leia mais
Tecnologia

Murena Lança Tablet Pixel Focado em Privacidade

2025-02-19
Murena Lança Tablet Pixel Focado em Privacidade

A empresa francesa Murena lançou seu primeiro tablet, o Murena Pixel Tablet, uma versão personalizada do Google Pixel Tablet que roda o /e/OS, sistema operacional focado em privacidade. O /e/OS remove aplicativos e serviços do Google, prevenindo a coleta de dados. Com preço de US$ 549 (significativamente mais caro que o modelo do Google por US$ 399), prioriza a privacidade do usuário. Embora a Google Play Store esteja ausente, o App Lounge do /e/OS permite downloads de aplicativos gratuitos de forma anônima. Aplicativos pagos exigem uma conta Google. A Murena oferece alternativas centradas na privacidade para os serviços do Google e inclui o Murena Workspace, fornecendo aplicativos de produtividade e armazenamento em nuvem.

Leia mais
Tecnologia

Aves Criadas em Pasto x Aves Criadas em Escala Industrial: Uma Disputa de Gripe Aviária

2025-02-19
Aves Criadas em Pasto x Aves Criadas em Escala Industrial: Uma Disputa de Gripe Aviária

Apesar de medidas sofisticadas de biossegurança, fazendas avícolas industriais continuam lutando contra surtos de gripe aviária. O vírus pode entrar até mesmo em galpões de alta tecnologia por meio de sistemas de ventilação. Fazendas menores, com criação de aves em pastos, embora aparentemente corram maior risco devido ao aumento do contato com aves selvagens, relatam menos surtos. Isso é atribuído a aves mais saudáveis com sistemas imunológicos mais fortes devido a dietas melhores e acesso ao ar livre. Especialistas debatem a viabilidade da avicultura em pastagens atender às demandas do mercado e se o aumento do contato com aves selvagens supera os benefícios para a saúde.

Leia mais
Tecnologia criação de aves

Valve libera código-fonte completo do Team Fortress 2

2025-02-19
Valve libera código-fonte completo do Team Fortress 2

Próximo ao seu 20º aniversário, a Valve surpreendeu ao liberar o código-fonte completo do cliente e servidor do Team Fortress 2, encorajando jogadores a modificar, expandir ou até mesmo reescrever o jogo. Essa ação visa retribuir à comunidade e prolongar a vida útil deste clássico shooter. Apesar dos problemas recentes com bots, o TF2 mantém uma base de jogadores dedicada. A iniciativa de código aberto deve gerar uma onda de mods criativos e potencialmente até novos jogos. No entanto, todas as modificações devem ser gratuitas.

Leia mais

UNIX V2 'Beta' de 1972 Ressuscitado

2025-02-19

Um pesquisador recuperou com sucesso um sistema UNIX V2 beta de 1972 funcional a partir de fitas magnéticas. Esta versão difere de suas predecessoras no tamanho do kernel e no suporte ao formato a.out, sendo considerada uma versão beta inicial do V2. Embora seja inicializável no emulador PDP-11/20 da aap, falha em outros. Por meio de uma série de etapas inteligentes, o pesquisador criou uma imagem de disco inicializável e a compartilhou publicamente. Esta descoberta fornece material inestimável para a pesquisa sobre a evolução dos sistemas UNIX iniciais.

Leia mais
Tecnologia história do UNIX

Urgente: Vulnerabilidade Crítica no Firewall da Palo Alto Networks Ativamente Explorada

2025-02-19
Urgente: Vulnerabilidade Crítica no Firewall da Palo Alto Networks Ativamente Explorada

Três vulnerabilidades no software PAN-OS da Palo Alto Networks permitem que atacantes obtenham acesso root aos sistemas afetados. A CVE-2025-0108 permite que atacantes não autenticados ignorem a autenticação, a CVE-2024-9474 permite a escalada de privilégios e a CVE-2025-0111 permite a leitura de arquivos acessíveis ao usuário "nobody". Ataques que combinam essas vulnerabilidades estão sendo observados, resultando em controle total do firewall. A Palo Alto Networks lançou patches e recomenda atualizações imediatas, especialmente para sistemas com interfaces de gerenciamento voltadas para a internet. Mesmo com acesso restrito, a aplicação de patches é crucial.

Leia mais
Tecnologia

O Boom de Data Centers na Malásia: Uma Espada de Dois Gumes

2025-02-19
O Boom de Data Centers na Malásia: Uma Espada de Dois Gumes

Johor, na Malásia, está experimentando um boom de data centers, atraindo bilhões em investimentos, mas gerando preocupações sobre a escassez de energia e água. O alto consumo de energia e água dos data centers entra em conflito direto com empresas locais, forçando algumas a se mudar. Embora o governo espere que os data centers modernizem a economia, especialistas questionam seus benefícios na criação de empregos e se preocupam com o potencial de 'colonialismo digital' e impactos ambientais insustentáveis. O caso de Johor destaca os desafios que as nações em desenvolvimento enfrentam ao equilibrar o crescimento econômico com a proteção ambiental.

Leia mais
Tecnologia

Construindo um LLM do Zero: A Jornada de um Amador

2025-02-19

Um entusiasta de IA trabalhou meticulosamente no livro de Sebastian Raschka, 'Construindo um Modelo de Linguagem Grande (Do Zero)', digitando a maior parte do código manualmente. Apesar de usar hardware de baixa potência, ele construiu e ajustou com sucesso um LLM, aprendendo sobre tokenização, criação de vocabulário, treinamento de modelos, geração de texto e pesos de modelos. A experiência destacou os benefícios da digitação manual de código para uma compreensão mais profunda e o valor de exercícios suplementares. O autor reflete sobre métodos de aprendizagem preferidos (papel x digital) e planeja aprofundar-se em conceitos de IA/ML de baixo nível.

Leia mais

Adeus ao Pi-hole problemático: NextDNS como solução custo-benefício

2025-02-19
Adeus ao Pi-hole problemático: NextDNS como solução custo-benefício

O autor inicialmente utilizou um Raspberry Pi para configurar um bloqueador de anúncios Pi-hole. Embora fácil de configurar e amigável, ele causava interrupções de rede frequentes, exigindo solução de problemas constantes e consumindo muito tempo. Eventualmente, o autor mudou para o NextDNS, um serviço SaaS, resolvendo todos os problemas por US$ 20/ano. Isso eliminou a necessidade de manutenção e solução de problemas tediosos, proporcionando uma experiência de bloqueio de anúncios mais estável. O autor conclui que o custo vale a pena em relação ao tempo e esforço economizados.

Leia mais
Desenvolvimento Bloqueio de Anúncios

Servidor de Linguagem Postgres: Uma Ferramenta Poderosa para Desenvolvimento SQL

2025-02-19
Servidor de Linguagem Postgres: Uma Ferramenta Poderosa para Desenvolvimento SQL

Um conjunto de ferramentas de linguagem e uma implementação do Protocolo de Servidor de Linguagem (LSP) para Postgres, priorizando a experiência do desenvolvedor e ferramentas SQL confiáveis. Construído com base no próprio analisador do Postgres (libpg_query) para compatibilidade de sintaxe de 100%, utiliza uma arquitetura cliente-servidor com design independente de transporte, oferecendo acesso via LSP, CLI, APIs HTTP ou WebAssembly. Atualmente com recursos de autocompletar, destaque de sintaxe, verificação de tipo (via EXPLAIN) e um linter inspirado no Squawk, o projeto se concentra em refinar esses recursos principais e construir uma infraestrutura robusta. Contribuições são bem-vindas!

Leia mais
Desenvolvimento Ferramentas SQL

Regressão de Otimização do Clang: Funções Inline Causam Queda de Desempenho em Benchmark C++

2025-02-19

Um benchmark C++ revelou uma regressão de desempenho na otimização de funções inline do Clang. Quando a função `increment` foi inline, falhas na previsão de desvios resultaram em uma queda de desempenho de aproximadamente 5 vezes em comparação com a versão não inline. O `perf stat` confirmou que as previsões erradas de desvios foram as culpadas. Curiosamente, compilar com o toolchain Zig melhorou significativamente o desempenho, sugerindo uma possível regressão no Clang 19. O problema foi relatado no repositório Clang/LLVM, com investigação inicial apontando para uma compensação entre as passagens de otimização SROA e SimplifyCFG.

Leia mais
Desenvolvimento

BloodFlowTrixi.jl: Modelos de fluxo sanguíneo de alto desempenho em Julia

2025-02-19
BloodFlowTrixi.jl: Modelos de fluxo sanguíneo de alto desempenho em Julia

BloodFlowTrixi.jl é um pacote Julia que implementa modelos de fluxo sanguíneo 1D e 2D para circulação arterial, derivados das equações de Navier-Stokes. Desenvolvido para pesquisa de doutorado em patologias cardiovasculares, ele utiliza a estrutura Trixi.jl para simulações eficientes de Galerkin descontínuo (DG). O pacote suporta geometrias curvilíneas e dinâmica de parede complacente. Desenvolvimentos futuros incluem interação fluido-estrutura 3D e simulações de rede vascular.

Leia mais

Ecossistema Fechado da Apple Atrasa o Desenvolvimento iOS Impulsionado por IA

2025-02-19
Ecossistema Fechado da Apple Atrasa o Desenvolvimento iOS Impulsionado por IA

Um desenvolvedor iOS experiente lamenta o ecossistema fechado da Apple, dificultando sua capacidade de competir com plataformas de criação de aplicativos baseadas em IA, como lovable.dev e a0.dev. O artigo destaca as complexidades da compilação do iOS, formatos de projetos Xcode proprietários, a natureza de código fechado do SwiftUI e os desafios de implantar servidores macOS em escala como obstáculos significativos para o desenvolvimento de ferramentas robustas de desenvolvimento iOS assistidas por IA. Em contraste, a natureza de código aberto do Android oferece uma vantagem significativa no desenvolvimento de aplicativos de IA. O autor argumenta que a negligência de longa data da Apple em relação à experiência do desenvolvedor acabou deixando-os para trás na corrida da IA.

Leia mais

Microsoft Apresenta Protótipo de Geração de Jogos em Tempo Real com IA: WHAM

2025-02-19
Microsoft Apresenta Protótipo de Geração de Jogos em Tempo Real com IA: WHAM

A Microsoft apresentou um protótipo de ferramenta de geração de vídeo em tempo real com IA chamada WHAM. Essa ferramenta gera instantaneamente imagens de jogo com base na entrada do usuário, permitindo transições de cena simplesmente fornecendo novos quadros de amostra. Embora atualmente limitada a uma resolução muito baixa (300x180) e taxa de quadros (10fps), com distorções perceptíveis, representa um passo significativo em direção a experiências interativas geradas por IA. A Microsoft prevê um futuro em que a IA poderá criar jogos interativos de alta qualidade em tempo real.

Leia mais

Cérebro Dividido: Uma história chocante sobre autoconsciência

2025-02-19
Cérebro Dividido: Uma história chocante sobre autoconsciência

Em 1939, dez pacientes com epilepsia foram submetidos a uma cirurgia radical: seccionar o corpo caloso para separar os hemisférios do cérebro. Estudos iniciais sugeriram que não havia prejuízo cognitivo. No entanto, na década de 1960, os testes de Gazzaniga e Sperry revelaram uma verdade chocante: os hemisférios funcionavam de forma independente, cada um com seu próprio fluxo consciente, até mesmo 'discutindo' sobre percepções. Isso revolucionou a compreensão do cérebro e do eu, oferecendo novas perspectivas sobre a consciência. A pesquisa continua, explorando como cada hemisfério percebe o eu.

Leia mais
Tecnologia

Versalhes: Poder e a Ausência de Alma no Design

2025-02-19

A construção de Versalhes surgiu do desejo de poder de Luís XIV e da inveja pelos magníficos jardins de seu antigo ministro das finanças. O autor usa isso como trampolim para discutir a falta de alma no design de produtos modernos. Ele argumenta que, assim como Versalhes é impressionante, mas sem vida, muitos produtos modernos priorizam a estética superficial e a funcionalidade, negligenciando a conexão emocional. O verdadeiro design, ele afirma, deve vir das experiências emocionais do designer, tirando inspiração de suas próprias profundezas, como um jardineiro cultivando o solo, para criar produtos cheios de vida. O artigo usa a arquitetura como exemplo, contrastando os sentimentos evocados pela Sagrada Família e um prédio de central telefônica, destacando a importância da emoção no design.

Leia mais
Design Emoção Produto

O Dilema Ético dos LLMs: Por que Parei de Usá-los

2025-02-19

Este artigo mergulha nas preocupações éticas em torno dos Grandes Modelos de Linguagem (LLMs) e explica a decisão do autor de parar de usá-los. O autor explora cinco questões principais: consumo de energia, origem dos dados de treinamento, deslocamento de empregos, informações imprecisas e vieses, e concentração de poder. O alto consumo de energia, preocupações com a privacidade relacionadas aos dados de treinamento, o potencial de deslocamento de empregos, o risco de desinformação devido a vieses e imprecisões e a concentração de poder nas mãos de algumas grandes empresas de tecnologia são destacados como problemas éticos significativos. O autor argumenta que usar LLMs sem abordar ativamente essas preocupações éticas é antiético.

Leia mais
IA Ética

Soldado americano se declara culpado por roubo de milhões de registros telefônicos da AT&T e Verizon

2025-02-19
Soldado americano se declara culpado por roubo de milhões de registros telefônicos da AT&T e Verizon

Um soldado do Exército dos EUA, Cameron John Wagenius, declarou-se culpado de invadir a AT&T e a Verizon, roubando uma grande quantidade de registros telefônicos. Ele enfrenta uma multa máxima de US\$ 250.000 e até 20 anos de prisão. Este caso está ligado à grande violação de dados da Snowflake em 2024, que também envolveu outros dois hackers, Connor Moucka e John Binns. O ataque à Snowflake resultou no roubo de grandes quantidades de dados da AT&T, LendingTree, Banco Santander, Ticketmaster e pelo menos outras 160 empresas.

Leia mais
Tecnologia hackeamento

Mozilla reestrutura liderança, abraça a era da IA

2025-02-19
Mozilla reestrutura liderança, abraça a era da IA

A Mozilla anunciou uma reestruturação de sua liderança para enfrentar os desafios de crescimento financeiro e impacto da missão. Para diversificar, a Mozilla está investindo em publicidade que respeita a privacidade, desenvolvendo IA de código aberto confiável e lançando campanhas de arrecadação de fundos online. As novas lideranças vêm de empresas como Google, Twitter e Uber, trazendo um equilíbrio de experiência em negócios, tecnologia e interesse público. A Mozilla visa continuar sua luta por um futuro melhor por meio de tecnologia que prioriza as necessidades humanas.

Leia mais
1 2 433 434 435 437 439 440 441 595 596