Protótipo de Mapas Internos com VLMs: De Fotos a Posições
2025-07-07
Em um final de semana, o autor criou um protótipo de sistema de localização interna usando apenas uma foto e modelos avançados de linguagem e visão (VLMs). Ao anotar um mapa de um shopping, identificar lojas visíveis na foto e usar a capacidade de reconhecimento de imagem do VLM, o sistema conseguiu corresponder a localização da foto ao mapa. Apesar de alguma ambiguidade, os resultados são surpreendentemente precisos, mostrando o potencial dos VLMs para localização interna. Isso abre caminhos interessantes para futuras aplicações de realidade aumentada (AR) e robótica, ao mesmo tempo em que destaca potenciais preocupações ambientais.