Uma Rede Semântica de 1,5 Milhão de Palavras em Inglês: A Linguística por Trás de um Jogo de Palavras
A construção de um jogo de palavras levou pesquisadores a criar uma rede semântica abrangendo 1,5 milhão de termos em inglês. Combinando tesauros curados por humanos, sistemas de catalogação de livros e consultas de LLM cuidadosamente elaboradas, eles criaram uma rede onde 76% dos pares de palavras aleatórias se conectam em 7 ou menos etapas. Superando os desafios impostos por palavras superconectadas e equilibrando múltiplos sinais de classificação, a rede resultante revela as conexões surpreendentemente próximas entre palavras em inglês e fornece parâmetros ideais para o design de jogos. Esta pesquisa demonstra como diversas fontes de dados e técnicas podem ser combinadas para construir uma rede semântica que é ao mesmo tempo perspicaz cientificamente e divertida.