Un réseau sémantique de 1,5 million de mots anglais : la linguistique derrière un jeu de mots
La création d'un jeu de mots a conduit des chercheurs à construire un réseau sémantique englobant 1,5 million de termes anglais. En combinant des thésaurus gérés par des humains, des systèmes de catalogage de livres et des requêtes LLM soigneusement conçues, ils ont créé un réseau où 76 % des paires de mots aléatoires se connectent en 7 sauts ou moins. En surmontant les défis posés par les mots super-connecteurs et en équilibrant plusieurs signaux de classement, le réseau résultant révèle les liens étonnamment étroits entre les mots anglais et fournit des paramètres idéaux pour la conception de jeux. Cette recherche montre comment combiner diverses sources de données et techniques pour construire un réseau sémantique à la fois perspicace sur le plan scientifique et divertissant.
Lire plus