大型语言模型字体识别挑战:失败告终?
2025-08-04
一位开发者用DaFont论坛未识别字体的数据,对GPT-4和Gemini进行了字体识别能力的测试。结果显示,即使提供了图片、标题和描述等上下文信息,这两个大型语言模型的表现也极其糟糕,准确率远低于预期。这表明,即使在看似简单的图像分类任务中,大型语言模型仍然存在局限性,并非万能的解决方案。该项目使用了Python脚本抓取数据,并通过GitHub Actions自动运行,结果以JSON格式存储,并用Observable Framework制作了动态看板。