GitHub - reworkd/tarsier: 适用于网页交互代理的视觉工具 👀

2024-05-15

Tarsier是一个为网页交互代理设计的视觉工具,它可以通过括号和ID标记网页上的可交互元素,并提供OCR算法将网页截图转换为结构化字符串。Tarsier支持多种OCR服务,并提供详细的使用指南和示例。

77