本文介绍了Augmend公司开发的主题分割算法TreeSeg,它能够将视频会议等长文本按照主题进行分层分割。TreeSeg首先根据语音识别和屏幕共享等信息构建事件时间线,然后利用词嵌入技术计算句子间的语义相似度,并通过递归的方式将时间线分割成不同粒度的主题片段。TreeSeg在公开数据集和公司内部数据集上的表现优于其他基线模型。