WhisperNER:统一开放命名实体识别与语音识别

2024-11-22

本文介绍了WhisperNER,一个可以联合进行语音转录和实体识别的模型。该模型支持开放类型的命名实体识别,能够在推理过程中识别多样且不断变化的实体。研究人员利用合成的语音样本增强了一个大型合成数据集,并用NER标签提示模型,对其进行优化以输出转录的语音以及相应的标记实体。实验结果表明,WhisperNER在域外开放类型命名实体识别和监督微调方面均优于自然基线。

7