[2404.08698] Lossless Acceleration of Large Language Model via Adaptive N-gram Parallel Decoding

2024-04-21

此网站为康奈尔大学 arXiv 论文预印本服务器,提供科学、工程、数学、计算机科学和统计学领域的学术论文预印本。这些预印本尚未经过同行评审,但可以在发表前与更广泛的研究社区分享。arXiv 旨在促进研究的快速传播和知识的开放获取。

41
未分类