现代大型语言模型采样指南

2025-05-04
现代大型语言模型采样指南

这篇技术文章深入浅出地讲解了大型语言模型(LLM)文本生成的采样方法。文章首先解释了LLM为何使用子词而非单词或字母进行标记化,然后详细介绍了各种采样算法,包括温度采样、惩罚机制(Presence Penalty, Frequency Penalty, Repetition Penalty, DRY)、Top-K、Top-P、Min-P、Top-A、XTC、Top-N-Sigma、Tail-Free Sampling、Eta Cutoff、Epsilon Cutoff、Locally Typical Sampling、Quadratic Sampling和Mirostat等,并配以伪代码和图表进行说明。最后,文章探讨了不同采样方法的顺序及其相互作用,指出不同顺序会对最终结果产生重大影响。

阅读更多

DSR增强安全性和“形式验证”课程

2024-07-17
DSR增强安全性和“形式验证”课程

本文介绍了 DSR 增强安全性和“形式验证”课程,涵盖了安全相关问题,包括 Chrome 浏览器漏洞、亚马逊成功的“Stuffer 概念”、Rust 语言的安全性、F* 形式验证语言、GCC 14 静态分析器、BOLT 二进制代码优化器、Google Closure Compiler、TCC 编译器、CompCert 形式验证 C 编译器、内存文件描述符攻击、Seccomp 和 eBPF、Syd Linux 沙箱等内容,并探讨了各种安全工具和技术的优缺点以及如何使用它们来提高软件安全性。

阅读更多
49
未分类

GPT2-聊天机器人的神秘面纱

2024-04-29
GPT2-聊天机器人的神秘面纱

文章探讨了名为“gpt2-chatbot”的聊天机器人的神秘起源。作者通过分析模型的输出格式、特殊符号、错误信息、指令提取、上下文长度等方面,推测该模型可能来自OpenAI,并可能是GPT-4 Lite或GPT-3.5的早期版本。作者还分析了微软Phi-3模型家族的可能性,以及LMSys作为模型创建者的可能性。文章最后回顾了事件发展的时间线,并提供了参与研究的方法。

阅读更多
44
未分类 GPT2