推出 DeepThought-8B:小型且强大的推理模型

2024-11-30

Ruliad 发布了 DeepThought-8B,这是一个基于 LLaMA-3.1 8B 构建的小型 AI 推理模型。该模型的特点是推理过程透明,将思考过程分解为清晰的步骤,并以 JSON 格式输出。DeepThought-8B 允许根据需要进行推理步骤,并在消费者级GPU上运行。虽然在推理、数学和编码基准测试中显示出 promising 的结果,但仍存在局限性,Ruliad 鼓励用户测试并提供反馈。

未分类 透明推理