DeepSeek现在有多少版本？DeepSeek每个版本有什么不同？

作者：小菜更新时间：2025-02-27 点击数：

简介：截至2025年2月17日，DeepSeek已发布了七大类别核心模型，具体内容如下：1. 基础语言模型系列（LLM）- DeepSeek LLM：提供通用文本生成

【菜科解读】

截至2025年2月17日，DeepSeek已发布了七大类别核心模型，具体内容如下：

1. 基础语言模型系列（LLM）

- DeepSeek LLM：提供通用文本生成功能，支持中英文双语，并在代码、数学及推理任务方面表现出色。

- DeepSeek LLM 6.7B：轻量化设计，适用于基本文本处理任务。

- DeepSeek LLM 7B Chat：经过对话优化，专为智能客服及日常生活交互打造。

- DeepSeek LLM 67B：拥有大规模参数，能够有效应对复杂的语义任务。

2. 代码生成模型（Coder系列）

- DeepSeek Coder V2：具备对Python、Java等多种语言的支持，其在HumanEval测试中的准确率为89%。

- DeepSeek Coder V2.5：融合了Chat能力，使得其综合性能提升，达到了76.3%的胜利概率。

3. 混合专家模型（MoE系列）

- DeepSeek V2：拥有236B参数，推理成本仅为GPT-4 Turbo的1%。

- DeepSeek V3：包含671B参数，生成速度达到60 TPS，性能可比肩Claude-3.5和GPT-4o1。

4. 推理优化模型（R1系列）

- R1标准版：强化逻辑推理能力，使得在数学竞赛中的准确率达到71%。

- R1-Zero：采用纯强化学习训练，无需监督微调，具备出色的高阶推理技能。

- R1-Distill：精简版，适合于资源有限的环境（例如移动端）。

- 提供多个参数版本：1.5B/7B/14B/32B/70B/671B，满足不同计算力的需求。

5. 数学专业模型（Math）

- DeepSeek Math：专门针对数学竞赛和科研场景进行了优化，支持复杂的公式推导。

6. 多模态模型（VL）

- DeepSeek VL：支持图像理解和文本生成相结合的任务，例如图文问答等。

7. 行业定制版

- 法律助手：针对法律条文检索和案例分析进行优化。

- 金融分析版：专为高频数据处理及预测建模设计。

加入收藏

上一篇：WPS灵犀AI 接入deepseek

下一篇：本地部署DeepSeek R1，最后8080网址无法访问，报

返回列表