Question 1

DeepSeek Model1 已经发布了吗？

Accepted Answer

DeepSeek Model1 指的是 DeepSeek 最新的推理模型系列，包括 R1 和 V3 模型。这些模型是开源的，可通过 API 访问。

Question 2

什么是 FlashMLA？

Accepted Answer

FlashMLA（Flash Multi-head Latent Attention）是 DeepSeek 优化的注意力机制，通过隐空间压缩提供高达 3 倍的推理加速，同时降低内存占用。

Question 3

Model1 与 OpenAI o1 相比如何？

Accepted Answer

DeepSeek Model1 在 MATH-500 等基准测试上达到了相当或更优的性能（97.3% vs 96.4%），同时保持开源且价格更低（每百万 Token $0.14 vs $15）。

Question 4

有 API 可用吗？

Accepted Answer

有！DeepSeek 提供官方 API 访问。你也可以使用 RunPod、Vultr 或 AWS 等平台在自己的基础设施上部署 Model1。

Question 5

上下文窗口大小是多少？

Accepted Answer

DeepSeek Model1 支持高达 128K Token 的上下文窗口，可用于长文档推理、代码分析和扩展对话。

特性	DeepSeek Model1R1 / V3	GPT-4Turbo	OpenAI o1Preview
MATH-500 分数	97.3%	94.1%	96.4%
HumanEval	92.1%	88.4%	90.2%
MMLU	91.8%	90.2%	92.0%
上下文窗口	128K	128K	200K
开源
API 成本（每百万 Token）	$0.14	$30.00	$15.00
FlashMLA 支持
多步推理

DeepSeek Model1
在线演练场

为什么选择 DeepSeek Model1？