本地部署 DeepSeek，原来有这么多坑

知识分享

2026-05-29 12:40

45 阅读

想在自己服务器上跑个DeepSeek模型，结果一上来就卡在环境、报错、下载失败上？
别着急，这篇文章把最常见的坑摸清楚了，按步骤走，你也能顺利跑起来。

先摸清硬件门槛，别让显存卡住第一步

很多新手拿着普通配置就开跑，结果模型加载一半直接爆显存。DeepSeek系列模型对显存有硬性要求，以7B版本为例，至少需要8GB显存（量化后），推荐16GB以上。如果你用CPU推理，内存最好32GB起步。
避坑点：运行前用 nvidia-smi 确认显存可用，或用 free -h 检查内存。不要在只有4GB显存的显卡上直接尝试完整模型，可以先用1.5B小版本测试流程。

安装环境：选对工具少走弯路

官方推荐Ollama一键部署，对新手最友好。
按以下步骤操作：

# 安装Ollama（Linux/macOS）
curl -fsSL https://ollama.com/install.sh | sh
# 安装后拉取模型（例如deepseek-r1:7b）
ollama pull deepseek-r1:7b

常见坑1：国内服务器拉取模型慢。可以配置镜像源或在 /etc/systemd/system/ollama.service 中加入环境变量 OLLAMA_HOST=0.0.0.0 并重启服务，同时使用 ollama pull --help 查看代理设置。
常见坑2：Ollama默认路径可能空间不足。建议将模型目录软链接到大磁盘：

# 停止Ollama服务
systemctl stop ollama
# 移动模型目录到新位置
mv /usr/share/ollama/.ollama/models /data/ollama_models
ln -s /data/ollama_models /usr/share/ollama/.ollama/models
systemctl start ollama

避坑指南：这些报错最常见

部署过程中大概率遇到以下几个问题：

Pull timeout：网络不稳定，检查防火墙是否放行443端口，或者改用代理。
Out of memory：模型太大，切换量化版本（如 deepseek-r1:7b-q4_K_M）。
CUDA error：NVIDIA驱动或CUDA版本不匹配，执行 nvidia-smi 查看驱动版本，然后安装对应CUDA toolkit。
RuntimeError: Cannot load model：模型文件损坏，删除后重新 ollama pull。

对于Ollama的常见报错，日志定位路径：

tail -f /var/log/ollama/ollama.log

如果日志不详细，加 --verbose 参数启动。

验证模型是否正常运行

模型跑起来不是终点，你得确认它真的能用。

# 直接通过命令行对话
ollama run deepseek-r1:7b
>>> 你好，请用中文自我介绍

如果正常返回，说明部署成功。
还可以用API测试：

curl http://localhost:11434/api/generate -d '{
  "model": "deepseek-r1:7b",
  "prompt": "用一句话解释量子计算"
}'

返回流畅的中文答案就没问题。

最后说几句

如果你跟着步骤走还是卡住，回头检查三点：显存、磁盘空间、网络。
本地部署DeepSeek其实不复杂，只要避开这些坑，半小时内就能搞定。
后续你想做API服务或接入聊天界面，可以在同一台服务器上再加个Web UI（如Open WebUI），操作也很简单。

宝塔面板MySQL慢查询优化：零基础也能精准定位慢SQL

用大模型写运维脚本，这几个坑千万别踩

先摸清硬件门槛，别让显存卡住第一步

安装环境：选对工具少走弯路

避坑指南：这些报错最常见

验证模型是否正常运行

最后说几句

文章分类

机房迁移升级通知