DeepSeek服务器部署完整教程:零基础从安装到验证
准备开始:服务器与环境要求
部署 DeepSeek 之前,先确认你的服务器满足最低配置。
建议使用 Linux 系统(Ubuntu 20.04 或 CentOS 7+),内存至少 16GB(推荐 32GB),硬盘不低于 50GB(模型文件约 10-20GB)。
如果你用云服务器,选 GPU 实例(NVIDIA T4 或更高) 可大幅提升推理速度,纯 CPU 也能跑但响应较慢。
确保已安装以下基础软件:
- Python 3.8 或更高版本
- pip(Python 包管理器)
- Git(用于拉取代码)
- NVIDIA 驱动 + CUDA(如果使用 GPU)
使用下面命令快速检查环境:
python3 --version
pip --version
git --version
nvidia-smi # 如果有 GPU 会显示驱动信息
如果缺少某个组件,先用 apt install(Ubuntu)或 yum install(CentOS)补装。
下载 DeepSeek 代码与模型文件
打开终端,进入你希望存放项目的目录(例如 /opt 或 /home/youruser),然后执行:
git clone https://github.com/deepseek-ai/DeepSeek.git
cd DeepSeek
接着安装 Python 依赖(推荐使用虚拟环境避免冲突):
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
模型文件需要单独下载。
官方提供多种参数量的版本,新手建议先下载 DeepSeek-7B(约 13GB)。
如果服务器硬盘空间有限,可以只下载模型权重文件:
# 从 Hugging Face 下载(需要先安装 huggingface_hub)
pip install huggingface_hub
huggingface-cli download deepseek-ai/deepseek-llm-7b-chat --local-dir ./models/deepseek-7b
如果不方便访问 Hugging Face,可以使用国内镜像(例如 modelscope),命令如下:
pip install modelscope
python -c "from modelscope import snapshot_download; snapshot_download('deepseek-ai/DeepSeek-LLM-7B-Chat', cache_dir='./models')"
配置并启动 DeepSeek 服务
下载完成后,进入 DeepSeek 项目目录,编辑启动脚本。
常见的配置文件是 config.yaml 或启动脚本中的参数。
你可以直接修改 app.py 或 server.py 里的默认设置,但更推荐复制一份配置文件:
cp config.example.yaml config.yaml
vim config.yaml # 用 vi 或 nano 编辑
重点修改以下几项:
model_path: 填写你下载模型的实际路径,例如./models/deepseek-7bhost和port: 默认0.0.0.0:8000,保持不动即可device: 如果有 GPU 写cuda:0,否则写cpumax_tokens: 新手机器生成最大长度,建议 2048
保存后,在 venv 已激活的状态下启动服务:
python app.py --config config.yaml
如果看到输出类似 Uvicorn running on http://0.0.0.0:8000,说明服务已启动。
验证服务与常见问题排查
打开浏览器或另开一个终端,用 curl 测试接口:
curl -X POST http://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{"model": "deepseek-7b", "messages": [{"role": "user", "content": "你好,请介绍一下你自己"}]}'
如果返回正常 JSON 文本,说明部署成功。
常见问题与避坑:
- 端口被占用:如果提示端口已使用,可以先
lsof -i:8000 | grep LISTEN查看占用进程,然后更换port或杀掉旧进程。 - 内存不足导致 OOM:7B 模型加载约需 14GB 内存,如果服务器只有 16GB,建议关闭其他进程或使用
--low-memory模式。 - 模型加载失败:检查
model_path是否绝对路径正确,并确认模型文件夹内包含pytorch_model.bin等文件。 - GPU 显存不够:如果显存小于 16GB,可以改用
--device cpu或使用量化版本(如deepseek-7b-chat-int8)。 - Python 版本过低:遇到
ModuleNotFoundError时先升级pip和setuptools。
避坑补充与性能调优建议
- 生产环境中建议使用 systemd 管理服务,确保重启后自动拉起。
- 如果使用宝塔面板,可以在“网站”->“Node项目”中配置,将入口文件设为
app.py,Python 环境选虚拟环境路径。 - 默认启动方式不支持并发,如需承载多用户请求,可以在配置文件里增加
workers: 4并改用gunicorn。 - 定期检查日志:
tail -f logs/app.log,留意WARNING或ERROR信息。
如果你在部署 DeepSeek 服务器时遇到其他报错,可以第一时间回看以上高频问题块,多数情况都能找到对应解法。
按照本文步骤操作,从买服务器到跑通第一次对话,通常只需要 30-60 分钟。