DeepSeek服务器部署完整教程：零基础从安装到验证

知识分享

2026-06-13 13:40

9 阅读

准备开始：服务器与环境要求

部署 DeepSeek 之前，先确认你的服务器满足最低配置。
建议使用 Linux 系统（Ubuntu 20.04 或 CentOS 7+），内存至少 16GB（推荐 32GB），硬盘不低于 50GB（模型文件约 10-20GB）。
如果你用云服务器，选 GPU 实例（NVIDIA T4 或更高） 可大幅提升推理速度，纯 CPU 也能跑但响应较慢。

确保已安装以下基础软件：

Python 3.8 或更高版本
pip（Python 包管理器）
Git（用于拉取代码）
NVIDIA 驱动 + CUDA（如果使用 GPU）

使用下面命令快速检查环境：

python3 --version
pip --version
git --version
nvidia-smi   # 如果有 GPU 会显示驱动信息

如果缺少某个组件，先用 apt install（Ubuntu）或 yum install（CentOS）补装。

下载 DeepSeek 代码与模型文件

打开终端，进入你希望存放项目的目录（例如 /opt 或 /home/youruser），然后执行：

git clone https://github.com/deepseek-ai/DeepSeek.git
cd DeepSeek

接着安装 Python 依赖（推荐使用虚拟环境避免冲突）：

python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt

模型文件需要单独下载。
官方提供多种参数量的版本，新手建议先下载 DeepSeek-7B（约 13GB）。
如果服务器硬盘空间有限，可以只下载模型权重文件：

# 从 Hugging Face 下载（需要先安装 huggingface_hub）
pip install huggingface_hub
huggingface-cli download deepseek-ai/deepseek-llm-7b-chat --local-dir ./models/deepseek-7b

如果不方便访问 Hugging Face，可以使用国内镜像（例如 modelscope），命令如下：

pip install modelscope
python -c "from modelscope import snapshot_download; snapshot_download('deepseek-ai/DeepSeek-LLM-7B-Chat', cache_dir='./models')"

配置并启动 DeepSeek 服务

下载完成后，进入 DeepSeek 项目目录，编辑启动脚本。
常见的配置文件是 config.yaml 或启动脚本中的参数。
你可以直接修改 app.py 或 server.py 里的默认设置，但更推荐复制一份配置文件：

cp config.example.yaml config.yaml
vim config.yaml   # 用 vi 或 nano 编辑

重点修改以下几项：

model_path: 填写你下载模型的实际路径，例如 ./models/deepseek-7b
host 和 port: 默认 0.0.0.0:8000，保持不动即可
device: 如果有 GPU 写 cuda:0，否则写 cpu
max_tokens: 新手机器生成最大长度，建议 2048

保存后，在 venv 已激活的状态下启动服务：

python app.py --config config.yaml

如果看到输出类似 Uvicorn running on http://0.0.0.0:8000，说明服务已启动。

验证服务与常见问题排查

打开浏览器或另开一个终端，用 curl 测试接口：

curl -X POST http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{"model": "deepseek-7b", "messages": [{"role": "user", "content": "你好，请介绍一下你自己"}]}'

如果返回正常 JSON 文本，说明部署成功。

常见问题与避坑：

端口被占用：如果提示端口已使用，可以先 lsof -i:8000 | grep LISTEN 查看占用进程，然后更换 port 或杀掉旧进程。
内存不足导致 OOM：7B 模型加载约需 14GB 内存，如果服务器只有 16GB，建议关闭其他进程或使用 --low-memory 模式。
模型加载失败：检查 model_path 是否绝对路径正确，并确认模型文件夹内包含 pytorch_model.bin 等文件。
GPU 显存不够：如果显存小于 16GB，可以改用 --device cpu 或使用量化版本（如 deepseek-7b-chat-int8）。
Python 版本过低：遇到 ModuleNotFoundError 时先升级 pip 和 setuptools。

避坑补充与性能调优建议

生产环境中建议使用 systemd 管理服务，确保重启后自动拉起。
如果使用宝塔面板，可以在“网站”->“Node项目”中配置，将入口文件设为 app.py，Python 环境选虚拟环境路径。
默认启动方式不支持并发，如需承载多用户请求，可以在配置文件里增加 workers: 4 并改用 gunicorn。
定期检查日志：tail -f logs/app.log，留意 WARNING 或 ERROR 信息。

如果你在部署 DeepSeek 服务器时遇到其他报错，可以第一时间回看以上高频问题块，多数情况都能找到对应解法。
按照本文步骤操作，从买服务器到跑通第一次对话，通常只需要 30-60 分钟。

本地大模型Ollama安装与使用指南：零基础也能上手

零基础搞定Claude Code运维：安装配置与排错实战

准备开始：服务器与环境要求

下载 DeepSeek 代码与模型文件

配置并启动 DeepSeek 服务

验证服务与常见问题排查

避坑补充与性能调优建议

文章分类

高考专属福利来袭｜凭准考证免费领香港 CN2 云服务器