Ollama极简部署本地大模型：零基础从安装到验证全流程

知识分享

2026-06-10 18:00

8 阅读

为什么推荐用Ollama跑本地大模型

以前想运行一个大语言模型，通常需要配GPU、装Python环境、折腾依赖库，门槛非常高。
Ollama的出现彻底改变了这一点——它是一个极简的本地大模型运行工具，支持Llama、Mistral、Qwen等几十个主流模型，安装后两条命令就能让模型跑起来。
本文就带你完成Ollama极简部署本地大模型的全过程，哪怕你完全没接触过命令行也没关系，跟着步骤走就行。

动手前的准备工作

硬件方面：Ollama对配置要求相对友好，普通家用电脑也能运行小尺寸模型（如7B参数）。建议内存至少8GB，如果跑13B或更大模型，16GB以上体验更好。
硬盘预留5-10GB空间用来存放模型文件。
系统方面支持Windows、macOS和Linux，本文以Ubuntu 22.04为例，其他系统操作大同小异。

软件方面：
你需要一个终端（Windows下推荐PowerShell或CMD，
macOS/Linux直接用终端），确保网络能正常访问GitHub和Ollama官网（如果访问慢可以配置代理或使用镜像源，
后面会讲）。

分步操作：5分钟完成部署

第一步：安装Ollama。
打开终端，执行以下命令（适用于Linux/macOS）：

curl -fsSL https://ollama.com/install.sh | sh

Windows用户请直接去Ollama官网下载安装包，双击运行即可。
安装完成后，在终端输入ollama --version，如果返回版本号（如0.1.32），说明安装成功。

第二步：拉取并运行模型。
Ollama内置了模型仓库，最推荐新手从qwen2:0.5b开始测试，这个模型只有0.5B参数，体积小速度快。
执行：

ollama run qwen2:0.5b

第一次运行会自动下载模型（约500MB），等待下载完成就会进入对话界面。
你也可以用ollama pull qwen2:0.5b只下载不运行。

第三步：验证模型响应。
在对话界面输入“你好”，模型应该会用中文回复。
如果一切正常，按Ctrl+D退出对话，你的第一个本地大模型已经部署成功了。

避坑指南：新手最常遇到的3个问题

问题1：安装时提示“curl command not found”。
这是因为系统没装curl，先用sudo apt update && sudo apt install curl -y安装curl，再重试安装命令。

问题2：下载模型速度极慢或连接超时。
Ollama默认从GitHub Releases下载，国内网络可能受限。
有两个解决办法：一是配置系统级代理（如export http_proxy=http://127.0.0.1:7890），二是使用国内镜像站（目前社区有开源镜像，但不太稳定，更推荐自建代理）。

问题3：运行模型时报“ollama: command not found”。
通常是因为安装后未重新加载环境变量。
执行source ~/.bashrc或source ~/.zshrc，或者直接重启终端。

效果验证与进阶建议

在终端执行ollama list可以查看已拉取的模型列表。
执行ollama run qwen2:0.5b进入交互模式后，可以连续提问测试模型的回答质量。
Ollama还支持REST API，在浏览器访问http://localhost:11434能看到的JSON信息，说明服务正常。

如果你想要更丰富的体验，可以试试qwen2:7b（约4GB）或llama3:8b，这些模型的回复质量明显更好。
拉取命令不变，只需改模型名称：ollama run llama3:8b。
需要留意的是，大模型对内存和CPU要求更高，运行时会占用全部CPU核，建议关闭其他占用高的程序。

以上就是Ollama极简部署本地大模型的完整流程。
建议先按本文步骤完整执行一遍，再根据自己的需求调整模型参数或接入第三方UI（如Open WebUI）。
遇到异常时，优先回看避坑和高频问题部分，基本上都能解决。

零基础也能上手：本地LLM多款模型对比测评完整教程

LlamaCpp轻量化模型运行：零基础教你用

为什么推荐用Ollama跑本地大模型

动手前的准备工作

分步操作：5分钟完成部署

避坑指南：新手最常遇到的3个问题

效果验证与进阶建议

文章分类

高考专属福利来袭｜凭准考证免费领香港 CN2 云服务器