手把手教你搭建本地AI开发环境：从0到能跑大模型

2026.06.27 · Skills教程

越来越多人在自己的电脑上跑大模型了。搭一个本地AI开发环境没有想象中那么复杂，这篇文章带你一步步搞定。我用的是一台32GB内存的Windows电脑，硬件要求不算高。

为什么要在本地跑AI？

最低配置（能跑小模型）：8GB内存、4GB显存。
推荐配置（能跑7B-13B模型）：16-32GB内存、8GB以上显存、200GB SSD。
如果是Apple Silicon的Mac，推荐16GB以上的统一内存。

不要担心你的电脑跑不了大模型。现在有很多量化版本的小模型，4GB显存也能跑得不错。

Ollama是目前最流行的本地模型运行工具。安装很简单：

从下载到用上，整个过程不超过10分钟。

终端里用模型不太方便，推荐装一个用户界面：Open WebUI。它跟Ollama配合，启动后打开浏览器就能用。安装命令：docker run -d -p 3000:8080 ghcr.io/open-webui/open-webui:main

如果你不熟悉Docker，也可以用LM Studio——自带漂亮界面的桌面应用，下载模型和管理都很方便。

Ollama支持OpenAI兼容的API接口。启动Ollama后，本地就会有个API服务。在Cursor或Continue插件里配置API地址，就可以用本地模型做代码补全了。

装Ollama → 下载Qwen或Llama → 装Open WebUI → 开用。整个过程不超过30分钟，你就能拥有一个完全免费、隐私、离线的AI助手。