Background
2484 字
12 分钟
VSCode 本地 AI 指南
NOTE

本文将向你介绍如何使用 OllamaContinue 插件在 VSCode 内使用本地AI模型,以达到保护隐私,维护数据安全的目的(以 Windows 11 25H2 专业版 和受支持的NVIDIA GPU为例,AMD GPU暂不讨论)

如果您决定本地部署AI模型,那么我默认您对 Windows 操作系统有基础的认知,比如命令行软件安装防火墙等,同时我也默认您会使用 VSCode 的基础功能

本文中Windows 终端均使用PowerShell

TIP

本文使用 AI 辅助编写

软件、扩展下载与安装#

NVIDIA 相关#

NOTE

前提:您的设备安装有 NVIDIA GPU 且 GPU 受支持

Ollama 支持计算能力为 5.0 及以上且驱动版本为 531 或更新版本的 NVIDIA GPU

相关链接:

Hardware support - Ollama

CUDA GPU Compute Capability - NVIDIA

为了更好发挥您的 NVIDIA GPU 算力,建议安装 NVIDIA AppCUDA ToolkitcuDNN这三款软件

验证 CUDA 支持性:

在终端中输入以下命令并查看输出:

PowerShell
nvidia-smi

输出示例(部分):

PowerShell
+----------------------------------------------------------------------+
| NVIDIA-SMI 591.86 Driver Version: 591.86 CUDA Version: 13.1 |
+----------------------+-------------------------+---------------------+

其中,CUDA Version表示驱动支持的最高CUDA版本,CUDA 版本需与显卡驱动、cuDNN 版本严格匹配,否则会导致兼容性问题。

验证 CUDA 是否正确安装:

PowerShell
nvcc -V

正确安装输出示例:

PowerShell
Windows PowerShell
版权所有(C) Microsoft Corporation。保留所有权利。
安装最新的 PowerShell,了解新功能和改进!https://aka.ms/PSWindows
PS C:\Users\Admin> nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Tue_Dec_16_19:27:18_Pacific_Standard_Time_2025
Cuda compilation tools, release 13.1, V13.1.115
Build cuda_13.1.r13.1/compiler.37061995_0

Visual Studio Code#

TIP

VSCode 是目前最流行、社区最活跃的免费、轻量开源编辑器之一。虽然它本身只是一个“文本编辑器”,但通过丰富的插件生态,它可以变成一个功能强大的 IDE,几乎能胜任所有语言的开发任务。

microsoft
/
vscode
Waiting for api.github.com...
00K
0K
0K
Waiting...

下载链接:https://code.visualstudio.com/Download

对于 Windows 用户,我推荐您下载图中红色箭头所指的System Installer版本

Continue#

此方法不推荐使用(点击展开)
TIP

Continue 是一款开源的AI编程助手插件,能将 DeepSeek、ChatGPT、Claude 及 Gemini 等主流模型直接集成到编辑器内。它通过聊天、代码自动补全、解释、调试和重构等功能,在编写时提供智能辅助,支持本地部署,可完全免费使用。

continuedev
/
continue
Waiting for api.github.com...
00K
0K
0K
Waiting...

安装 Continue

1、通过 Visual Studio Marketplace

访问链接 Continue - open-source AI code agent

点击 Install

在弹出的窗口中点击打开即可自动打开 VSCode 内的 Continue 扩展页面(前提是已安装 VSCode)

点击安装即可

2、或者,你也可以直接在 VSCode 的扩展活动栏中搜索 Continue 然后完成安装

Ollama#

TIP

Ollama 是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。Ollama 提供了一个简单的方式来加载和使用各种预训练的语言模型,支持文本生成、翻译、代码编写、问答等多种自然语言处理任务。

ollama
/
ollama
Waiting for api.github.com...
00K
0K
0K
Waiting...

下载链接(官网):https://ollama.com

IMPORTANT

对于下载的 OllamaSetup.exe 可执行文件,它的默认安装位置是 C盘,为了避免将软件安装到系统主驱动器,可以使用命令行附加参数更改安装位置 官方文档

Windows 终端成功执行以下命令的前提是通过cd命令导航到文件所在位置,或者在文件所在文件夹内单击鼠标右键,点击在终端中打开

PowerShell
.\OllamaSetup.exe /DIR="d:\some\location"

将 d:\some\location 更改为您实际的安装位置,比如 D:\Ollama,然后在 Ollama 的安装向导中按照提示进行操作即可将 Ollama 安装到您指定的目录中

更改 Ollama 模型储存位置

根据官方文档,需要设置名为OLLAMA_MODELS的系统环境变量(或用户环境变量,建议设置成系统的),其值为你的模型文件夹的完整地址,如 F:\OllamaModels。同时, Ollama 客户端中也要保持相同设置

验证环境变量:

PowerShell
echo $env:OLLAMA_MODELS

若输出类似以下内容则说明环境变量已生效:

PowerShell
Windows PowerShell
版权所有(C) Microsoft Corporation。保留所有权利。
安装最新的 PowerShell,了解新功能和改进!https://aka.ms/PSWindows
PS C:\Users\Admin> echo $env:OLLAMA_MODELS
F:\OllamaModels

调用 NVIDIA GPU

添加名为OLLAMA_GPU_LAYER的系统环境变量,变量值为cuda。如果需要指定特定的 GPU ,可以添加名为CUDA_VISIBLE_DEVICES的环境变量,变量值为GPU的UUID

查看GPU的UUID

PowerShell
nvidia-smi -L

输出示例:

PowerShell
Windows PowerShell
版权所有(C) Microsoft Corporation。保留所有权利。
安装最新的 PowerShell,了解新功能和改进!https://aka.ms/PSWindows
PS C:\Users\Admin> nvidia-smi -L
GPU 0: GPU 型号 (UUID: GPU-6d7f66be-9e21-dcc8-5d5f-befea4a0eb87)

其中的GPU-6d7f66be-9e21-dcc8-5d5f-befea4a0eb87即为GPU的UUID

查看环境变量是否生效:

PowerShell
echo $env:OLLAMA_GPU_LAYER
PowerShell
echo $env:CUDA_VISIBLE_DEVICES

若无输出,请检查添加环境变量时是否复制了额外的空格,或者尝试重启终端或系统

下载本地模型#

访问 Ollama 模型页面 https://ollama.com/library,选择你需要的模型

下面以 deepseek-r1:8b 模型为例(https://ollama.com/library/deepseek-r1

首先,在 Windows 终端 执行以下指令查看 Ollama 是否安装成功

PowerShell
ollama

如果您的终端输出类似以下的内容,则说明 Ollama 安装成功

PowerShell
Windows PowerShell
版权所有(C) Microsoft Corporation。保留所有权利。
安装最新的 PowerShell,了解新功能和改进!https://aka.ms/PSWindows
PS C:\Users\Admin> ollama
Usage:
ollama [flags]
ollama [command]
Available Commands:
serve Start ollama
create Create a model
show Show information for a model
run Run a model
stop Stop a running model
pull Pull a model from a registry
push Push a model to a registry
signin Sign in to ollama.com
signout Sign out from ollama.com
list List models
ps List running models
cp Copy a model
rm Remove a model
launch Launch an integration with Ollama
help Help about any command
Flags:
-h, --help help for ollama
-v, --version Show version information
Use "ollama [command] --help" for more information about a command.

执行以下命令下载deepseek-r1:8b模型文件

PowerShell
ollama pull deepseek-r1:8b

如果您执行的命令是

PowerShell
ollama run deepseek-r1:8b

这会在下载完成后直接运行对应的模型,不推荐首次下载时执行此命令

当你看到终端中输出success时则表示模型下载完成,这时候就可以安全地关闭终端了

PowerShell
Windows PowerShell
版权所有(C) Microsoft Corporation。保留所有权利。
安装最新的 PowerShell,了解新功能和改进!https://aka.ms/PSWindows
PS C:\Users\Admin> ollama pull deepseek-r1:8b
pulling manifest
pulling e6a7edc1a4d7: 100% ▕██████████████████████████████████▏ 5.2 GB
pulling c5ad996bda6e: 100% ▕██████████████████████████████████▏ 556 B
pulling 6e4c38e1172f: 100% ▕██████████████████████████████████▏ 1.1 KB
pulling ed8474dc73db: 100% ▕██████████████████████████████████▏ 179 B
pulling f64cd5418e4b: 100% ▕██████████████████████████████████▏ 487 B
verifying sha256 digest
writing manifest
success

启动Ollama服务#

方法一:

直接启动 Ollama 客户端,并保持其后台运行

或者通过命令行启动 Ollama 客户端

PowerShell
& "ollama app.exe"

若 Ollama 正确安装,您应该会看到弹出的 Ollama 客户端窗口,您可以安全地关闭终端

方法二:

启动 Ollama 服务

PowerShell
ollama serve

若您看到大量输出,则表明 Ollama 服务成功启动,您不得关闭此终端窗口,在输出中找到OLLAMA_MODELS:F:\\OllamaModels(示例内容)这一条,这表明 Ollama 的模型位置已成功更改

Ollama 默认监听本地网络的11434端口,访问http://127.0.0.1:11434,您应该看到Ollama is running的字样

Windows 安全中心弹出的类似是否要允许此应用在公用和专用网络上进行通信?的窗口中选择允许(仅首次启用时需要)

配置Continue插件#

由于 Continue 插件默认显示的位置为 VSCode 的主侧边栏,建议将 Continue 显示的位置移动到 GitHub Copilot 所在的位置(辅助侧边栏)

将 Continue 插件显示的位置移动到辅助侧边栏后,接下来进行对 Continue 的配置

打开config.yaml配置文件(文件位置:“C:\Users\your user name\.continue\config.yaml”

1、点击设置图标 2、点击配置图标 3、点击设置图标

这样三步下来,即可打开config.yaml配置文件

初始config.yaml配置文件如下所示:

name: Local Config
version: 1.0.0
schema: v1
models: []
NOTE

不同模型具体的配置方式请参考Continue 官方页面

根据已下载的deepseek-r1:8b模型,需要对config.yaml文件进行更改:(官方文档

name: Local Config
version: 1.0.0
schema: v1
models:
- name: DeepSeek-R1:8B
provider: ollama
model: deepseek-r1:8b
apiBase: http://localhost:11434
roles:
- apply
- autocomplete
- chat
- edit

如果你有多个模型,可以按此格式继续添加配置:

name: Local Config
version: 1.0.0
schema: v1
models:
- name: DeepSeek-R1:8B
provider: ollama
model: deepseek-r1:8b
apiBase: http://localhost:11434
roles:
- apply
- autocomplete
- chat
- edit
- name: Qwen2.5 Coder:7B
provider: ollama
model: qwen2.5-coder:7b
apiBase: http://localhost:11434
roles:
- apply
- autocomplete
- chat
- edit

如果你觉得手动添加比较麻烦,也可以让 Continue 自动检测已下载的模型:

name: Local Config
version: 1.0.0
schema: v1
models:
- name: Autodetect
provider: ollama
model: AUTODETECT
NOTE

恭喜!你现在可以在 VSCode 内使用本地模型了!当然,如果你有诸如 DeepSeek、ChatGPT、Gemini 或 Ollama 之类的 API 密钥的话,你也可以使用在线的模型,配置方式这里不再赘述,详见 Ollama 和 Continue 的官方文档。如果你只需运行本地模型的话,那你无需在此期间注册任何账号,请忽略 Ollama 和 Continue 内登录的提示。值得注意的是,由于模型参数量设备算力的差异,你在本地运行的模型在使用体验上可能不如在线模型

模型联网#

首先在 Ollama 客户端中打开Expose Ollama to the network选项 Windows 安全中心弹出的类似是否要允许此应用在公用和专用网络上进行通信?的窗口中选择允许(仅首次启用时需要)

CAUTION

请勿关闭 Windows 防火墙,以免您的设备受到不必要的网络安全威胁

对于支持的模型,在 Continue 中选择PlanAgent模式,实测Chat模式无网络访问权限

TIP

如果你需要单独将网页链接复制进对话框,请去掉https://http://后再手动补全,否则复制进去的是对应页面的标题(🤔真奇怪)

VSCode 本地 AI 指南
https://auspiceshirley.dev/posts/vscode-local-ai/
作者
Shirley Auspice
发布于
2026-01-30
许可协议
CC BY-NC-SA 4.0