VSCode 本地 AI 指南 - Shirley Auspice's Blog

NOTE
本文将向你介绍如何使用 Ollama 和 Continue 插件在 VSCode 内使用本地AI模型，以达到保护隐私，维护数据安全的目的（以 Windows 11 25H2 专业版 和受支持的NVIDIA GPU为例，AMD GPU暂不讨论）
如果您决定本地部署AI模型，那么我默认您对 Windows 操作系统有基础的认知，比如命令行、软件安装、防火墙等，同时我也默认您会使用 VSCode 的基础功能
本文中Windows 终端均使用PowerShell

TIP
本文使用 AI 辅助编写

软件、扩展下载与安装#

NVIDIA 相关#

NOTE
前提：您的设备安装有 NVIDIA GPU 且 GPU 受支持

Ollama 支持计算能力为 5.0 及以上且驱动版本为 531 或更新版本的 NVIDIA GPU

Visual Studio Code#

TIP
VSCode 是目前最流行、社区最活跃的免费、轻量开源编辑器之一。虽然它本身只是一个“文本编辑器”，但通过丰富的插件生态，它可以变成一个功能强大的 IDE，几乎能胜任所有语言的开发任务。

microsoft

vscode

Waiting for api.github.com...

00K

Waiting...

下载链接：https://code.visualstudio.com/Download

对于 Windows 用户，我推荐您下载图中红色箭头所指的System Installer版本

Continue#

此方法不推荐使用（点击展开）

TIP
Continue 是一款开源的AI编程助手插件，能将 DeepSeek、ChatGPT、Claude 及 Gemini 等主流模型直接集成到编辑器内。它通过聊天、代码自动补全、解释、调试和重构等功能，在编写时提供智能辅助，支持本地部署，可完全免费使用。

continuedev

continue

Waiting for api.github.com...

00K

Waiting...

安装 Continue

1、通过 Visual Studio Marketplace

访问链接 Continue - open-source AI code agent

点击 Install

在弹出的窗口中点击打开即可自动打开 VSCode 内的 Continue 扩展页面（前提是已安装 VSCode）

点击安装即可

2、或者，你也可以直接在 VSCode 的扩展活动栏中搜索 Continue 然后完成安装

Ollama#

TIP
Ollama 是一个开源的大型语言模型（LLM）平台，旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。Ollama 提供了一个简单的方式来加载和使用各种预训练的语言模型，支持文本生成、翻译、代码编写、问答等多种自然语言处理任务。

ollama

Waiting for api.github.com...

00K

Waiting...

下载链接（官网）：https://ollama.com

IMPORTANT
对于下载的 OllamaSetup.exe 可执行文件，它的默认安装位置是 C盘，为了避免将软件安装到系统主驱动器，可以使用命令行附加参数更改安装位置官方文档

在Windows 终端成功执行以下命令的前提是通过cd命令导航到文件所在位置，或者在文件所在文件夹内单击鼠标右键，点击在终端中打开

1
.\OllamaSetup.exe /DIR="d:\some\location"

将 d:\some\location 更改为您实际的安装位置，比如 D:\Ollama，然后在 Ollama 的安装向导中按照提示进行操作即可将 Ollama 安装到您指定的目录中

更改 Ollama 模型储存位置

根据官方文档，需要设置名为OLLAMA_MODELS的系统环境变量（或用户环境变量，建议设置成系统的），其值为你的模型文件夹的完整地址，如 F:\OllamaModels。同时， Ollama 客户端中也要保持相同设置

验证环境变量：

1
echo $env:OLLAMA_MODELS

若输出类似以下内容则说明环境变量已生效：

1
Windows PowerShell
2
版权所有（C） Microsoft Corporation。保留所有权利。
3

4
安装最新的 PowerShell，了解新功能和改进！https://aka.ms/PSWindows
5

6
PS C:\Users\Admin> echo $env:OLLAMA_MODELS
7
F:\OllamaModels

调用 NVIDIA GPU

添加名为OLLAMA_GPU_LAYER的系统环境变量，变量值为cuda。如果需要指定特定的 GPU ，可以添加名为CUDA_VISIBLE_DEVICES的环境变量，变量值为GPU的UUID

查看GPU的UUID：

1
nvidia-smi -L

输出示例：

1
Windows PowerShell
2
版权所有（C） Microsoft Corporation。保留所有权利。
3

4
安装最新的 PowerShell，了解新功能和改进！https://aka.ms/PSWindows
5

6
PS C:\Users\Admin> nvidia-smi -L
7
GPU 0: GPU 型号 (UUID: GPU-6d7f66be-9e21-dcc8-5d5f-befea4a0eb87)

其中的GPU-6d7f66be-9e21-dcc8-5d5f-befea4a0eb87即为GPU的UUID

查看环境变量是否生效：

1
echo $env:OLLAMA_GPU_LAYER

1
echo $env:CUDA_VISIBLE_DEVICES

若无输出，请检查添加环境变量时是否复制了额外的空格，或者尝试重启终端或系统

下载本地模型#

访问 Ollama 模型页面 https://ollama.com/library，选择你需要的模型

下面以 deepseek-r1:8b 模型为例（https://ollama.com/library/deepseek-r1）

首先，在 Windows 终端执行以下指令查看 Ollama 是否安装成功

1
ollama

如果您的终端输出类似以下的内容，则说明 Ollama 安装成功

1
Windows PowerShell
2
版权所有（C） Microsoft Corporation。保留所有权利。
3

4
安装最新的 PowerShell，了解新功能和改进！https://aka.ms/PSWindows
5

6
PS C:\Users\Admin> ollama
7
Usage:
8
  ollama [flags]
9
  ollama [command]
10

11
Available Commands:
12
  serve       Start ollama
13
  create      Create a model
14
  show        Show information for a model
15
  run         Run a model
16
  stop        Stop a running model
17
  pull        Pull a model from a registry
18
  push        Push a model to a registry
19
  signin      Sign in to ollama.com
20
  signout     Sign out from ollama.com
21
  list        List models
22
  ps          List running models
23
  cp          Copy a model
24
  rm          Remove a model
25
  launch      Launch an integration with Ollama
26
  help        Help about any command
27

28
Flags:
29
  -h, --help      help for ollama
30
  -v, --version   Show version information
31

32
Use "ollama [command] --help" for more information about a command.

执行以下命令下载deepseek-r1:8b模型文件

1
ollama pull deepseek-r1:8b

如果您执行的命令是

1
ollama run deepseek-r1:8b

这会在下载完成后直接运行对应的模型，不推荐首次下载时执行此命令

当你看到终端中输出success时则表示模型下载完成，这时候就可以安全地关闭终端了

1
Windows PowerShell
2
版权所有（C） Microsoft Corporation。保留所有权利。
3

4
安装最新的 PowerShell，了解新功能和改进！https://aka.ms/PSWindows
5

6
PS C:\Users\Admin> ollama pull deepseek-r1:8b
7
pulling manifest
8
pulling e6a7edc1a4d7: 100% ▕██████████████████████████████████▏ 5.2 GB
9
pulling c5ad996bda6e: 100% ▕██████████████████████████████████▏  556 B
10
pulling 6e4c38e1172f: 100% ▕██████████████████████████████████▏ 1.1 KB
11
pulling ed8474dc73db: 100% ▕██████████████████████████████████▏  179 B
12
pulling f64cd5418e4b: 100% ▕██████████████████████████████████▏  487 B
13
verifying sha256 digest
14
writing manifest
15
success

启动Ollama服务#

方法一：

直接启动 Ollama 客户端，并保持其后台运行

或者通过命令行启动 Ollama 客户端

1
& "ollama app.exe"

若 Ollama 正确安装，您应该会看到弹出的 Ollama 客户端窗口，您可以安全地关闭终端

方法二：

启动 Ollama 服务

1
ollama serve

若您看到大量输出，则表明 Ollama 服务成功启动，您不得关闭此终端窗口，在输出中找到OLLAMA_MODELS:F:\\OllamaModels（示例内容）这一条，这表明 Ollama 的模型位置已成功更改

Ollama 默认监听本地网络的11434端口，访问http://127.0.0.1:11434，您应该看到Ollama is running的字样

在Windows 安全中心弹出的类似是否要允许此应用在公用和专用网络上进行通信？的窗口中选择允许（仅首次启用时需要）

配置Continue插件#

由于 Continue 插件默认显示的位置为 VSCode 的主侧边栏，建议将 Continue 显示的位置移动到 GitHub Copilot 所在的位置（辅助侧边栏）

将 Continue 插件显示的位置移动到辅助侧边栏后，接下来进行对 Continue 的配置

打开config.yaml配置文件（文件位置：“C:\Users\your user name\.continue\config.yaml”

1、点击设置图标 2、点击配置图标 3、点击设置图标

这样三步下来，即可打开config.yaml配置文件

初始config.yaml配置文件如下所示：

1
name: Local Config
2
version: 1.0.0
3
schema: v1
4
models: []

NOTE
不同模型具体的配置方式请参考Continue 官方页面

根据已下载的deepseek-r1:8b模型，需要对config.yaml文件进行更改：（官方文档）

1
name: Local Config
2
version: 1.0.0
3
schema: v1
4
models:
5
  - name: DeepSeek-R1:8B
6
    provider: ollama
7
    model: deepseek-r1:8b
8
    apiBase: http://localhost:11434
9
    roles:
10
      - apply
11
      - autocomplete
12
      - chat
13
      - edit

如果你有多个模型，可以按此格式继续添加配置：

1
name: Local Config
2
version: 1.0.0
3
schema: v1
4
models:
5
  - name: DeepSeek-R1:8B
6
    provider: ollama
7
    model: deepseek-r1:8b
8
    apiBase: http://localhost:11434
9
    roles:
10
      - apply
11
      - autocomplete
12
      - chat
13
      - edit
14
  - name: Qwen2.5 Coder:7B
15
    provider: ollama
16
    model: qwen2.5-coder:7b
17
    apiBase: http://localhost:11434
18
    roles:
19
      - apply
20
      - autocomplete
21
      - chat
22
      - edit

如果你觉得手动添加比较麻烦，也可以让 Continue 自动检测已下载的模型：

1
name: Local Config
2
version: 1.0.0
3
schema: v1
4
models:
5
  - name: Autodetect
6
    provider: ollama
7
    model: AUTODETECT

NOTE
恭喜！你现在可以在 VSCode 内使用本地模型了！当然，如果你有诸如 DeepSeek、ChatGPT、Gemini 或 Ollama 之类的 API 密钥的话，你也可以使用在线的模型，配置方式这里不再赘述，详见 Ollama 和 Continue 的官方文档。如果你只需运行本地模型的话，那你无需在此期间注册任何账号，请忽略 Ollama 和 Continue 内登录的提示。值得注意的是，由于模型参数量和设备算力的差异，你在本地运行的模型在使用体验上可能不如在线模型

模型联网#

首先在 Ollama 客户端中打开Expose Ollama to the network选项在Windows 安全中心弹出的类似是否要允许此应用在公用和专用网络上进行通信？的窗口中选择允许（仅首次启用时需要）

CAUTION
请勿关闭 Windows 防火墙，以免您的设备受到不必要的网络安全威胁

对于支持的模型，在 Continue 中选择Plan或Agent模式，实测Chat模式无网络访问权限

TIP
如果你需要单独将网页链接复制进对话框，请去掉https://或http://后再手动补全，否则复制进去的是对应页面的标题（🤔真奇怪）