ArtichoKaleyard
发布于 2026-01-26 / 57 阅读
3

【折腾笔记】RTX 5070 Ti 搭建 WSL2 深度学习环境

发布时间: 2026-01-26
分类: 开发环境 / 深度学习 / 运维


前言

先前入手了 NVIDIA RTX 5070 Ti 。作为 Blackwell 架构的新显卡,除了游戏性能提升,拿来做 AI 推理和训练也是个不错的选择。

为了在 Windows 下兼顾日常使用和开发体验,避免频繁重启切双系统,我决定基于 Windows 11 + WSL2 (Ubuntu 22.04) 搭建一套远程开发环境。本文主要记录在配置 WSL2 镜像网络模式时遇到的网络连通性问题,以及新架构显卡在 PyTorch 中的适配方案。


一、WSL2 网络配置:解决镜像模式下的连通性问题

为了让 WSL2 获得独立的局域网体验并更好支持 IPv6,我在配置中启用了 镜像网络模式 (Mirrored Networking)

1.1 配置文件修改

在用户目录下的 .wslconfig 文件中添加如下配置:

[wsl2]
networkingMode=mirrored
firewall=true
autoMemoryReclaim=gradual

1.2 遇到的问题

配置生效后,出现了一个比较隐蔽的现象:

  • ping 外网 IP 正常(ICMP 协议通畅)。
  • 执行 curlapt update 时全部超时(TCP 握手失败)。

排查后发现,这是由于镜像模式下,容器流量回环经过宿主机网关时,被 Windows 底层的防火墙策略拦截了。

1.3 解决方法

需要在 WSL 的设置中(或通过配置文件)显式开启 “主机地址回环 (Host Address Loopback)” 功能。开启后,流量路由恢复正常,apt 下载速度也能跑满带宽。


二、远程开发:SSH 服务配置与安全

为了配合 VSCode Remote 进行远程开发,同时保证内网安全,对 SSH 服务做了一些调整。

2.1 端口与权限

由于 Windows 自带的 OpenSSH 服务通常占用 22 端口,为了避免冲突,我们将 WSL2 的 SSH 迁移至 2222 端口。

修改 /etc/ssh/sshd_config

Port 2222
# 禁用密码登录,防止暴力破解
PasswordAuthentication no
# 仅允许密钥登录
PubkeyAuthentication yes

2.2 内网穿透与免密直连

为了在外部网络也能访问,配合 Cloudflare Tunnel(或其他内网穿透工具)将内网的 TCP:2222 映射到公网。同时配置本地 SSH Config 的 ProxyCommand,实现了 VSCode 的无感直连。这种方式不需要暴露公网 IP,相比直接端口映射要安全得多。


三、深度学习环境:Blackwell 架构适配

这是本次部署最关键的部分。RTX 5070 Ti 基于 NVIDIA 最新的 Blackwell 架构,其 Compute Capability(计算能力)版本号为 sm_120

3.1 兼容性问题

在部署初期,我尝试使用 PyTorch 2.6 (CUDA 12.4) 运行检查脚本,会收到 sm_120 is not compatible 的警告。此时显卡虽然能跑,但实际上是处于驱动层 PTX JIT(即时编译)的兼容模式下运行,效率并非最佳。

好在 PyTorch 2.10.0CUDA 12.8 已经发布,官方正式支持了 Blackwell 架构。

3.2 安装建议

为了确保能够调用原生指令集,建议跳过可能存在索引延迟的国内镜像源,直接指定官方源安装适配 CUDA 12.8 的版本:

# 建议在 Miniconda 虚拟环境中执行
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

3.3 验证结果

升级后运行环境检查脚本,兼容性警告消失,系统正确识别并调用 sm_120

Python 版本: 3.10.19
PyTorch 版本: 2.10.0+cu128
CUDA 可用性: True
硬件识别: NVIDIA GeForce RTX 5070 Ti
测试结论: GPU 张量矩阵乘法测试成功,原生算子调用正常。

总结

通过 5070 Ti 配合 WSL2,这套方案目前在稳定性和性能释放上都达到了预期。

  1. 网络方面: 镜像模式 + 主机地址回环,解决了 WSL2 长期以来的网络割裂痛点。
  2. 开发体验: SSH 密钥认证配合穿透工具,实现了安全且低延迟的远程开发。
  3. 算力支持: 随着 PyTorch 2.10 + CUDA 12.8 的跟进,新架构显卡已经可以跑在原生模式下。

对于手持 50 系显卡的开发者,建议及时更新驱动和软件栈,避免长期运行在兼容模式下浪费硬件性能。