【折腾笔记】RTX 5070 Ti 搭建 WSL2 深度学习环境

发布时间： 2026-01-26
分类： 开发环境 / 深度学习 / 运维

前言

先前入手了 NVIDIA RTX 5070 Ti 。作为 Blackwell 架构的新显卡，除了游戏性能提升，拿来做 AI 推理和训练也是个不错的选择。

为了在 Windows 下兼顾日常使用和开发体验，避免频繁重启切双系统，我决定基于 Windows 11 + WSL2 (Ubuntu 22.04) 搭建一套远程开发环境。本文主要记录在配置 WSL2 镜像网络模式时遇到的网络连通性问题，以及新架构显卡在 PyTorch 中的适配方案。

一、WSL2 网络配置：解决镜像模式下的连通性问题

为了让 WSL2 获得独立的局域网体验并更好支持 IPv6，我在配置中启用了 镜像网络模式 (Mirrored Networking)。

1.1 配置文件修改

在用户目录下的 .wslconfig 文件中添加如下配置：

[wsl2]
networkingMode=mirrored
firewall=true
autoMemoryReclaim=gradual

1.2 遇到的问题

配置生效后，出现了一个比较隐蔽的现象：

ping 外网 IP 正常（ICMP 协议通畅）。
执行 curl 或 apt update 时全部超时（TCP 握手失败）。

排查后发现，这是由于镜像模式下，容器流量回环经过宿主机网关时，被 Windows 底层的防火墙策略拦截了。

1.3 解决方法

需要在 WSL 的设置中（或通过配置文件）显式开启 “主机地址回环 (Host Address Loopback)” 功能。开启后，流量路由恢复正常，apt 下载速度也能跑满带宽。

二、远程开发：SSH 服务配置与安全

为了配合 VSCode Remote 进行远程开发，同时保证内网安全，对 SSH 服务做了一些调整。

2.1 端口与权限

由于 Windows 自带的 OpenSSH 服务通常占用 22 端口，为了避免冲突，我们将 WSL2 的 SSH 迁移至 2222 端口。

修改 /etc/ssh/sshd_config：

Port 2222
# 禁用密码登录，防止暴力破解
PasswordAuthentication no
# 仅允许密钥登录
PubkeyAuthentication yes

2.2 内网穿透与免密直连

为了在外部网络也能访问，配合 Cloudflare Tunnel（或其他内网穿透工具）将内网的 TCP:2222 映射到公网。同时配置本地 SSH Config 的 ProxyCommand，实现了 VSCode 的无感直连。这种方式不需要暴露公网 IP，相比直接端口映射要安全得多。

三、深度学习环境：Blackwell 架构适配

这是本次部署最关键的部分。RTX 5070 Ti 基于 NVIDIA 最新的 Blackwell 架构，其 Compute Capability（计算能力）版本号为 sm_120。

3.1 兼容性问题

在部署初期，我尝试使用 PyTorch 2.6 (CUDA 12.4) 运行检查脚本，会收到 sm_120 is not compatible 的警告。此时显卡虽然能跑，但实际上是处于驱动层 PTX JIT（即时编译）的兼容模式下运行，效率并非最佳。

好在 PyTorch 2.10.0 与 CUDA 12.8 已经发布，官方正式支持了 Blackwell 架构。

3.2 安装建议

为了确保能够调用原生指令集，建议跳过可能存在索引延迟的国内镜像源，直接指定官方源安装适配 CUDA 12.8 的版本：

# 建议在 Miniconda 虚拟环境中执行
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

3.3 验证结果

升级后运行环境检查脚本，兼容性警告消失，系统正确识别并调用 sm_120。

Python 版本: 3.10.19
PyTorch 版本: 2.10.0+cu128
CUDA 可用性: True
硬件识别: NVIDIA GeForce RTX 5070 Ti
测试结论: GPU 张量矩阵乘法测试成功，原生算子调用正常。

总结

通过 5070 Ti 配合 WSL2，这套方案目前在稳定性和性能释放上都达到了预期。

网络方面： 镜像模式 + 主机地址回环，解决了 WSL2 长期以来的网络割裂痛点。
开发体验： SSH 密钥认证配合穿透工具，实现了安全且低延迟的远程开发。
算力支持： 随着 PyTorch 2.10 + CUDA 12.8 的跟进，新架构显卡已经可以跑在原生模式下。

对于手持 50 系显卡的开发者，建议及时更新驱动和软件栈，避免长期运行在兼容模式下浪费硬件性能。