零基础玩转Pytorch：数据可视化与模型评估技巧

数据可视化与模型评估：Pytorch入门进阶必备技能¶

为什么要学数据可视化和模型评估？¶

在Pytorch学习中，模型的效果往往需要通过数据可视化来直观理解，而模型评估则是检验模型好坏的关键。无论是检查数据是否合理、排查训练异常，还是分析模型在不同场景下的表现，这些技能都能帮你快速定位问题、优化模型。

一、数据可视化：揭开数据的“真面目”¶

1. 为什么可视化数据？¶

理解数据分布：比如图像数据的像素范围、数值数据的分布规律。
发现异常值：如果数据中出现奇怪的样本或数值，可视化能快速暴露问题。
验证数据处理：比如归一化后的数据是否符合预期。

2. Pytorch中常用可视化工具¶

Matplotlib：Python基础可视化库，适合快速绘制图像、统计图表。
TensorBoard：Pytorch官方推荐工具，专注于训练过程中的动态可视化（如损失曲线、模型结构）。

3. Matplotlib实战：从图像到统计¶

安装依赖：

pip install matplotlib torchvision  # torchvision用于加载经典数据集

示例1：可视化MNIST数据集样本

import matplotlib.pyplot as plt
from torchvision import datasets, transforms

# 加载MNIST数据集（手写数字0-9）
transform = transforms.Compose([transforms.ToTensor()])
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)

# 取前5张图像和标签
images, labels = next(iter(train_dataset))
plt.figure(figsize=(10, 2))
for i in range(5):
    img = images[i].squeeze().numpy()  # 去掉batch和channel维度
    plt.subplot(1, 5, i+1)
    plt.imshow(img, cmap='gray')  # 灰度图显示
    plt.title(f"Label: {labels[i].item()}")
    plt.axis('off')  # 隐藏坐标轴
plt.show()

示例2：数据分布直方图

# 统计训练集标签分布
import numpy as np
labels_np = np.array([data[1] for data in train_dataset])
plt.figure(figsize=(8, 4))
plt.hist(labels_np, bins=10, edgecolor='black')
plt.xlabel('Digit')
plt.ylabel('Count')
plt.title('MNIST Label Distribution')
plt.show()

4. TensorBoard：训练过程的“监控大屏”¶

安装TensorBoard：

pip install tensorboard

核心功能：
- 可视化标量（如损失、准确率）随训练步数变化。
- 展示模型输入图像、计算图结构。

示例：训练过程可视化

from torch.utils.tensorboard import SummaryWriter
import torch
import time

# 初始化日志记录器
writer = SummaryWriter(log_dir=f"runs/demo_{time.strftime('%Y%m%d_%H%M%S')}")

# 模拟训练循环（以简单线性回归为例）
model = torch.nn.Linear(1, 1)  # 输入1维，输出1维
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
criterion = torch.nn.MSELoss()

for epoch in range(100):
    # 生成模拟数据：y = 2x + 3 + 噪声
    x = torch.randn(100, 1) * 5  # 输入数据
    y = 2 * x + 3 + torch.randn(100, 1) * 0.5  # 真实标签+噪声
    optimizer.zero_grad()
    y_pred = model(x)
    loss = criterion(y_pred, y)
    loss.backward()
    optimizer.step()

    # 记录标量：训练损失、验证损失（假设验证损失为loss*0.9）
    writer.add_scalar('Train Loss', loss.item(), epoch)
    writer.add_scalar('Val Loss', loss.item() * 0.9, epoch)

# 可视化模型结构（需提前定义模型输入）
writer.add_graph(model, torch.randn(1, 1))  # 输入1个样本，维度1
writer.close()

启动TensorBoard：
运行命令行：tensorboard --logdir=runs，打开浏览器访问http://localhost:6006，即可查看损失曲线和模型结构。

二、模型评估：量化模型的“真实水平”¶

1. 分类任务的核心指标¶

准确率（Accuracy）：正确预测的样本占比。
混淆矩阵（Confusion Matrix）：展示每个类别的预测情况（TP/FP/TN/FN）。
精确率（Precision）/召回率（Recall）：针对特定类别（如“识别数字8”的效果）。

2. 回归任务的核心指标¶

均方误差（MSE）：预测值与真实值差的平方均值。
平均绝对误差（MAE）：预测值与真实值差的绝对值均值。

3. Pytorch实现示例：评估MNIST分类模型¶

假设已训练好一个简单CNN模型，以下是评估代码：

import torch
from sklearn.metrics import confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt

# 1. 加载测试集数据
test_dataset = datasets.MNIST(root='./data', train=False, transform=transforms.ToTensor())
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=100, shuffle=False)

# 2. 模型推理（获取所有预测和标签）
model.eval()  # 关闭Dropout等训练特有操作
all_preds = []
all_labels = []
with torch.no_grad():  # 禁用梯度计算，节省内存
    for images, labels in test_loader:
        outputs = model(images)
        preds = torch.argmax(outputs, dim=1)  # 取概率最大的类别
        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(labels.numpy())

# 3. 计算准确率
correct = sum(np.array(all_preds) == np.array(all_labels))
accuracy = correct / len(all_labels)
print(f"Test Accuracy: {accuracy:.4f}")

# 4. 可视化混淆矩阵
cm = confusion_matrix(all_labels, all_preds)
plt.figure(figsize=(10, 8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=range(10), yticklabels=range(10))
plt.xlabel('Predicted Label')
plt.ylabel('True Label')
plt.title('Confusion Matrix')
plt.show()

三、实战总结：从数据到模型的闭环¶

数据可视化：先用Matplotlib观察数据分布，再用TensorBoard监控训练过程。
模型评估：分类任务用准确率+混淆矩阵，回归任务用MSE+MAE。
迭代优化：发现混淆矩阵中“8”和“9”易混淆时，可调整数据增强或模型复杂度。

进阶方向¶

高级可视化：用TensorBoard的add_image可视化模型生成的图像（如GAN生成的假图）。
动态评估：用torchmetrics库实时计算精确率、F1分数等指标。
可视化工具对比：Matplotlib适合灵活绘图，TensorBoard适合训练过程监控。

掌握这些技能后，你将能更高效地调试模型、理解数据，为后续构建复杂模型打下基础。动手实践时，记得多尝试不同参数和可视化组合，逐步培养对模型的“直觉”！