Python深度学习训练小样本分类模型的增广策略解析【教学】

admin 百科 2025-12-20 13

小样本数据增广的核心是“变准”而非“变多”，需围绕判别性特征做可控扰动，保留关键结构、抑制背景干扰，并结合领域感知的几何与色彩组合增广、自监督伪标签及严格验证策略。

Python深度学习训练小样本分类模型的增广策略解析【教学】-第1张图片-佛山资讯网

训练集只有几十或几百张图时，简单堆叠随机旋转、翻转往往无效，甚至引入噪声。真正有效的增广，是围绕类别判别性特征做可控扰动：保留关键纹理、边缘、局部结构，抑制无关背景干扰。比如医学细胞图像，要保细胞核形态不变；花卉识别则需稳定花瓣轮廓与色块分布。

不建议直接套用 torchvision 的默认 RandomAugment。应分步设计：

几何层面：限制旋转角度（±10°内），禁用大幅缩放（避免失真），启用弹性形变（适用于组织切片、手写字符等有连续形变合理性的场景）
色彩层面：关闭全局亮度/对比度抖动，改用 HSV 空间微调——仅在 S（饱和度）和 V（明度）通道施加 ±0.05 范围扰动，H（色相）保持固定（防止苹果变橙子）
叠加方式：用 Albumentations 的 Compose(..., p=1.0) 强制每轮必应用一组协同变换，而非多个独立随机操作