我们已经为您准备好复现该模型所需的环境,您可以创建实例、一键复用哦!

模型的使用文档涵盖模型所需环境、模型简介以及复现模型的具体步骤。模型效果和模型详细来源可以点击论文地址和模型来源链接查看哦~

ResNet(Torchvision)

2022-09-01 model:torchvision-ubuntu20.04-cuda11.1-cudnn8-python3.8-pytorch1.9.1-new

模型标签
智慧交通/自动驾驶OCR(光学字符识别)语义分割实例分割

模型简介

在本文中提出了一个残差学习框架,以简化比以前使用的网络更深的网络的训练。我们明确地将层重新定义为参考层输入的学习残差函数,而不是学习未参考的函数。我们提供了全面的经验证据,表明这些残差网络更容易优化,并且可以从显着增加的深度中获得准确性。在 ImageNet 数据集上,我们评估深度高达 152 层的残差网络——比 VGG 网络深 8 倍,但仍然具有较低的复杂度。这些残差网络的集合在 ImageNet 测试集上实现了 3.57% 的误​​差。该结果在 ILSVRC 2015 分类任务中获得第一名。我们还对具有 100 层和 1000 层的 CIFAR-10 进行了分析。表示的深度对于许多视觉识别任务至关重要。 论文地址:https://arxiv.org/abs/1512.03385v1


1. 使用方法

1.1. 预训练模型推断

进入终端中,在root/vision/references/classification(默认)路径下,输入:

python train.py --model resnet50 --test-only --pretrained
# model后的参数可按需指定resnet18, resnet34, resnet50, resnet101 或 resnet152

1.2. 模型训练

进入终端中,在root/vision/references/classification(默认)路径下,输入:

python train.py --model resnet50
# model后的参数可按需指定resnet18, resnet34, resnet50, resnet101 或 resnet152

2. 模型来源

https://github.com/pytorch/vision/tree/main/references/classification