我们已经为您准备好复现该模型所需的环境,您可以创建实例、一键复用哦!

模型的使用文档涵盖模型所需环境、模型简介以及复现模型的具体步骤。模型效果和模型详细来源可以点击论文地址和模型来源链接查看哦~

SRU

2022-02-22 model:sru-ubuntu18.04-cuda11.1.1-cudnn8-python3.8-pytorch1.8.0-new

模型标签
图像分类

模型简介

RNN模型在机器翻译,语言模型,问答系统中取得了非凡的成就,由于RNN的结构,当前的层输入为前一层的输出,所有RNN比较适合时间序列问题,但也正是由于这种串行结构,限制了RNN模型的训练速度,与CNN相比,RNN并不能进行并行化处理。而SRU网络结构的提出就是为了解决这个问题,SRU(simple recurrent units)将大部分运算放到进行并行处理,只是将有具有小量运算的步骤进行串行。论文地址:https://arxiv.org/pdf/1709.02755.pdf


  1. 使用方法

  2. 模型来源


1. 使用方法

1.1. 环境配置

在终端,在root/SRU(默认)路径下,运行以下命令:

cd ../..
# 进入根目录
cp -r /datasets/MNIST ../../user-data
# 将复现所需的公开数据集复制到指定文件夹下
cp -r modelsets/model_SRU ../../user-data
# 将复现所需的预训练权重文件复制到指定文件夹下

1.2. 模型推断

在终端,进入root/SRU(默认)路径下,运行以下命令:

python interface.py

1.3. 模型训练

在终端,进入root/SRU(默认)路径下,运行以下命令:

python train.py

1.4. 模型测试

在终端,进入root/SRU(默认)路径下,运行以下命令:

python test.py

2. 模型来源

https://github.com/DLHacks/SRU