我们已经为您准备好复现该模型所需的环境,您可以创建实例、一键复用哦!

模型的使用文档涵盖模型所需环境、模型简介以及复现模型的具体步骤。模型效果和模型详细来源可以点击论文地址和模型来源链接查看哦~

GRU

2022-02-22 model:gru-ubuntu18.04-cuda11.1.1-cudnn8-python3.8-pytorch1.8.0-new

模型标签
图像分类

模型简介

模型介绍:GRU(Gate Recurrent Unit)是循环神经网络(Recurrent Neural Network, RNN)的一种,和LSTM一样,也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。GRU是LSTM网络的一种效果很好的变体,它较LSTM网络的结构更加简单,而且效果也很好,因此也是当前非常流形的一种网络。GRU既然是LSTM的变体,因此也是可以解决RNN网络中的长依赖问题。论文地址:https://arxiv.org/pdf/1406.1078.pdf


  1. 使用方法

  2. 模型来源


1. 使用方法

1.1. 环境配置

在终端,在root/GRU(默认)路径下,运行以下命令:

cd ../..
# 进入根目录
cp -r /datasets/MNIST ../../user-data
# 将复现所需的公开数据集复制到指定文件夹下
cp -r modelsets/model_GRU ../../user-data
# 将复现所需的预训练权重文件复制到指定文件夹下

1.2. 模型推断

在终端,进入root/GRU(默认)路径下,运行以下命令:

python interface.py

1.3. 模型训练

在终端,进入root/GRU(默认)路径下,运行以下命令:

python train.py

1.4. 模型测试

在终端,进入root/GRU(默认)路径下,运行以下命令:

python test.py

2. 模型来源

https://github.com/DLHacks/SRU