我们已经为您准备好复现该模型所需的环境,您可以创建实例、一键复用哦!

模型的使用文档涵盖模型所需环境、模型简介以及复现模型的具体步骤。模型效果和模型详细来源可以点击论文地址和模型来源链接查看哦~

Transformer

2022-03-10 model:transformer-ubuntu18.04-cuda11.1.1-cudnn8-python3.8-tensorflow2.4.1-new

模型标签
文本分类

Transformer出自于Google于2017年发表的论文《Attention is all you need》,最开始是用于机器翻译,并且取得了非常好的效果。但是自提出以来,Transformer不仅仅在NLP领域大放异彩,并且在CV、RS等领域也取得了非常不错的表现。论文地址:https://arxiv.org/abs/1706.03762


  1. 使用方法

  2. 模型来源


1. 使用方法

1.1. 准备数据集

我们将使用到Portugese-English翻译数据集。该数据集包含大约50000个训练样例,1100个验证示例和2000个测试示例。平台以大家准备好此数据集,运行命令时会自动调用该数据集。

1.2. 模型推断

进入终端,在 root/Transformer(默认)路径下,运行以下命令:

python interface.py

1.3. 模型训练

进入终端,在 root/Transformer(默认)路径下,运行以下命令:

python train.py
# 训练好的模型将保存在user-data/model_Transform下的train文件夹中

1.4. 模型测试

进入终端,在 root/Transformer(默认)路径下,运行以下命令:

python test.py

2. 模型来源

https://github.com/czy36mengfei/tensorflow2_tutorials_chinese