我们已经为您准备好复现该模型所需的环境,您可以创建实例、一键复用哦!

模型的使用文档涵盖模型所需环境、模型简介以及复现模型的具体步骤。模型效果和模型详细来源可以点击论文地址和模型来源链接查看哦~

megan

2022-02-08 megan:ubuntu18.04-cuda10.1-cudnn7-python3.6-pytorch1.4.0

模型标签
文本分类文本匹配文本生成文本摘要

模型简介

模型论文2021年5月发表在JCIM上的关于逆合成路线规划一篇文章,标题为《Molecule Edit Graph Attention Network:Modeling Chemical Reactions as Sequences of Graph Edits》,本文提出了分子编辑图注意网络(MEGAN),是一个端到端编码器-解码器神经模型。由于大部分的逆合成实验都是基于数据集USPTO50k以及USPTO-full进行的实验。为了使MEGAN能够有效地探索合理的化学反应的空间,本文使用的模型在逆合成预测(预测给定化学反应产物的底物)中扩展到大型数据集(USPTO-mit),可以保持以端到端方式建模的灵活性,并在标准基准中实现较高的准确性。论文地址:https://arxiv.org/pdf/2006.15426v2.pdf



1. 使用方法

1.1. 准备数据集

进入终端,在根目录路下,运行以下命令:

cp -r datasets/uspto_50k ../../root/megan/data
# 将公开数据集复制到指定文件夹下
source env.sh
source activate
# 编辑env.sh文件使其适合配置环境
python bin/acquire.py uspto_50k 
python bin/featurize.py uspto_50k megan_16_bfs_randat
# 将数据集分割成train/val/test 并整理成复现所需的数据格式

1.2. 模型训练

python bin/featurize.py uspto_50k megan_16_bfs_randat
参数 说明
uspto_50k 指定的数据集名称
megan16bfs_randat 指定图编辑的方式

1.3. 模型评估

python bin/eval.py models/uspto_50k --beam-size 50 --show-every 100
参数 说明
models/uspto_50k 指定模型来源
beam-size 指定束搜索大小
show-every 指定打印频率

2. 模型来源

https://github.com/molecule-one/megan