我们已经为您准备好复现该模型所需的环境,您可以创建实例、一键复用哦!

模型的使用文档涵盖模型所需环境、模型简介以及复现模型的具体步骤。模型效果和模型详细来源可以点击论文地址和模型来源链接查看哦~

BioBERT

2022-02-23 model:biobert-ubuntu18.04-cuda11.1.1-cudnn8-python3.8-pytorch1.8.0-new

模型标签
命名实体识别序列标注智能客服

模型简介

模型介绍:将自然语言处理技术的进步直接应用到生物医学文本挖掘中,往往会因为词汇分布从一般领域语料库向生物医学语料库的转移而产生不理想的结果。在本文中,我们研究了最近引入的预训练语言模型BERT如何适用于生物医学语料库。我们引入了BioBERT(来自transformer for Biomedical Text Mining的双向编码器表示),这是一个在大规模生物医学语料库上预先训练的领域特定语言表示模型。 论文题目:《BioBERT: a pre-trained biomedical language representation model for biomedical text mining》 论文地址:https://arxiv.org/ftp/arxiv/papers/1901/1901.08746.pdf



1. 使用方法

1.1. 模型训练

进入终端,在root/biobert(默认)路径下,输入以下任意命令:

cd named-entity-recognition
bash NER.sh # 该文件调用的是NER数据集
cd question-answering
bash QA.sh # 该文件调用的是NER数据集
cd relation-extraction
bash RE.sh # 该文件调用的是NER数据集
# 运行以上脚本自动执行训练和测试步骤,如需可修改代码分步运行

2. 模型来源

https://github.com/dmis-lab/biobert-pytorch