2022-02-23 model:biobert-ubuntu18.04-cuda11.1.1-cudnn8-python3.8-pytorch1.8.0-new
模型介绍:将自然语言处理技术的进步直接应用到生物医学文本挖掘中,往往会因为词汇分布从一般领域语料库向生物医学语料库的转移而产生不理想的结果。在本文中,我们研究了最近引入的预训练语言模型BERT如何适用于生物医学语料库。我们引入了BioBERT(来自transformer for Biomedical Text Mining的双向编码器表示),这是一个在大规模生物医学语料库上预先训练的领域特定语言表示模型。 论文题目:《BioBERT: a pre-trained biomedical language representation model for biomedical text mining》 论文地址:https://arxiv.org/ftp/arxiv/papers/1901/1901.08746.pdf
进入终端,在root/biobert(默认)路径下,输入以下任意命令:
cd named-entity-recognition
bash NER.sh # 该文件调用的是NER数据集
cd question-answering
bash QA.sh # 该文件调用的是NER数据集
cd relation-extraction
bash RE.sh # 该文件调用的是NER数据集
# 运行以上脚本自动执行训练和测试步骤,如需可修改代码分步运行