韶关学院,广东韶关,512005;
摘要:本文提出一种基于LSTM-CRF模型的中文电子病历命名实体识别方法。该模型通过结合LSTM的序列建模能力和CRF的标签转移优化,有效解决了传统CRF在长距离依赖建模上的局限性。实验表明,该方法在不增加数据开销的情况下显著提升了实体识别性能,F1值达到93.4%,为临床文本分析提供了高效解决方案。
关键词:LSTM-CRF模型;临床命名体识别;电子病历
参考文献
[1]黄志恒,徐伟,余凯.(2015).用于序列标注的双向LSTM-CRF模型.arXiv预印本arXiv:1508.01991.
[2]于勇,司新宇,胡成,张健.(2019).循环神经网络综述:LSTM单元与网络结构.神经计算,31(7),1235–1270.
[3]Pennington,J.,Socher,R.,Manning,C.D.(2014).GloVe:基于全局统计的词向量表示.EMNLP会议论文.
[4]Mikolov,T.,Chen,K.,Corrado,G.,Dean,J.(2013).向量空间中词表示的高效估计.arXiv预印本arXiv:1301.3781.
[5]DeBruijn,B.,Cherry,C.,Kiritchenko,S.,Martin,J.,Zhu,X.(2011).临床信息抽取三阶段的机器学习解决方案:2010年i2b2竞赛技术综述.美国医学信息学会杂志,18(5),557–562.
[6]李彦霖,宋煜,张佳豪,王栋.(2020).FLAT:基于扁平-网格Transformer的中文命名实体识别.ACL2020会议论文集.
[7]邵一鸣,裘旭,黄萱菁.(2019).结合词典增强BERT与两阶段标注的中文命名实体识别.ACL2019会议论文集.