欢迎访问新加坡聚知刊出版有限公司官方网站
65 84368249info@juzhikan.asia
基于LSTM-CRF模型的电子病历临床命名实体识别
  • ISSN:3029-2816(Online)3029-2808(Print)
  • DOI:10.69979/3029-2808.25.05.045
  • 出版频率:月刊
  • 语言:中文
  • 收录数据库:ISSN:https://portal.issn.org/ 中国知网:https://scholar.cnki.net/journal/search

基于LSTM-CRF模型的电子病历临床命名实体识别
叶振鹏 蔡凯文 张家豪

韶关学院,广东韶关,512005;

摘要:本文提出一种基于LSTM-CRF模型的中文电子病历命名实体识别方法。该模型通过结合LSTM的序列建模能力和CRF的标签转移优化,有效解决了传统CRF在长距离依赖建模上的局限性。实验表明,该方法在不增加数据开销的情况下显著提升了实体识别性能,F1值达到93.4%,为临床文本分析提供了高效解决方案。

关键词:LSTM-CRF模型;临床命名体识别;电子病历

参考文献

[1]黄志恒,徐伟,余凯.(2015).用于序列标注的双向LSTM-CRF模型.arXiv预印本arXiv:1508.01991.

[2]于勇,司新宇,胡成,张健.(2019).循环神经网络综述:LSTM单元与网络结构.神经计算,31(7),1235–1270.

[3]Pennington,J.,Socher,R.,Manning,C.D.(2014).GloVe:基于全局统计的词向量表示.EMNLP会议论文.

[4]Mikolov,T.,Chen,K.,Corrado,G.,Dean,J.(2013).向量空间中词表示的高效估计.arXiv预印本arXiv:1301.3781.

[5]DeBruijn,B.,Cherry,C.,Kiritchenko,S.,Martin,J.,Zhu,X.(2011).临床信息抽取三阶段的机器学习解决方案:2010年i2b2竞赛技术综述.美国医学信息学会杂志,18(5),557–562.

[6]李彦霖,宋煜,张佳豪,王栋.(2020).FLAT:基于扁平-网格Transformer的中文命名实体识别.ACL2020会议论文集.

[7]邵一鸣,裘旭,黄萱菁.(2019).结合词典增强BERT与两阶段标注的中文命名实体识别.ACL2019会议论文集.