1.文献综述
1.1介绍
随着生命科学和技术的飞速发展,生物医学文献也呈指数增长。开发一个命名实体识别系统是从大量的生物医学文献中自动提取潜在的医学信息的第一步。
命名实体识别是一项具有挑战性的任务,传统上需要大量的知识以特征工程和词汇的形式来实现高性能。
电子病历命名实体识别的目标是从未标注的纯文本电子病历文档中抽取与医学临床相关的实体单元[1],并将其分类到预先定义好的实体类别中。从自然语言处理的角度来看,它解决的是未登录词的问题,并提供了浅层的语义信息。从定义中可以看到,预先定义好的实体类别是识别任务的基础。精准的实体类别规范将直接影响最终识别的结果。
基于上述背景,对于电子病历命名实体识别系统,以下是两个基本概念:
我们应该先了解两个概念:电子病历和命名实体识别。
电子病历(Electronic Medical Record,EMR)是指医务人员在医疗活动过程中,使用医疗机构信息系统生成的数字化信息, 并能实现存储、管理、传输和重现的医疗记录。电子病历中的文本内容是医务人员按照《病历书写基本规范》和《电子病历基本规范(试行)》中相关书写规定,围绕患者医疗需求与服务活动而记录的描述性文本内容。
命名实体识别(Named Entity Recognition,NER)是指识别自由文本中具有特定意义的实体,如人名、地名、专有名词等。与通用领域的命名实体不同,电子病历中的命名实体通常有疾病、症状、治疗等实体。[1]
1.2模型
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。