【摘 要】
:
随着互联网向医疗领域融合发展,在线问诊因为其方便性、安全性已成为居民的常用就医方式,因此积累了大量的在线医疗数据。命名实体识别是实现这种非结构化文本提炼的第一步。目前的医疗命名实体识别大多根据医疗书籍、电子病历等规范化文本展开研究,缺乏专门对口语化、信息间断的在线问诊记录的命名实体识别研究。本文基于Mac BERT与条件随机场模型,研究融入词信息的在线问诊记录中临床关键特征识别,并进行阴阳性判别。
论文部分内容阅读
随着互联网向医疗领域融合发展,在线问诊因为其方便性、安全性已成为居民的常用就医方式,因此积累了大量的在线医疗数据。命名实体识别是实现这种非结构化文本提炼的第一步。目前的医疗命名实体识别大多根据医疗书籍、电子病历等规范化文本展开研究,缺乏专门对口语化、信息间断的在线问诊记录的命名实体识别研究。本文基于Mac BERT与条件随机场模型,研究融入词信息的在线问诊记录中临床关键特征识别,并进行阴阳性判别。通过阴阳性判断,可对患者本次就医进行简短概括,提供对应的分诊意见,加强互联网在现代医疗中的调动引导作用,减少患者就医成本,提高社会医疗服务质量,提升居民幸福指数。针对命名实体边界识别困难问题,本文提出通过位置编码方式融入词信息的模型。利用中文分词绝对位置编码和词性编码相结合的方式,对词信息进行位置“软”嵌入,并通过说话者角色嵌入向模型中加入对话文本信息。同时,在损失函数中引入加权多分类交叉熵,强化模型对较少数量命名实体的识别,提升模型在命名实体识别中应对实体类别不均衡等问题的能力。为检验模型的有效性,本文对春雨医生互联网在线问诊记录进行临床发现关键特征识别,实验结果表明,融入词信息等更多纬度特征能在一定程度上提升模型的识别能力。
其他文献
随着数字通信技术的发展及微博等社交媒体在人们日常生活中的深度融入,公民公共表达意愿与能力提升,人们进入“表达”的时代。舆情研究也逐渐上升到国家战略的位置,备受政府与学界的重视。传统的舆情分析系统,一方面多使用大数据计算和分析技术进行数据处理,缺乏数据广度、挖掘深度;另一方面主要集中在商用和政府治理领域,专注于科研领域的舆情分析系统较少且影响力甚微。因此,需要设计并实现一款对数据进行深度挖掘的、专注
<正>4月6日,在国务院新闻办公室举行的“权威部门话开局”系列主题新闻发布会上,国家税务总局局长王军表示,税务部门要更好地发挥和拓展提升税收职能作用,以税收现代化更好服务中国式现代化。王军提出,一是要持续强化税务机关首先是政治机关的建设,任何时候都要做到党中央有部署、税务部门见行动。
在推荐系统中,用户的偏好往往是个性化的,且用户会随着时间的推移而改变他们的偏好,推荐模型如果忽略了用户个性偏好的动态变化,可能会导致推荐质量的下降。其次,推荐系统大都受到冷启动和数据稀疏的影响。如何准确地捕捉用户个性偏好的动态变化,并有效地缓解冷启动和数据稀疏的影响,是提高推荐质量,改善用户体验的关键。由于张量能够更好地存储时间信息从而利于分析用户偏好随时间的变化,且通过耦合张量分解对多个信息进行
近些年来随着机器学习的不断发展,它在各个民生领域都发挥出了重要的作用,例如人脸识别、语音检测等。并且随着现在大数据时代的蓬勃发展,越来越多的数据资源能够被利用,这为解决一些实际问题提供了很大的便利。作为民生热点的森林火灾,难以预防并且危害极大。森林火灾的起因是多方面的,例如温度,降雨,地形和植被等原因。采用机器学习的方法可以有效利用这些特征,能够对森林火灾发生的概率进行较为准确的预测,这可以更客观
微服务软件架构具有低耦合、易扩展和高可用的优点,现代软件架构逐步向微服务演变。在高并发环境下微服务的应用带来了新的挑战:服务间的网络IO通信延时会影响服务质量;各个服务独立部署引入了分布式问题,且彼此之间相互依赖,这就需要有效的服务治理手段对集群中的各个服务节点进行管理。为了解决上述两个问题,本文设计并实现了微服务框架rush-RPC。为解决服务间的通信延时问题,rush-RPC从两方面入手:一方
税收现代化服务中国式现代化,要找到税收现代化与中国式现代化的相关性,抓住主要矛盾和矛盾的主要方面,探寻实现路径:健全税收法治体系,充分发挥税收在促进全体人民共同富裕、人与自然和谐共生中的调控作用;应用“助推理论”,优化税务执法方式;营造良好税务营商环境,优化服务,释放政策红利;强化现代税收征管,提高聚财能力;大力培育和践行中国税务精神。
在传统的运动康复中,行走训练是对下肢康复十分重要的一种训练方式。目前虚拟现实游戏中的漫游通常是通过手柄摇杆进行控制,令用户在现实空间中保持静止的同时在虚拟环境中自由漫游。这种漫游方式一方面无法令用户进行行走训练,另一方面会引起用户大脑接收到的视觉信息和前庭感官接收到的运动信息不一致从而引发晕动症。同时由于虚拟现实头显隔绝了用户与现实世界的视觉信息获取,因此如何保障用户在虚拟环境中进行训练时的安全也
由于我国人口基数庞大,地区之间经济发展水平差异明显,人均医疗资源十分有限且分布不均衡,一方面患者面临“就医难、挂号难、预约难”问题,另一方面医院存在“病源不足,资源闲置”的问题。如何在医患之间建立起有效的信息交流平台,解决患者和医院面临的问题,不仅会产生经济效益,而且会带来积极的社会效应。因此,利用软件工程技术,开发一个功能完备、服务患者和医院的网上预约挂号系统具有重要意义。网上预约挂号系统分为两
随着大数据时代的到来,如何对海量数据进行处理、分析,从而获取商业价值,已经成为了越来越多公司重点关注的问题,同时也给任务调度带来了不少挑战。首先,在大数据处理中,由于数据处理量极大,单机处理会给企业带来巨大的时间成本;其次,在单个数据处理的工作流中,可能存在工作流内部各个任务之间有上下游依赖的情况,如果仅通过传统的定时任务库如Quartz来处理,则十分麻烦,难以掌控;另外,虽然有诸如Airflow
<正>1 行业面临的问题1.1 政策与市场2020年,随着中美第一阶段贸易协定的签署,大豆供应回归正常状态。中国养殖业逐渐走出非洲猪瘟的影响,养殖存栏逐步恢复,中国大豆进口需求明显上升,同比增长13.4%。但是面对突如其来的新冠肺炎疫情,油脂油料的国内外供应链、油脂需求受到严峻考验。1.1.1 全球供应链受到新冠肺炎疫情的严峻考验新冠肺炎疫情全球蔓延致使全球经济衰退情况加剧,全球贸易保护的情况也进