【摘 要】
:
现有的未知实体词识别方法主要针对人名、地名、机构名等具有特定结构的实体词进行识别,而随着电子商务和社交网络的快速发展,出现了大量结构不确定的专有领域未知实体词。针
【机 构】
:
电子科技大学大数据研究中心,电子科技大学互联网科学中心
【基金项目】
:
国家自然科学基金(61250110543)i中央高校基本科研业务费(ZYGX2013J079,ZYGX20142012,ZYGX2011J067)四川省科技项目(2012RZ0002,2013TD0006)
论文部分内容阅读
现有的未知实体词识别方法主要针对人名、地名、机构名等具有特定结构的实体词进行识别,而随着电子商务和社交网络的快速发展,出现了大量结构不确定的专有领域未知实体词。针对该问题,提出两种基于上下文相关的未知词识别算法,通过计算词(字)和词(字)之间的上下文相关性,得到其潜在组合的支持度,并通过过滤模块过滤掉错误的组合,实现具有非确定型结构的未知实体词识别。实验表明,该算法具有较高的准确率,并且可以通过调整参数适应不同的应用场景。
其他文献
科研实验中不同的实验模型产生结构各异的数据,带来数据库庞杂、不便于系统分析和扩展等问题.通过实例对存在问题进行了分析,详细讨论了通过面向对象编程的思想用异构、迁移、整
入冬了,天气越来越冷了,宝宝最害怕感冒咳嗽了,那我们今天就和奶奶一起做一份甜蜜的荸荠银耳红枣羹吧,不仅可以润肺养胃,还能预防感冒,增强免疫力哦!
Python 是最流行的脚本语言之一,但性能较慢。以整数运算为例,通过实验对比评估了Python 与C语言性能差异,从虚拟机源代码层面分析了性能差异产生的原因。在性能优化方面,归纳了
针对目前主流的多种限制宽带共享的方法缺陷,设计了一个限制宽带共享的接入驱动程序。在接入用户的系统中安装一个底层的驱动程序,通过建立特殊的点对点通道方法把接入驱动绑
提出了一种根据动画效果实现Flash动画自动测评的方案。采用逻辑形式化方法描述操作题阅卷信息,并通过建立的逻辑形式化阅卷系统实现自动阅卷。重点介绍了自动测评方案实现的
兔妈妈有三个孩子,一个叫红眼睛,一个叫长耳朵,还有一个叫短尾巴。一天,兔妈妈对孩子们说:“妈妈到地里去拔萝卜,你们在家把门关好,谁来叫门都别开,记住了吗?”小兔们齐声说
1.千篇一律的童话故事结构会让孩子逐渐失去想象力和创新能力,这首童谣虽然很古老,但对孩子来说,内容很是出其不意哦。 2.寺庙对孩子们来说也许是个陌生的词匯,不妨扫一扫二维码,和孩子一起去了解一下吧! 3.延伸问题:用“从前有条河”开头,编一个类似的故事吧! 今天我们来讲一个特别好玩的故事,从前有座山……你猜山上会发生什么故事呢?然后扫描二维码听一听,看你猜的会不会和这个故事一样吧。 从前有
目的 探究对输尿管镜取石术患者实施护理干预的临床效果。方法 选取2013年7月至2015年9月在我院进行输尿管镜取石术的患者94例为研究对象,按随机投掷法分为对照组和研究组,每
分析了3G网络服务质量QoS控制模式,提出了区别数据流解决带宽分配策略、基于DiffServ模式的数据流优化和基于MQI的流量监管及Qos优化算法,实验证明了方法能减少报文的丢失率,
提出了6LoWPAN无线传感器网络无缝移动切换(SMH)方案,移动切换控制信息在一跳范围内交互,并通过RIPv6接入节点树网络结构自动实现路由,降低了移动切换代价,缩短了移动切换延迟.该方