搜索日志中中文人名自动识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zhiyouyiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索日志中人名识别一直是日志挖掘中的一个重点和难点,其结果好坏直接关系搜索引擎的检索效率和准确率。由于分析了长文本中人名识别方法在搜索日志中使用存在很多困难与不足,因而该文提出了一种在搜索日志中识别中文人名的方法。该方法将搜索日志中人名内部用字的概率特征引入条件随机场,再根据搜索日志的特点计算人名可信度提取搜索日志中的中文人名。在搜狗查询日志上进行实验,正确率平均达到了81.97%、召回率平均达到了85.81%,综合指标F值平均达到了83.79%。
其他文献
光秃秃的水泥墙,硬邦邦的水泥地,诺大的空间,空旷的有些冷,竹帘子、木桌子、防空洞一般的简单,却让秦欲罢不能的爱着。也许是无二的“无”正好迎合了我空无的心境,秦别无选择地让它
那是一场典型的商务晚宴,就设在那个城市一个叫阳光食府的饭店。那是一家包围在一片苍翠之中的别墅式酒店,没有走进就已经感觉到它的不俗,我从心里已经喜欢了。还是细心的请服务
基于网络的卫星远程监控系统适用于小型卫星地面站,此系统是通过网络对卫星的状况进行远程数据采集、分析和管理.本文论述了可能引起此系统不可靠的一些主要因素,并提出了相
在迎接2008年北京奥运这一世界瞩目的体育盛会系列活动之中,北京市政府与医药卫生机构以“健康奥运,健康北京”为主题,卫生部部长、北京市市长等专家亲自向市民发送限量小勺,提醒
在台风“珍珠”到达上海的那天.我和朋友正为收到的一条餐厅优惠消息而雀跃不已。这家地方特色餐厅的美妙味道和它的价格是成正比的,所以这条“当日1折”的吸引绝对是不容小视
如今越来越多的都市人都开始在外面用餐,也许是因为工作的忙碌无暇享受家中装修精致的厨房设备,也许是人类的惰性使他们越来越远离厨房的油烟味。不过,对美食的一贯热枕是永远不
该文提出了一种从维基百科的可比语料中抽取对齐句子的方法。在获取了维基百科中英文数据库备份并进行一定处理后,重构成本地维基语料数据库。在此基础上,统计了词汇数据、构
卫生部12月底通报2004年植物油国家卫生监督抽检情况,经对生产企业和市售的574份植物油的酸价、过氧化值、浸出油溶剂残留量等卫生安全指标进行抽检和检查食品标志,结果522份
本文主要针对ADSP-BF533的内部存储器的访问方式进行了讨论,介绍了系统的内存管理机制,提出用Mem DMA的方式对指令存储器进行迂回访问,描述了DMA的相关寄存器并给出其设置的