【摘 要】
:
微博投诉文本中地理位置实体通常存在结构复杂,长度较长,描述较详细的特点。通过对投诉微博文本的分析,提出了地理位置实体自动识别的方法。该方法首先利用特征资源库对微博
【机 构】
:
网络文化与数字传播北京市重点实验室; 北京信息科技大学计算机学院; 北京理工大学管理与经济学院; 北京城市系统工程研究中心;
【基金项目】
:
国家自然科学基金资助项目(61271304);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037);北京市财政项目(PXM2014-17825-000005);网络文化与数字传播北京市重点实验室开放课题项目(ICDD2015)
论文部分内容阅读
微博投诉文本中地理位置实体通常存在结构复杂,长度较长,描述较详细的特点。通过对投诉微博文本的分析,提出了地理位置实体自动识别的方法。该方法首先利用特征资源库对微博进行特征标注,使用条件随机场(conditional random fields,CRF)模型识别地理位置实体。其次根据微博和地理位置实体的特点,对CRF识别后的数据进行二次标注。最后利用微博规则库对识别结果进行补召,修正地理位置实体,最终实现地理位置实体的识别。实验结果表明该方法有显著效果,F值可达到85.52%。
其他文献
目的:观察黄芪注射液与能量合剂治疗急性病毒性心肌炎的疗效。方法:将急性病毒性心肌炎患者57例随机分为治疗组和对照组。治疗组36例给予黄芪注射液和维生素C;对照组21例给予维生素C和能
目的研究与探讨5667例儿童染色体异常核型的频率和类型,总结出儿童染色体病的特点,为染色体病的诊断提供依据。方法收集和分析1983年4月至2013年6月间的染色体检查结果。实验
目的研究提取菟丝子总黄酮的最佳工艺条件。方法对比研究了冷浸提取、温浸提取、乙醇回流提取、超声波提取、渗漉提取5种方法对菟丝子总黄酮的提取效果,并利用正交试验对总黄
<正> 在进行细胞组织培养时,虽然做了大量的消毒和灭菌工作,实验中又注意做到无菌操作,但仍不能完全避免污染。细胞培养产生的污染最常见的是细菌和真菌污染。一般处理污染采
<正> 《林黛玉进贾府》,是曹雪芹精心结构的一篇文字,节选自《红楼梦》第三回。从第一回到第五回犹如全书的“序幕”或“缩影”,第六回才开始展开故事情节。作者写这前五回的
新常态的背景下,新时代“三农”工作,需要在乡村振兴战略的基础上,提升抓力,构建跨越时代的里程碑,逐步迈向农业农村现代化的发展方向进行延伸。在中国特色社会主义思想的引
<正> 本文是《西游记》第一回的节选,写美猴王的出生,显露头角和成为花果山、水帘洞猴王的经过;实际上是小说主人公孙悟空的来历和早年活动。篇幅不长,却突出了猴王精神境界
目的探讨MLPA技术联合羊水培养核型分析在产前诊断中的应用价值。方法采集妊娠18周-24周、有产前诊断指征孕妇的羊水标本695例,同时进行MLPA与染色体核型分析2种检测方法。结
用罂粟碱注射阴茎海绵体治疗35例阳痿病人,其成功勃起率为88.6%,该法治疗阳痿简单易行,无创伤性,病人易于接受。