基于特征选择的句子聚类算法

来源 :现代计算机:下半月版 | 被引量 : 0次 | 上传用户:sdn20907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受信息抽取工作的驱动.利用事件相关文档的特点,在分析各种文本特征的基础上,综合利用词语、语义和词串信息进行句子相似度计算,并在此基础上进行句子聚类,提出了基于特征选择的句子聚类方法,为抽取事件侧面信息提供更好的基础资源。实验表明,采用多特征后.句子聚类的效果得到明显提高。
其他文献
西天山地区的地理含义是指我国境内天山西部广大的山区、河谷、盆地和平原等国土资源.其行政辖区主要包括伊犁哈萨克自治州直属八县一市,农四师辖区及天山西部林业局辖局,国
介绍消息中间件在短信息服务平台的设计与实现.系统以开源消息中间件ActiveMQ为核心平台,使用Java为编程语言,实现系统的高性能、分布式、松耦合性。
对Ajax的主要技术及其工作原理进行了研究,通过将Ajax应用于Java开发信息管理系统,解决了浏览器刷新页面等待数据传输的问题,改善了Web应用程序的用户体验。
文章简单介绍了隧道工程地质勘察现状,阐述了勘察阶段技术要求,分析了地质勘察技术,针对隧道工程地质勘察技术要点展开了深入的研究分析,以提高隧道工程地质勘察有效性,更好
水泥稳定碎石层是公路结构层中的一项重要内容,其在公路工程中发挥着重要作用.在公路工程建设期间,经常会出现水泥稳定碎石层裂缝现象,这将会对公路工程的质量,以及后期应用
数据挖掘是从大规模的数据中抽取非平凡的、隐含的、未知的、有潜在使用价值的信息的过程。如何有效地分析这些数据,预测未来,成为摆在人们面前的一大课题。针对数据目标预测问