基于主题与语义的对话语料关键词抽取方法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:dfcy007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对话信息反映对话者的兴趣,为快速了解对话主题或内容,抽取对话中关键词非常有意义。传统的对话语料关键词抽取方法多基于词频或者共现关系,却忽略语义和主题,因此提出一种基于语义和主题自动关键词抽取方法。结合中文语料训练得到词向量和主题模型;计算词的语义权重,包括词与全文语义相似度权重,词语义聚类权重,词性权重。根据词的语义权重得到Top-N词作为关键词;将TFIDF方法和语义权重方法抽取的关键词作为节点,基于节点间语义相似度建图,通过图迭代得到最终的关键词。该方法有效地解决传统算法忽略语义和主题的问题,同
其他文献
在后科尔伯格道德认知发展理论中,以莱斯特为代表的道德发展理论独树一帜,敢于迎接时代的挑战,在实证研究和理论方面不断创新。其实证研究经历了从四成分模型(FCM)向确定问题
云计算、大数据等传统应用系统中的存储系统往往以虚拟化的形式运行在开源的Linux平台上,随着存储虚拟化技术不断成熟并向多元化发展,用户同样需要基于Windows平台的存储虚拟化服务。针对这些需求,提出一种基于Windows操作系统平台提供存储虚拟化服务的软件,可实现在Windows操作系统中创建虚拟的本地磁盘供用户使用,磁盘中的数据以条带化的形式平均分布在底层各个物理磁盘上。该软件基于海量存储网络
改革开放三十年,中国经济GDP一直保持在9%以上的增长率。持续迅速的增长背后以牺牲环境、高耗资源等为代价。这次党的十七大中明确提出了加速转变经济增长方式,从单纯的经济增长
随着智能化的发展,单片机技术在众多领域得到广泛应用。如:工业自动化控制,智能仪表,汽车家电,航空航天,计算机网络和通信,温室环境控制等。现代温室及配套设施已采用集约化、专业花