基于知识图谱的需求模式挖掘方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cnjhhzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前复杂的互联网服务环境下,服务供求双方双盲现象普遍存在。服务需求者对外部服务和相关领域知之甚少,难以准确全面地表达需求。而服务提供者所掌握的用户需求信息有限,因此难以准确恰当地提供服务。为解决以上问题,我们需要获取大量用户需求并进行综合分析,挖掘用户的需求模式,从而帮助用户进行模糊需求的匹配以及为商家提供潜在的用户需求。但目前在网络中,用户的需求来自异构的数据源,且需求表达具有多样性、不规范以及非结构化的特征。因此,基于碎片化的用户需求,通过知识抽取、知识融合以及知识挖掘工作从离散的数据中获取有价值的需求信息,将对当前服务供求市场具有重要意义。本文采用众包服务网站Free Lancer中的用户需求描述短文本对以上问题展开研究。首先通过实体关系抽取方法将每篇非结构化的文本构建成结构化的本体形式,然后通过知识融合方法将大规模需求本体融合成一个热度综合需求图谱。其中,由于用户的表达异构,我们采用基于元素和基于结构的对齐方法,并分别从字符串层面和语义层面将本体中的实体对齐;然后基于融合需求图谱,采用概率图模型挖掘本课题所定义的链路模式和簇状模式。为避免在庞大的需求图谱中直接进行图搜索,我们提出一种基于领域视角的模式挖掘方法,将大规模的需求图谱抽象压缩到领域知识空间。该过程我们通过领域术语抽取方法标识领域实体节点,并采用表示学习方法补全离散的领域知识间的关联。最后,我们基于以上研究成果,设计并开发了一个用户需求模式匹配工具,通过模式挖掘方法辅助用户进行需求文本的编写。互联网当中的用户的需求大多是模糊而嘈杂的,因为没有一种统一的表达规范,在此基础上进行的以上问题的研究十分困难。在实体关系抽取阶段,我们通过规则定义改善了现有NLP工具的不足;在图谱融合阶段,我们借助已有本体对齐方法的支撑,将各类方法进行综合和改进。对于需求模式挖掘,我们创新地提出一种基于领域视角的模式抽取方法,在多粒度空间下进行用户需求模式的挖掘。最后,本课题通过对比实验验证了所采用方法的有效性,并通过具体应用实例证明了本课题的研究价值与意义。
其他文献
油茶(Camellia oleifera)是我国南方特有的木本食用油料植物,它与油棕、油橄榄、椰子并称为世界四大木本食用油料植物。本文对油茶组织培养技术进行了试验研究,主要研究结果
腐植酸广泛存在自然界的土壤、泥炭、风化煤,尤其是年青褐煤中,在农业、工业、医药等领域具有广泛的应用。但直接从褐煤中提取的腐植酸分子量较大,黄腐酸含量低,活性不强,如
在餐饮行业里,麦当劳作为巨头之一,在实行特许经营机制上有其独到之处,并且利用这种商业模式取得了巨大的成功,实现了在全球范围内的扩张。相比麦当劳,我们在实行特许经营的
军队行政消耗性支出过度的原因,运用委托-代理模型进行分析,可归结为信息在初始委托人(公众)和代理人(领导机关、各级军事长官)之间的不对称分布,委托人(公众)与代理人(军事
面向服务的体系结构(SOA)是一种新兴的软件体系结构,详细分析了SOA的基本结构和特点,比较了SOA同面向对象体系结构的不同之处,并结合一个实例给出了架构SOA系统的方法,描述了
为了得到一种简便易行的蛋白质质量的评价方法,采用凯氏定氮法和三氯乙酸沉淀法对于黑龙江原料乳及市售不同厂家生产的全脂甜乳粉、纯酸牛乳、配制型乳饮料和灭菌纯牛乳中的
本文首先从互联网思维、物联网技术及创新环境治理方式的角度分析了智慧环保的内涵;其次分别从有效降低环保监测人力成本、有助于构建多元环境治理体系以及及时对有效信息进
随着经济快速发展,城市水环境不断恶化,地表水环境遭到了严重破环。外在污染物质不断流入,致使河道中氮、磷含量急剧升高,富营养化频繁发生。城市水资源短缺及水环境污染已经
当前的产业集群实践中所涌现的企业迁移热潮虽然吸引了一些学者的目光,但其分析仍局限于中观层面的产业集群发展风险上。自20世纪90年代以来一些学者就强调微观层面集群企业
<正>随着我国新医改政策的施行,我国医药物流行业既要面临存在的问题又承担着新的政策性风险,当然也面临着新的机遇。我国企业应该如何在此时趋利避害,本文从行业整合、信息