网页中商品“属性—值”关系的自动抽取方法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:mai120117
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
商品属性及其对应值的自动挖掘,对于基于Web的商品市场需求分析、商品推荐、售后服务等诸多领域有重要的应用价值。该文提出一种基于网页标题的模板构建方法,从结构化网页中抽取完整的商品"属性—值"关系。该方法包含四个关键技术:1)利用商品网页标题构建领域相关的属性词包;2)基于预设分隔符细化文本节点;3)结合领域商品属性词包获取种子"属性—值"关系;4)结合网页布局信息和字符信息来筛选与构建模板。该文的实验基于相机和手机两个领域展开,获得94.68%的准确率和90.57%的召回率。
其他文献
目的探讨妇产科患者术后疼痛的护理措施。方法将80例妇产科手术患者随机分为对照组和观察组,各40例。对照组进行常规护理,观察组进行综合护理,比较并分析两组的护理满意度。
中国古代皇室文学,繁荣兴盛者当数中古;而中古皇室文学最优者,一为曹魏,二在南朝。由于年代稍远,流传面相对狭小等等原因,南朝皇室文学著作存在着散失亡佚等诸多问题。本文以
基于功能语法的主位结构理论,结合主位推进图,对大学英语作文的主位结构和主位推进程序进行案例分析,设计出简单易行的写作教学方案。在强调词汇和语法衔接的基础上,突出主位
由鲁迅先生拟定而为现当代学术界一致认同的中国古代小说类型"志人小说",究其实质不能算作小说,因为无论以古代还是现代的文体标准衡量,此一文体类型都不具备完整的小说特征,
本文将模糊综合评价理论模型具体应用到高校食堂质量综合评价研究中,结合实际情况将高校食堂评价系统根据需要分成若干指标,建立了因子集、评价集、隶属函数和权重集,实现对
教师的作业设计,从一个侧面体现了教师的教育思想、教育观念、教育追求,密切联系着学生的成长。小学语文作业设计应该回归教师设计原点,紧扣语文学科的特点,从学生的学习特点
<正>"青春的花开花谢让我疲惫却不后悔/四季的雨飞雪飞让我心醉却不堪憔悴""那天黄昏/开始飘起了白雪/忧伤开满山岗/等青春散场"也许你不一定能在脑中哼出这些旋律,但或许会
<正> 第一条 为实施《中华人民共和国海洋环境保护法》,防止海洋石油勘探开发对海洋环境的污染损害,特制定本条例。 第二条 本条例适用于在中华人民共和国管辖海域从事石油勘
各类主题餐厅不断出现,经营状况却不容乐观,该文通过比较创新型主题餐厅与经典主题餐厅的优势和劣势,分析创新型主题餐厅经营不佳的原因,提出发展经营对策。