【摘 要】
:
针对于互联网商品信息数据量庞大的问题,提出一种基于改进型轻量级语义特征提取的web商品信息挖掘方法。首先,通过分析网站链接的层级关系,采用层次访问的方式抓取电子商店的
【机 构】
:
川北幼儿师范高等专科学校,山西大学软件学院
论文部分内容阅读
针对于互联网商品信息数据量庞大的问题,提出一种基于改进型轻量级语义特征提取的web商品信息挖掘方法。首先,通过分析网站链接的层级关系,采用层次访问的方式抓取电子商店的网站URL。其次,采用改进型轻量级语义特征提取方法对元素进行聚类以实现电子商店页面内商品记录的提取。最后,利用产品属性格式和产品记录结构的常识信息进行正则匹配,实现商品属性的提取。实验采用该方法提取来自不同国家的两个电子商店网站不同产品的属性,实验结果表明,提出的方法较好地兼顾了信息提取的完整性和准确性,商品信息的平均提取准确率可高达98.3
其他文献
<正> 目前苹果树在全国各地均有大面积栽培,品种繁多,产量极高,产量过剩,积压严重,果农们为之头痛,造成不少地区砍伐严重,所以苹果树改良高档水果势在必行。1 选水果品种选什
信息过载使得人们难以快速查找到最适用于用户自身的信息,为满足女性用户快速获得自身需要的健康信息,文中提出了一种基于女性健康信息的个性化推荐算法。算法综合了基于内容
近年来大陆借鉴了日韩偶像培养模式,辅以互联网加持,偶像养成文化日渐成为各大传媒新聚焦点。但养成文化在大陆的发展不止于一般的追星内涵,其中粉丝与偶像之间的生态打造,既
由天津市委宣传部、天津市新闻出版局、天津市期刊工作者协会共同组织开展的2010-2012年度公开发行期刊出版质量综合评估结果暨优秀期刊奖评选中,《天津中医药》荣获天津市第1
在线翻译具有速度快、费用低、应用方便等优点.针对在线翻译软件众多、难于选择的问题, 文中基于灰色综合评价展开研究, 为软件选择提供理论依据.首先, 构建评价指标体系, 包
为探究包合物对羊肚腐败菌的抑制作用及保鲜效果,采用共沉积法制备含不同物质的量之比的葡萄籽提取物(grape seed extract,GSE)与2-羟丙基-β-环糊精((2-hydroxypropyl)-β-c
文中采用Struts2、Spring、Hibernate、和ExtJS等技术设计并开发一个基于B/S模式的软件工程资源共享平台,该平台主要实现用户管理模块、基础资源管理模块、考试系统模块、作业
对焦糖色素生产的反应条件进行了深入的研究,认为合适的催化剂,反应温度,介质的pH值以及反应的时间对焦糖色素色率有较大的影响,它为工业化生产焦糖色素提供了理论指导。
文中设计了一种基于摄像头的实时原笔迹提取与汉字识别系统,根据笔划书写的空域特征和时域特征提出了一种单帧疑似笔迹提取算法和多帧排噪算法,实现了原笔迹的实时显示,汉字的轮廓、笔锋、笔划顺序等个性特征得到了数字化地保存;同时,通过提取的笔划特征和传统的隐马尔科夫模型实现了汉字的实时识别,识别率达到85%左右。该系统可应用于电子签名认证、笔迹身份识别、教学授课等领域。
在新的时代,新《食品安全法实施条例》确立了一系列创新性制度。这些制度构成新《食品安全法实施条例》的主要亮点,主要体现在落实"四个最严要求";强化食品安全风险防控基础;