一种基于语义匹配的Web信息提取方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ankang1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了较好地解决信息过量难以消化、汉语词的歧义划分、Web信息形式不一致并且难以辨识的问题,文章提出了一种基于语义匹配的Web信息提取方法。该方法融合了网页分类、汉语分词、语义信息匹配方法,并给出了一种义素相似度,进而提出了一种基于语义的信息匹配方法来识别和提取网页信息项。基于这种Web信息提取方法的网上药品信息监管系统Web-MIND能够提取出网上药品广告的信息项,并具有较高的准确率。
其他文献
对于台站日照时数质量中存在的问题,通过理论分析,指出原因,主要矛盾及药液配制比例等方面的问题,经过试验统计分析,提出几点建议。
近日,经国家工商总局驰名商标认定委员会审定.宜昌市晓曦红柑桔专业合作社拥有的“晓曦红”宜昌蜜桔商标被认定为中国驰名商标。2006年12月,晓曦红柑桔专业合作社应运而生,创立了
由于客户端的功能限制,直接在WEBGIS客户端实现复杂的投影坐标系到地理坐标系的转换是不现实的。文章利用线性逼近的原理,通过设计一个三角网格插值的办法,极大简化了客户端的计算复杂性。服务器负责计算网格点的投影换算,建立线性转换矩阵,把矩阵传递到客户端,客户端依据矩阵做实时的投影转换。这是个通用的设计,可以适合于任何投影方式,精度也很高,有很好的应用前景。
“小满”过后,我市降水逐渐增多,常出现阴雨连绵的梅雨天气,在蔬菜生产上应重点抓好病虫害综合防治工作。目前蔬菜病害主要有茄子绵疫病,番茄、辣椒疫病,黄瓜霜霉病和细菌性角斑病
针对专家系统中用于用户查询和规则之间不精确匹配问题,提出了一种包含规则的权重和条件属性重要性的近邻算法.该算法部分匹配用户查询和规则左部,计算用户查询与规则之间的
详细介绍了工线两段膨胀土堑的病害和处理情况,对病害产生的原因航处理措施进行了分析,提出了膨胀土路堑施工应注意的问题,对两段路堑施工中的经验和教训作了总结。
基于复杂对象的逻辑推理一直是演绎对象数据库中的研究热点。论文叙述了集合在演绎对象数据库中的应用和实现技术。重点介绍了部分集在规则中的两个作用:列举集合中的所有元素
在室内条件下测定8种农药对橘小实蝇成虫的毒力,结果表明阿维菌素、灭多威、杀灭菊酯、万灵和杀虫双等药剂对橘小实蝇的毒力高于敌敌畏,可替代敌敌畏用于防治橘小实蝇。
用最大距离可分码构造了一个理想门限体制,该体制中的秘密恢复算法可以正确地恢复秘密,并可检测出伪造的秘密份额,确定伪造者的身份。
通过石家庄南环大桥A10-BO段35m+45m+35m3孔现浇连续箱梁施工,介绍大跨度单箱三室预应力钢筋混凝土现浇连续箱梁的支架设计、模板拼装、拱度预留、混凝土浇注及箱梁预应力施工工艺。