基于统计主题模型的多粒度Web文档标注

来源 :计算机应用 | 被引量 : 3次 | 上传用户:daxia3301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对已有Web文档语义标注技术在标注完整性方面的缺陷,将潜在狄里克雷分配(LDA)模型用于对Web文档添加语义标注。考虑到Web文档具有明显的领域特征,在传统的LDA模型中嵌入领域信息,提出Domain-enable LDA模型,提高了标注结果的完整性并避免了对词汇主题的强制分配;同时在文档隐含主题和文档所在领域本体概念间建立关联,利用本体概念表达的语义对隐含主题进行准确的解释,使文档的语义清晰化,为文档检索提供有效帮助。根据LDA模型可为每个词汇分配隐含主题的特征,提出多粒度语义标注的概念。在20
其他文献
节点定位对许多无线传感器网络的应用来说是非常关键的,提出了一种基于移动锚节点的无测距的节点定位算法。此算法建立在Monte Carlo定位算法基础之上,通过利用节点收集到的信息来加速算法中样本的选取,从而提高定位的精度和效率。仿真结果表明,此节点定位技术平均定位精度能达到0.2个通信半径,与其他类似定位技术相比,能够明显提高节点定位精度。
图书的防灾与保护是图书馆工作的重要内容。重点阐述了纸型图书防灾和保护工作的重要意义,分析了损坏纸型图书载体的因素,提出了图书防灾与保护的措施以及图书馆所担负的责任和
介绍了用三性法(周期性,公度性,黄金分割性)对1999年9月21日台湾7.6级大震的三要素预报,并用构造分段公式,“静中动判据”补充作了讨论。鉴于短监预报的重要,我们还用样暴倍九律,即预滑-磁暴-天气
针对移动环境下的数据冲突和冲突消解处理的不足,提出基于Web内容和数据集同步的同步复制模型。移动设备端缓存两种不同粒度的数据,采用"订阅-取消订阅-订阅"的方式提供个性化的数据,以两种不同的同步策略:即用客户端限定时间偏差的方法,解决Web页面冲突;用同步预处理的方式减少数据库同步时上行的数据传输量,同时用基于优先级和事务协调相结合的方法解决数据库冲突,从而解决了模型冲突处理问题。
对月降水量的前期500hPa高度场、海温场相关预报因子进行EOF展开,并取其中与预报量相关程度较高的主成分,结合人工神经网络技术,建立了一种新的短期气候预测模型.将这种新的
以1980-1998年近20年间的共3182次水害数据为基础进行统计分析,对中国铁路水害的自然环境致灾因子作了分类,验证了其与太阳黑子之间的相关性。同时,对降水致灾的发生频数与断道时
20世纪80年代,英国艺术史学者苏立文在《林风眠——中国现代绘画的先驱者》一文中对20世纪中国绘画大师林风眠作了这样的评价:“从抒情的、装饰的、充满诗意的极端,到悲惨的
邢健健副教授简历南京艺术学院美术学院副教授。中国美术家协会会员。江苏油画学会理事。
我们陶瓷专业的雕塑教学几年来一直是在有限的不足十周时间中,老师以西方写实雕塑的教学方法,让学生用几周时间从西方造型风格的动物雕塑的泥塑临摹开始,进而到泥塑写生,兼介
凭借于网络高效应用以及大学生自身群体的特殊性,高校学生对社会热点问题事件已从幕后关注演变成前台互动搭戏,社会热点问题已然与大学生的生活融为一体,密不可分,它们总是从