信息网络中海量异构数据的组织搜索技术研究

来源 :第二届中国互联网学术年会 | 被引量 : 0次 | 上传用户:ytlytl1009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息网络技术的发展,互联网中出现越来越多形式各异的数据资源.从海量异构的网络数据中准确高效地发现并获取用户所需的数据信息,需要对网络数据进行有效地组织管理并进行基于信息内容语义的相似搜索.为了实现基于语义的相似搜索,需要从网络数据中抽取其特征/属性构造语义空间,网络数据及查询信息抽象为高维特征/属性空间中的特征向量或高维点,通过高维点之间的距离/特征向量间夹角余弦值来衡量相似性.高维数据索引及降维技术是有效组织高维数据信息,实现快速相似性搜索的两种方法.本文对现有的高维数据索引结构及降维技术进行了系统地综述,然后介绍了现有基于P2P技术实现高维数据语义相似性查询的研究工作并展望了未来工作.
其他文献
VoIP技术的发展有两大方向,一是遵循国际电联H.323标准,二是遵循IETF的SIP协议。
这款BENQ Joybee200播放器非常适合都市年轻白领们使用, 其靓丽轻巧的时尚外形以及齐全的播放功能,都是赠送给MM们的最好礼物。当然,也符合都市有品位的男士的需求。相信身为
污染物资料来源臭筑(O。)二氧化碳(CO:)一载化碳(CO)颗粒物质(TSP)醛(HCHO)醛(HCHO)氧及其子体(Rn) 浓度0。05PPm(100微克/米.)1000PPm(1800微克/米.)IQPPm(11微克/米.)15。
乐华RE34MND彩电的水平枕校电路特点:它由小信号处理芯片ICl01(TDA8843)(45)脚内部电路和Q405、Q407等元件组成,和一般的水平枕校电路比,大不相同。它的水平枕形失真校正信
在基于有限状态自动机的正则表达式匹配技术中,内存需求和匹配性能是一对相互制约的因素。统计分析发现,对于给定的自动机,状态的访问概率分布呈Zipf规律。为解决存储和性能
  In DTNs,routing protocols use “store-carry-forward” approaches to complete the communication process.As traditional “Connectivity” concept from the Inte
会议
针对新手游客在陌生城市如何规划旅游路线的问题,本文研究基于景点评分机制以及用户多约束的旅游路线推荐问题.首先提取景点的开放时间、门票与GPS坐标等及旅游网站上对于景
作者对流行率低的麻风,应用二项分布及Pol-sson分布概率密度函数模型.以江苏宝应县3054户患者家庭作了分布拟合的综合分析,结果表明麻风病例以户为单位符合二项分布,而不符合
最近,美国一所大学的一位植物育种家,经过11年的精心研究,成功地培育出一种适于庭院种植、专为收获瓜子的微型南瓜。籽无外壳的小南瓜,其瓜籽含蛋白质高达40%。 Recently, a
近日百万像素照相手机市场惊现奇兵:联想移动新品V850以2580元的价格突击市场!联想高清晰百万像素手机V850内置130万像素摄像头, 可实现4倍数码变焦,带闪光灯,除可实现延时自