一种基于知识网络血缘关系的网页分类方法

来源 :第六届江苏省计算机大会 | 被引量 : 0次 | 上传用户:novi005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  网页内容分析及分类方法作为用户行为分析、兴趣识别、舆情分析等上层应用的底层核心技术逐渐成为学术界乃至工业界的热点。基于标签数据建立机器学习模型的传统网页分类算法已经无法适应移动互联网时代海量数据的迭代更新需求。本文提出一种基于知识网络架构的非监督网页分类方法。该方基于维基中文知识库作为知识网络,标定少量网络上层基础词汇和网络热词的类目体系,利用知识网络的传递性来遍历计算所有节点关键词的类目属性。文章根据中文知识网络特有的文本相似度提出血缘关系算法和相似度提权函数。实验表明这种方法能够有效地提高基于知识网络的中文分类效果。
其他文献
随着无线体域网技术在远程医疗保健,特殊人群监护和社区医疗等服务领域的广泛应用,能否精确接收、记录人体各种生命体征信号已逐步成为研究工作的重点。由于数据的接收具有突发性,为了准确无误地接收信号,本文提出在接收端首先进行分组检测,利用产生的相关峰值对信号进行粗定时同步,随后通过符号定时同步方法完成更精确的定时同步,最后采用载波频率同步方法计算载波频率偏移估计,并根据估计结果进行帧补偿。本文从系统背景、
近年来,BAN网络迅速崛起,它是通过附着在人体表面或植入人体内的传感器系列节点在人体范围内进行通信的新型无线传感器网络.BAN节点具有能耗小,可扩展性高等特点,在人们的日常生活、医疗等领域广泛应用.它将采集到的生命体征信息ECG,EEG等汇聚到智能终端,通过现有的宽带无线传输网进行数据的传输,极大的满足了医疗领域智慧医疗的需求.本文研究了通用网络MAC层中典型的三种接入方式aloha、S-aloh
无线人体局域网窄带物理层采用的兀/4DQPSK调制技术是一种线性窄带数字相位调制技术,具有频谱利用率高、频谱特性好、抗衰落性能强和可用差分解调等特点。本文采用兀/4DQPSK基带差分解调,对系统组成结构和原理进行分析。包含数控振荡器、快速傅里叶变换、低通滤波、采样判决等电路。应用的同步技术有接收机首先进行的分组检测,对数据分组起始进行近似估算;载波同步对数据符号进行载波频偏校正;符号同步确定符号开
心电信号作为一种重要的生命体征参数,其包含丰富的病理信息,对心血管疾病的预防具有重要的参考价值。目前,市场上的心电信号采集装置体积较大,不便于携带,这为心电信号的及时获取和诊断增加了很大的障碍,因此本文基于对心电信号实时采集的硬件装置的研究,结合消除噪声干扰算法,设计出一种适用于家庭和社区的低功耗、体积小的便携式心电实时采集装置。通过对装置的心电信号采集模块、微控制器模块、数据传输模块和智能终端处
近年来,体域网在医疗领域的应用受到越来越多的关注。世界老龄化人口问题日趋严重,如何实时有效的检测老龄群体的身体状况,成为全球普遍关注的问题。无线体域网的提出则有望缓解这一难题。无线体域网是一个非常小型的网络,由植入体内或佩戴在身上的生物传感器和协调器组成。由于传感器采集或传输的数据包重要性差别很大,必须为不同传感器的不同需求提供不同的QoS支持。本论文提出一种基于数据区分化服务的路由算法,针对体域
Hypoxia is a characteristic of most tumor and neurodegenerative diseases with low oxygen condition caused by numerous environmental and genetic aberrations.Study of Hypoxia in neurodegenerative diseas
无线人体局域网利用前导结构前面的63Bit m序列对数据分组起始进行粗略估计,利用前导结构的后27Bit的扩展序列进行精确的符号同步。将载波同步输出的数据和本地已知的前导结构的扩展序列符号进行共轭复数相乘且累加,得互相关系数,利用互相关系数绝对值的峰值判断一个扩展序列符号的结束,计算峰值出现的次数和位序,即可得到同步的序号位置。其中对符号同步算法进行了简化,如用预设门限值的方法来找峰值,用累加扩展
DBSCAN 是一个经典的基于密度的聚类算法,它能够在含有噪声的数据中发现任意形状的簇。但效率较低,其时间复杂度为O(n2)。本文在其基础上提出一种改进算法F-DBSCAN,算法对核心对象邻域中的对象只作标记,不再进行扩展检查。通过判断核心对象邻域中是否存在已标记对象来实现簇合并。对边界对象判断其邻域中是否存在核心对象来确认是否为噪声。此方法避免了原始算法中对重叠区域的重复操作,在不需创建空间索引
会议
空域和频域分析是图像分析的重要方法,提出一种融合空域的局部二值模式(local binary pattern,LBP)和频域的局部相位量化(local phase quantization,LPQ)进行人脸识别的方法。该方法首先对人脸图像分别在空域提取LBP 特征和频域提取LPQ 特征,然后融合成LBP/LPQ 直方图,进行直方图相似性比较,最后根据最近邻原则进行识别。在YALE 和AR 标准人脸
会议
RSA 算法密码体制安全性很高,许多密码系统中都嵌有RSA 密码算法,不仅可以加密,还可用于签名,但是,其速度较慢影响了它的应用。本文在有限域上给出一类新的置换多项式,并证明该置换多项式在有限域上是互逆映射的,从而可以构造了一个RSA 公开密钥密码体制。最后,本文对该体制的安全性和运算速度作了分析。
会议