基于邻域粗糙集的实体分辨记录对划分

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:mimibbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的实体分辨方法在准确性和效率上各有所长,将易分辨和难分辨的记录对分开,为下一步分别应用不同分辨方法提供基础。对待划分的记录对,利用变精度邻域粗糙集分别计算相似记录对和不相似记录对的上下近似集,得到全体记录对的上下近似集及对应的边界,处于边界域的记录对即为难分辨的记录对,其余为易分辨的记录对。分析了变精度邻域粗糙集中的包含度阈值和距离阈值对于记录对划分的影响。利用实验比较难分辨、易分辨和原始记录对在利用相似度阈值分类和利用KNN分类时的准确性,说明了划分的有效性。
其他文献
针对腹部CT影像邻近器官对比度较低及因个体肝脏形状差异较大等引起肝脏分割困难的问题,提出了全卷积神经网络肝脏分割模型。首先通过卷积神经网络提取图像深层、抽象的特征,再
由于传统基于梯度的方形边缘检测算子包含边缘方向过少(一般为2个或4个方向),因此无法从多分辨率角度检测边缘,进而会丢失其他方向的边缘信息。针对上述问题,提出一种具有多尺度、多分辨率特性的边缘检测算子,称为可变局部边缘模式(Varied Local Edge Pattern,VLEP)算子,并用来提取图像边缘信息。算法主要思路包括,将图像经过高斯滤波器平滑,使用一组或多组VLEP算子与滤波后的图像进
基于可逆数据隐藏技术具有可以准确地提取嵌入的秘密消息并无损还原原始载体的特点,可逆数据隐藏技术被广泛使用在医学和军事等领域。提出一种新的基于直方图平移的可逆数据隐
加权指数平均比率(ROEWA)边缘检测算子是一种较好的适用于SAR图像的边缘检测算子,但是使用梯度计算的方法不能准确地确定边缘的方向。针对这一问题,由于SAR图像受乘性噪声干扰,对
特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响。为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新
在广义模糊软集和犹豫模糊软集的基础上给出广义犹豫模糊软集的概念,并研究广义犹豫模糊软集的相似度量。首先利用三种犹豫模糊集合的包含度,构造犹豫模糊集间的相似度量公式
全国省级卫生防疫站长卫生监督法律知识培训班在乌鲁木齐市举办陈永祥为了加强卫生监督工作,更进一步提高卫生防疫站长的法律基础知识及卫生行政应诉水平,以便使卫生监督执法工
针对偏好信息为区间数形式、属性和专家客观权重未知的多属性群决策问题,提出通过属性评价值之间偏离程度的熵值分析和建立目标最小化的非线性规划模型确定属性客观权重,并结合
对正在使用中的手压井、土自来水水质进行了监测。结果表明,土自来水较手压井水质好。细菌总数、总硬度、氯化物土自来水符合标准率高于手压井水,且有显著性差异。手压井水氨氮
为了规范食品卫生行政处罚行为,保证处罚决定顺利执行、维护法律的尊严,依照《中华人民共和国行政处罚法》,对目前食品卫生行政处罚过程中存在的问题进行了探讨。