面向多形式维文的敏感信息过滤算法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:lv_dan1102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的维文敏感信息检测与过滤研究只限于传统维文,而现在互联网上的维文使用呈现传统维文和拉丁维文共存的“一语双文”特点,因此,研究多形式维文的敏感信息过滤算法对新疆的网络安全及社会稳定和长治久安总目标的实现有重要的实际意义.研究拉丁维文和传统维文的Unicode编码特征,提出它们间的编码转换算法ULTC (Uyghur Latin Traditional Conversion),通过该算法在已有的语料库中添加拉丁维文敏感信息语料,从而构建多形式维文敏感信息语料库ULSC(Uyghur Latin Sensitive Corpus);在语料库的基础上构建传统维文和拉丁维文一体化的多形式维文敏感信息决策树LUDT(Latin Uyghur Decision Tree),在决策树的基础上提出多形式维文敏感信息过滤算法USF(Uyghur Sensitive Information Filter).实验结果表明,USF算法具有较高的查全率.
其他文献
在旧课程理念向新课程理念转变的过程中,如何使得课堂氛围更加活跃、学生学习兴趣愈加浓烈、师生互动更加频繁、学生各方面能力不断提升是老师们面对的巨大挑战,这需要老师和同
  目前关于拓扑优化大多数研究主要集中在二维结构,但在工程实际应用中,由于大多数问题都是三维的,因此关于三维拓扑优化的问题已逐渐成为研究的热点。本文对三维连续体结构的
稀土熔盐电解槽主要用于制备稀土单一金属和合金,而传统的稀土电解槽因容量小产量低不能满足大规模生产要求,因此本文所设计的15KA稀土电解槽不仅能满足单一稀土金属的市场需
消化道基因治疗为一种安全、温和、护理简单、成本低的基因治疗方式,具有广泛的应用前景.口服基因治疗须解决两个关键问题:输送载体和外源基因进入体细胞的高效持续表达.酿酒
该文对灵芝的液体发酵技术进行了研究并着重在灵芝发酵的pH反馈控制和流变性方面进行了探讨.该实验中灵芝培养基和发酵液都是涨塑性流体,发酵液滤液也为涨塑性流体.在发酵液
学位
地膜覆盖栽培是一项优良的农业增产技术.然而,由于目前使用的塑料地膜,在土壤中不能自行分解和消失,给土壤带来了严重的污染,极大地制约了地膜的进一步推广应用和发展.因此,
振动对工业生产尤其是精密工程有诸多危害,当振动超过允许的范围时,容易使机械零部件产生应力集中和疲劳失效,减小零件的寿命,生产制造过程中会影响加工精度。所以减振理论的研究和减振器的设计一直都是研究热点,许多领域对具有低频甚至超低频减振能力、并且具有较宽减振频率范围的减振器有着迫切需求。欧拉压杆结构在承受轴向力产生大变形时,刚度会迅速减小,可以利用这种特性设计大变形结构减振器。该减振器结构简单,既能承
红景天苷是高山红景天的主要生物活性成分,其具有许多药理学特性如抗缺氧、抗疲劳、延缓衰老、防止心血管疾病以及抗肿瘤等方面的特殊功效.但红景天苷在天然红景天植物中含量
北部湾产权交易所集团(下称“集团”)深入贯彻落实党中央、国务院,自治区党委、政府决策部署,把疫情防控作为当前首要政治任务,紧紧围绕“六抓六落实”,保安全、稳经营、优服
期刊