N-gram 相关硕士博士期刊学术论文

N-gram相关论文

基于N-gram算法的施工投标文本相似度判定

工程建设项目施工招标投标活动是建设工程管理实践中的重要环节,其目的是维持建设工程市场秩序,促进良性公平竞争,维护项目各参与......

学位

招投标 N-gram 评标文本相似度串通投标

融合类别特征扩展与N-gram子词过滤的fastText短文本分类

以提升fastText短文本分类模型性能为目标，从获取高质量的类别特征、降低N-gram子词中低类别区分贡献度子词对模型学习高类别区分贡......

期刊

短文本分类 fastText 类别特征词汇信息熵 N-gram

面向源代码的作者归属判别方法研究

代码作者归属是识别给定代码作者的过程。随着越来越多的恶意软件和先进的变异技术出现,恶意软件的作者正在创造大量的恶意软件变......

学位

代码作者归属耦合度程序依赖图 N-gram 综合少数过采样技术

MWEC:一种基于多语义词向量的中文新词发现方法

[目的]提出一种基于多语义词向量的中文新词发现方法(MWEC),解决多领域社交媒体文本的分词不准确问题.[方法]利用社交媒体文本,结......

期刊

向量新词分词 N-gram 多语义词向量语义相似度

面向新闻文本的中文分词方法研究

自然语言是人类按照某种规则组成的语言,如汉语、英语和法语等。而自然语言处理则是利用计算机对自然语言的形、音、义等信息进行......

学位

中文分词 N-gram 歧义词新词识别

基于多视图的三维模型检索研究

三维模型或三维物体作为三维世界的基本元素，在人类感知世界、认识世界的过程中扮演着必不可少的角色。随着计算机技术的发展，如何让......

学位

多视图三维模型检索损失函数特征学习数据集方法框架 n-gram 类别中心三维物体匹配感知

基于源码特征的软件缺陷与漏洞预测方法的研究

软件缺陷与漏洞是造成软件安全问题的根源，对缺陷和漏洞进行预测是软件测试领域的重要组成部分，有助于合理分配测试资源，是提高软件质......

学位

源码特征提取算法软件缺陷预测方法组合数据集中缺陷预测 N-gram 特征维度特征选择算法异质向量空间模型

A Short Text Classification Method Based on N-Gram and CNN

Text classification is a fundamental task in Nature language process (NLP) application.Most existing research work relie......

期刊

Short text Classification Convolution neural network N-gram Concentration mechan

基于n-gram的大规模中文文档聚类研究

我们提出了一种基于n-gram的大规模中文文档自动聚类方法.该方法将自动聚类首次引入中文文档语义信息组织中,绕开了切词、语法分析......

学位

自动聚类 n-gram 中文文档数据挖掘自动分类

基于URL特征的网页分类研究

互联网提供了大量的广泛分布和高动态资源信息，网页信息分散且不方便管理。网页分类能有效解决这些问题。在网页分类过程中，选取特征......

学位

URL 网页分类特征选择 n-gram

基于N-gram特征的加权朴素贝叶斯文本分类算法

摘要：朴素贝叶斯算法由于其具有简单、稳定和高效的优点，被广泛运用在文本分类领域，但由于算法所涉及属性的独立性和同等重要性，算法的......

期刊

朴素贝叶斯 N-GRAM 加权文本分类

面向语义异常的SIP畸形检测系统的研究与实现

SIP是应用层的多媒体通信协议。SIP协议结构简洁、易于扩展,已经被广泛地应用到VoIP、多媒体会议等场景中。由于IETF在设计SIP协议......

学位

SIP 畸形检测 n-gram SVM分类器

基于机器学习的网络异常检测系统的研究与实现

信息技术与互联网的飞速发展,在给各行各业带来极大便利的同时,网络安全问题也愈来愈突出,各种网络安全入侵行为层出不穷。传统防......

学位

网络异常检测机器学习变分自编码网络日志解析 N-Gram 微服务

基于N-Gram向量特征的社交媒体短文本语种识别方法研究

对于社交媒体平台而言,识别和标注出特定语言的文本对于情感分类、趋势提取、预测电影评分等研究都具有重要的现实意义。传统的语......

学位

语种识别语料标注社交媒体短文本 N-Gram 级联森林

Center-4mCpred：基于中心位点双向拓展的N4-甲基胞嘧啶位点鉴定方法

甲基化是DNA序列化学修饰的一种形式,可以导致遗传物质的染色体的结构发生变化,因此DNA甲基化在DNA遗传表达中起着十分重要的作用......

学位

N4-甲基胞嘧啶 Center-4mCpred n-gram k-skip 支持向量机

基于条件随机场和增量学习词典的中文分词

中文自动分词是指使用机器学习根据特定规范将连续的字序列重组为词序列的过程,是自然语言处理的第一步,这对自然语言处理有着重大......

学位

主动学习 N-gram 逆向最大匹配条件随机场模型中文分词

基于二进制操作码语义优化的静态病毒检测

恶意软件往往利用计算机系统漏洞和安全防御机制的落后来达到恶意破坏或窃取资料等目的。安全防御机制的目标就是能检测出恶意软件......

学位

恶意软件二进制操作码软件保护 Native Api N-Gram 信息增益支持向量机

基于配位信息的语种识别技术研究

语种识别作为多语种语音识别技术的前端,在国际交流与合作中扮演着越来越重要的角色。当前语种识别系统使用的特征可分为声学特征......

学位

语种识别配位信息各态历经隐马尔可夫模型无监督声学单元发现非参贝叶斯模型 HHMM N-gram

面向油田领域的中文真词错误自动校对方法研究

中文真词错误自动校对是自然语言理解的一项重要的基础研究课题,油田数字化过程中利用图像识别及人工录入产生的中文真词错误会直......

期刊

真词错误 N-gram 文本自动校对知识库构建

,Automatic malware classification and new malware detection using machine learning

The explosive growth of malware variants poses a major threat to information security. Traditional anti-virus systems ba......

期刊

Malware classification Machine learning n-gram Gray-scale image Feature extracti

面向大数据短文本的高并发语种识别系统的设计与实现

在如今大数据环境中包含大量不同语种的网络短文本数据,尤其是在国内多民族地区的网络环境中多种语言混杂的情况普遍存在.为了解决......

期刊

大数据高并发语种识别 N-Gram 朴素贝叶斯 uWSGI Nginx Django

基于规则及N—gram模型的数字数据转换成哈萨克语读音文字的方法

摘要：语音合成是哈萨克文信息处理技术的一个重要研究领域。哈萨克文本中的阿拉伯数字转换为其读音文本是语音合成中重要的预备工作......

期刊

哈萨克语数字读音规则库 N-gram

基于深度神经网络的输入法引擎语言模型

摘要：在AI技术快速发展的今天，AI应该应用到每一个角落。本文选择在最常用的工具软件输入法软件中加入深度神经网络算法，利用长短期记......

期刊

输入法引擎 AI 深度神经网络 N-gram

Variable-length sequential dynamic features-based malware detection①

本文通过对荣华二采区10...

期刊

application programming interface(API) call order variable-length n-gram malware

古籍文本抽词研究

古籍文本检索目前大多局限于篇、章及目录,即使是全文检索一般也是基于单汉字的检索,由于没有现成的古籍词表可用,古籍文本的标引......

期刊

古籍数字化 N-gram 自动分词实义词

基于图的多层次注意力事实验证算法

事实验证任务要求能够从大规模的文本语料库中抽取相关的证据,并通过推理对给定的声明得出事实性的判断。现有的研究通常将检索到......

期刊

文本事实验证图注意力网络核函数 N-GRAM 卷积神经网络

Constructing Maximum Entropy Language Models for Movie Review Subjectivity Analysis

Document subjectivity analysis has become an important aspect of web text content mining. This problem is similar to tra......

期刊

exponential prior language model maximum entropy n-gram subjectivity analysis

基于词典和统计相结合的维吾尔语拼写检查方法

该文通过研究国内外相关的拼写错误查错和纠错方法的理论,再结合维吾尔语自身的特点,提出了基于词典和统计相结合的维吾尔语拼写查......

期刊

维吾尔语拼写检查词典 N元语法 Uyghur Language spelling check dictionary N-gram

The classification on short message

This paper discusses the importance of the classification of short message, and details some key technologies related. T......

期刊

classification short message regular expression VSM n-gram Na(i)ve Bayesian clas

基于双向路径约束模型的XML文档结构相似性度量

为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML......

期刊

XML 文档相似度双向路径约束模型 N-Gram

一种语句级汉字输入技术的研究

提出了一种语句级汉字输入技术,把N-gram统计语言模型与语言规则结合起来共同指导拼音流到文字流的转换过程.描述了拼音流自动切分......

期刊

N-gram 音字转换语言元素

基于N-gram语言模型的哈萨克文机构名识别

针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建......

期刊

N-gram 语言模型哈萨克文机构名识别实体名识别

一种基于N-gram组合的中文垃圾邮件过滤方法

中文垃圾邮件的泛滥提出了极为迫切的技术诉求.本文使用了基于简单贝叶斯模型的过滤算法,同时使用N-gram对中文文本进行自动分词,......

期刊

垃圾邮件过滤 N-GRAM 中文文本自动分词 ISP 算法贝叶斯模型 TCR 正确率召回 Anti-spam Chinese email Naive

一种规则与统计相结合的应用题句子语义角色识别方法

以应用题自动求解为目标,以高考入学考试数学试卷中的分层抽样应用题为研究对象,重点研究了分层抽样应用题的句子语义角色识别方法......

期刊

应用题自动求解题意理解语义角色特征词 N-GRAM word problem automatically solving understanding of

基于N-Gram的Deep Web接口属性抽取

Deep Web中,查询接口属性的抽取是Deep Web数据集成中必不可少的一个环节。本文通过将接口属性中文文本翻译成为汉语拼音和英文,利......

期刊

DEEP WEB N-GRAM 属性抽取 Deep Web N-Gram property extraction

基于N-Gram的Deep Web接口属性抽取

Deep Web中,查询接口属性的抽取是Deep Web数据集成中必不可少的一个环节。本文通过将接口属性中文文本翻译成为汉语拼音和英文,利......

期刊

DEEP WEB N-GRAM 属性抽取 Deep Web N-Gram property extraction

Statistical Language Model for Chinese Text Proofreading

Statistical language modeling techniques are investigated so as to construct a language model for Chinese text proofread......

期刊

统计语言模型汉语文本校正语言环境 n-克模型 statistical language model n-gram linguistic environm

汉语语言模型的规模对统计机器翻译系统的影响

本文专门研究了汉语语言模型的规模大小,语法元数在英汉统计机器翻译系统中的影响。实验表明,对于同样的语言模型,基于层次短语的......

期刊

N元语法语言模型基于短语的统计机器翻译系统层次短语 N-gram Chinese language model Phrase-Based MT sys

统计自然语言处理中的线性插值平滑技术

统计自然语言处理中,一个很复杂的问题是数据稀疏问题。主要有两种平滑方法解决：回退法和线性插值法。本文分析和比较了几种典型的......

期刊

统计语言模型数据稀疏问题平滑技术回退法线性插值法 N-GRAM Statistical language model Data sparse probl

基于有效载荷的多级实时入侵检测系统框架

网络入侵检测系统使用大量特征集来识别入侵,需要处理庞大的网络流量,目前大多数现有的系统缺乏实时异常检测能力.提出了一种基于......

期刊

入侵检测数据预处理 N-GRAM 主成分分析马氏距离图迭代特征选择 Intrusion detection Data pre-processing N-

基于统计的中文关键短语自动抽取

用统计的方法从单文本中自动抽取关键短语。在实验中验证了频度、首位置作为特征的有效性。用各种方法过滤非法词串，综合短语位置和......

期刊

关键短语抽取文本特征互信息 N元短语 keywordphrase extraction text feature MI N-gram

搭配、搭配提取与运用

搭配是语言中习惯性的结伴使用,在统计上具有显著性;搭配具有语言学特征,在词类、位置和句法结构上相对固定。搭配提取正是基于上......

期刊

搭配搭配提取词串提取 collocation collocation extraction N-gram

一种开源语法检查器的改进

选择基于统计的开源Masaru语法检查器为研究对象,分析技术路线与功能特点,提出了增加3元4元模型方法,并在系统中实现了3元4元语言......

期刊

语法检查器 Masaru N元语法 Grammar checker Maseru N-gram

一种在线递增式语言模型自适应方法

本文针对传统统计语言模型的离线自适应方法 ,提出了一种在线实时的递增式自适应方法。该自适应方法需要解决几个问题。第一是要设......

期刊

统计语言模型 N-GRAM 自适应语音识别 stochastic language model N-gram adaptation speech rec

一种在线递增式语言模型自适应方法

本文针对传统统计语言模型的离线自适应方法 ,提出了一种在线实时的递增式自适应方法。该自适应方法需要解决几个问题。第一是要设......

期刊

统计语言模型 N-GRAM 自适应语音识别 stochastic language model N-gram adaptation speech rec

一种新型的中文产品评论微摘要方法研究

提出一种新的无监督的方法,对网络上存在的大量中文产品评论信息进行处理,生成简洁的非结构化的可读性强且具有代表性、简洁性的理......

期刊

产品评论挖掘无监督学习微摘要 WEB N-GRAM product reviews mining unsupervised approach micro

一种基于模式发现的语种识别方法

针对不同语种中“语音模式”搭配关系不同的特点,提出一种基于“语音模式”发现的语种识别方法.首先采用无标注语音数据训练GMM模......

期刊

语种识别无监督模式发现 n-grm language recognition unsupervised pattern discovery n-gram

基于N-gram的VB源代码抄袭检测方法

为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。......

期刊

源代码抄袭检测 N-GRAM 相似度计算并行计算 source code plagiarism detection N-gram similarity m

基于N-gram的VB源代码抄袭检测方法

为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。......

期刊

源代码抄袭检测 N-GRAM 相似度计算并行计算 source code plagiarism detection N-gram similarity m

一种基于N-Gram的计算机病毒特征码自动提取方法

随着计算机和互联网技术的发展和普及,计算机病毒所带来的安全威胁日趋严重。基于特征码扫描的病毒检测技术是目前检测已知病毒最......

期刊

N-GRAM 计算机病毒病毒特征码自动提取 N-Gram computer virus virus signature automatic extra

看过本文同时还关注