基于EDA和回译的导游投诉文本混合增强方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:ITredfox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,使用机器学习算法从导游投诉文本数据中识别出导游违规行为,辅助旅游监管人员工作,为旅游监管提供依据,成为一个必然趋势。然而导游投诉文本存在着语料单一、难以获取等困难,如何对这些导游投诉文本进行文本增强以满足导游违规行为识别需要,是一个迫切需要解决的问题。针对这一问题,提出了一种基于EDA(easy data augmentation)和回译的导游投诉文本混合增强方法。从EDA和回译两个角度对导游投诉文本进行增强,将两种方法返回的增强投诉语料进行混合,得到最终的增强文本;并将该方法在实际的导游违规行为
其他文献
这篇文章值得认真一读。 它虽然只反映了一节课中的一个问题,但基本上说清了要教好自然课,应如何转变教学观念,如何学习大纲,如何针对学生实际,在这个基础上设计教学方法,而
为优化民俗文化资源存储效果,提高民俗文化资源调度效率与精度,设计一种基于云平台的民俗文化资源优化系统。用户在应用层前台模块的前端界面中输入查询指令后,指令通过对外
以增强三维动漫的逼真效果为目标,设计基于虚拟现实技术的三维动漫系统。系统感知模块通过感知角色行为状态,获取感知信息,为情感模块与行为模块提供数据基础;情感模块负责制
松江县泖港镇创立特种动物养殖场,半年前从非洲津巴布韦引进的9只蓝颈鸵鸟,目前已“儿女满堂”。人工孵出的30只小鸵鸟活泼可爱,开创了上海地区人工批量繁育蓝颈鸵鸟成功的先
极化码是一种被严格证明到达信道容量的信道编码方法。虽然串行抵消列表比特翻转(SCLF)译码算法可提高译码性能,但导致较高的译码复杂度。为降低译码复杂度,提出一种分段CRC
针对目前人脸识别存在的主要安全隐患,包括验证数据库安全问题及假体攻击问题,提出基于大数据的人脸识别算法。设计了大数据人脸识别算法的系统架构,将系统分为前端采集终端、云端数据处理及数据通信三大部分。在该架构基础上,设计大数据人脸识别算法的实现流程,前端采用PFLD算法进行人脸特征点提取,通过网络将数据传输至云端存储,并在云端进行计算识别,充分利用云服务器的计算与存储优势。最后进行了实验与仿真,结果表
当前智能教学系统没有考虑教学资源的大规模、海量特性,使得智能教学系统的性能低,教学资源利用率不高,为了更好地提高教学效果,提出大数据分析技术的智能教学系统。首先,分
黄智林老师这节课的最大优点是引题自然,能用日常生活中的实例来解释有关名词,这是值得我们学习和借鉴的。 本课教学也有些不够完善的地方,提出来与黄老师商讨。 一、语言细
目的对ERDA1基因CAG/CTG和SEF2-1基因CTG重复序列数目的遗传性痉挛性截瘫(HSP)患者及正常人群中的分布和二者在逐代传递中的动态变化进行研究.方法采用PCR扩增,聚丙烯酰胺凝
老年无功能性垂体腺瘤以大腺瘤及巨腺瘤多见,生长缓慢,不呈现功能性垂体腺瘤的症状,难以被早期诊断.我科自1986年6月至2004年2月,经蝶窦显微手术切除老年无功能性垂体腺瘤24