【摘 要】
:
短文本聚类研究广泛应用在不同领域,而短文本呈现的稀疏性、歧义与噪声多的特点,要求聚类处理过程中短文本的向量表示能够充分编码其有效特征,本文从短文本聚类的两个关键步骤,即文本的向量化表示与聚类效果评价进行研究.据此对短文本聚类方法的演化过程与优化方法进行了总结,并针对现有研究对未来的发展方向进行展望.
【机 构】
:
河北经贸大学 信息技术学院,河北 石家庄 050061
论文部分内容阅读
短文本聚类研究广泛应用在不同领域,而短文本呈现的稀疏性、歧义与噪声多的特点,要求聚类处理过程中短文本的向量表示能够充分编码其有效特征,本文从短文本聚类的两个关键步骤,即文本的向量化表示与聚类效果评价进行研究.据此对短文本聚类方法的演化过程与优化方法进行了总结,并针对现有研究对未来的发展方向进行展望.
其他文献
为探究中学生生涯规划、时间管理、学习策略和学习动机之间的关系,选取职业生涯规划量表、青少年时间管理倾向量表、中学生学习策略量表、班级凝聚力量表和学习动机量表,对1273名中学生进行问卷调查.结果表明:中学生生涯规划、时间管理、学习策略、团体动力和学习动机之间具有显著的相关关系;时间管理、学习策略在中学生生涯规划对学习动机影响中起到中介作用;在不同团体动力水平下,生涯规划对学习动机的影响程度各不相同,高水平团体动力下的路径系数高于低水平团体动力的路径系数.结论:中学生生涯规划能够通过时间管理和学习策略激发学
基于原子分子反应静力学的原理,推导出了BeS分子基态X1Σ+,第一简并激发态A1Π 和第二激发态B1Σ+的离解极限.利用SAC/SAC-CI方法结合D95++,6-311++G,6-311++G??,CC-PVDZ这4个基组,分别对BeS分子的X1Σ+,A1Π和B1Σ+态进行了几何优化,从中优选出6-311++G??基组,用SAC方法对基态,SAC-CI方法对激发态进行了单点能扫描,通过Murrell-Sorbie函数拟合,获得了X1Σ+,A1Π和B1Σ+的力常数和光谱常数,计算的结果与实验数据非常吻合,
当人工智能、网络、虚拟现实、区块链、生物技术等多领域技术出现了类似于摩尔定律的指数级增长和积木叠加式创新时,全新升维式的社会组织方式将会到来——元宇宙就此应运而生.元宇宙构建了与现实世界平行也具有映射关系的数字化虚拟世界,分布式的数据存储与价值流转成为维持元宇宙持久运转的关键.本文从元宇宙与数据价值关联出发,聚焦探索元宇宙时代激发的数据价值释放流转手段——数据要素市场化的关键要素及区块链技术赋能,最后介绍了中国电信研究院在该领域的实践思路与案例.
本文提出了基于区块链技术构建涵盖政府、银行、项目建设单位等多方参与的征拆迁资金监管体系,将征拆迁信息采集、财政资金审核、征拆迁安置资金拨付等全流程信息上链,实现征拆迁资金审批使用全程规范透明、资金申请和拨付流程可追溯,保障政府监管部门对资金流向的全流程穿透式监管.雄安新区的成功实践结果表明,本文提出的基于区块链的征拆迁资金监管方法可有效保障财政资金使用的公开透明,提高资金的流转效率,进一步完善财政管理体系.
2020年8月在重庆市奉节县与黔江区,发现3种重庆市昆虫新纪录种,分别是杂红同蟋螽Homogryllacris rufovaria(Liu,2007),属于直翅目蟋螽科;圆翅前锹甲Prosopocoilus forficula(Thomson,1856),属于鞘翅目锹甲科;珞弄蝶Lotongus saralus(de Nicéville,1889),属于鳞翅目弄蝶科.
随着5G和物联网技术的发展,出现了一些对时延敏感的计算密集型应用场景.而边缘计算技术为有效解决这一问题提供了思路,通过终端设备将计算任务卸载到边缘服务器上可以减少任务完成时间.本文对边缘计算的概念和架构进行了梳理,介绍并分析了边缘计算的关键技术,分析比较了4种边缘计算的开源平台,并简要阐述了其体系结构,然后归纳了边缘计算的典型应用场景,最后分析了边缘计算的热点研究方向及发展趋势.
区块链是一种颠覆性技术,是下一代信息革命的引爆区,将在全球范围引发一场新的技术革命和产业变革.谁占领其发展先机,谁就在这场革命中拥有竞争的话无权,绝非“可发展可不发展”.
经过多年发展,大数据从一个新兴的技术方向,正在成为融入实体经济发展的要素、资源和动力.美国、中国、英国、德国、澳大利亚等国家纷纷出台相关政策,推动大数据产业发展.文章基于文献计量学的视角,分析了大数据研究领域的发展历程、主要研究国家、重点机构、资助基金和研究热点.通过分析可以看到,2012—2019年期间,全球大数据研究领域年度发文整体呈现上升趋势.美国和中国在该领域发文数量最多,中国近几年的发文量逐步超过美国,位居全球第一.美国在大数据研究领域的发文机构数量最多,中国科学院在该领域发表论文数量最多.全球
钢铁行业是国民经济的重要产业,通过优化供应链实现行业整体提质增效、转型升级势在必行.区块链分布式存储、可追溯、不可篡改、加密安全等技术特性能有效解决目前钢铁行业供应链中存在的库存冗余、资金链更新不及时、业务数据不透明以及数据失真等问题.本研究从物流数据采集追踪、数据共享、数据安全、共识协议、联盟链构建等五个方面,构建基于区块链技术的钢铁行业智能供应链平台,形成数据隐私保护、成本效益提升、智能合约安全、能源消耗降低、数据处理高效的关键能力体系.平台可有效应用于钢铁产品质量认证与追溯、供应链金融服务、节点企业
在工业生产中,无序产品上下料、识别、定位、缺陷检测等是实现生产自动化的重要环节.3D传感器的作用相当于机器人的眼睛,通过3D传感器可以对生产线或是场景中的物体进行定位、识别、检测等应用.随着对生产效率、生产质量以及生产成本控制要求的不断提高,3D视觉技术已经成为制造行业的一个发展趋势.