论文部分内容阅读
针对传统实体识别方法的主要研究对象是小数据集并且对结果的准确性关注较高的情况,在大数据的背景下提出了一种利用Hadoop平台和MapReduce框架的基于学习的实体识别方法。通过对MapReduce框架流程的分析,运行基于机器学习的算法,并行处理数据集来识别出数据实体。实验表明,该方法提高了实体识别的效果,具有很好的处理性能和效果,满足了识别海量数据中实体的需求。