论文部分内容阅读
美食资源库是个性化菜谱查询、营养推荐、疾病食疗的底层基础。针对国内目前还没有一个完善的中文美食开放连接资源库,构建了国内首个中文美食开放链接资源库并提供SPARQL查询和普通查询服务,为上层智能应用的开发提供底层平台。针对结构化数据较少的情况,对传统的TF-IDF算法进行改进,引入VIPS算法,提出针对半结构化美食网站的通用美食爬虫,使美食数据的抽取更加智能化,准确率提高22.1%。