为抓新闻热点 初涉人工智能

来源 :大学生 | 被引量 : 0次 | 上传用户:okhere
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

30分钟,37行代码,6000条数据


  我在百度上搜索了“爬虫”,大量的爬虫实战案例就展现在我眼前。在认真阅读了多篇文章后,我发现大部分案例都用了python语言。因为python是一门开源语言,简单易用,很多技术或算法都是用python编写的,并且很多人也愿意将自己的工作成果分享到网上,其中有不少数据挖掘与数据分析领域的成果,所以利用python语言进行科研或工作,就像站在前人的肩膀上一样,工作效率会大幅度提高。于是第二天一大早,我就背着电脑直奔图书馆,准备花一天时间学习python,完成作业。
  因为上过C语言的课程,我知道编程基本的逻辑跟我们思考问题和处理问题的思维方式是一样的。拿到python语言代码文件后,我发现它的行文逻辑跟C语言差不多,只有变量声明方式、函数写法等关键词、语言特性等基础知识略微不同。随后,我去网上找来一个python语言的基础教程,快速浏览基本的知识内容后,便开始模仿一个爬虫例子,试着编写我自己的爬虫命令。
  按照爬虫案例的思路,我先引入HTTP请求库、数据处理库和Execl文件生成库,然后写了一个函数来获取网站数据,又写了一个函数来对获取来的数据进行数据整理,最后用一个执行函数来调用前面两个函数,并将处理整理后的数据写入新创建的Execl表格中,就可以完成快速获取数据的任务了。整个过程一共用了大概30分钟,代码仅37行。
  完成代码的编写后,我在命令行中输入“python getdata.py”,程序就开始运行了。当看到爬虫分别从新闻网和微博等社交平台获取我需要的热点新闻,并且帮我整理好近3年来近6000条新闻数据,以Execl表格形式在我的目录文件夹中出现的时候,我非常开心和自豪。
  这就是我第一次学习使用python的经历。在往后的学习工作里,一旦遇到相关问题,我就会想到python语言,因为它的工作效率非常高。慢慢地,我发现python很适合做数据分析领域的工作,它提供的很多优秀的开源库和框架,能够让我专注于核心任务,比如算法的设计、核心功能的实现等。
  作为测绘工程专业的学生,我们的专业培养计划里并没有设置编程课程。我之所以热衷自学各种编程知识,是因为如果把计算机技术与本专业背景结合在一起,就能完成很多同学无法胜任的工作,比如进入老师的课题组承担核心工作,高效地完成科研任务等等,这将成为我最重要的竞争力。同时,我也逐渐认识到,专业出身并不是壁垒。许多技术大牛都是非科班出身的,大家的专业各不相同,唯一相同的就是牢固的基础知识和无数次写代码的实践,我想這放在我身上同样适用。在学长学姐的推荐下,我找到了一个python自学教程。因为这个教程是直接挂在网上的,很方便学习,而且教程的作者一直都在维护和更新内容,以保证它的准确性和友好性,因此它在网上颇有声誉。

100行代码认出我的脸


  进入教程,我在首页的python语言简介一栏看到一句醒目的话:“C语言要写1000行代码,Java只需要写100行,而Python可能只要20行。”我深以为然,这正是python的魅力所在。
  一般来说,刚开始学习一门编程技术时,第一步就是安装语言环境和开发环境。python语言的环境安装非常简单,因为我使用的是苹果电脑,苹果电脑的Mac OS系统本身就内置了python,所以只要安装一个编辑器,就可以直接开始进行编程学习了。
  从python文件的代码结构,到内部每一句代码每一个关键词的含义,对我来说都比较容易理解。我一边看每一个章节的知识点,一边按照教程内容进行实操,遇到无法理解的难点时,只要用百度搜索一下,一般都能找到详细解答。为了加深知识点印象,我将这门教程反复学习了多遍。当感觉脑海中存储的知识越来越多,思路越来越清晰的时候,我觉得下一步就应该去找实际案例进行练习了。以练带学,才能真正掌握这门语言。
  我在网上开源社区GitHub找了一些python的项目案例,期待通过阅读别人的源代码来提高自己的编程能力。当我看到别人写的具体项目时,发现从项目工程目录的文件组织到具体python文件的编写,都非常专业和巧妙。比如目录会按不同的功能详细划分成不同的功能文件,重复编写的地方特别少,在后面的程序中只要需要,就可以直接调用,这样一来,代码量就减少了很多,也更加易于后期的更新和维护。此外,分析python文件的每一个函数或者重要的语句都有相应的解释,变量和函数的命名也都用了统一的英文名,非常易于阅读。
  同时我还发现,不少案例中的许多内容都跟教程有差别,比如同样的数据排序功能,别人用一行代码就实现,而我却要写很多行才能做到。百思不得其解,我便咨询了计算机课程的老师。老师告诉我,我从基础知识教程中学到的方法是最基础的最简单的,但也因为基础,并不会涉及一些编程的技巧。而在别人分享的真实案例中,一般都运用了编程技巧。老师建议我在实际操作时多学习模仿别人的编程思路和做法,比如灵活运用函数式编程、面向对象编程等技巧,这在开发大型项目时,就能大大减少代码量,提高效率,也能让软件系统更加稳定。
我学习python已经有3年多了,python早已成为我科研学习路上的得力助手。

  就这样,我不断地练习数据挖掘、数据分析、网站系统等项目实战案例。最让我印象深刻的是,一次在做一个人脸识别的案例时,我新建了一个python工程文件,引入了python人脸识别的开源引擎face_recognition,写了不到100行代码,我就看到画面中的自己被一个绿色的框子识别了出来,并标注出了我的名字。这是我第一次感受到人工智能技术离我这么近,也让我在以后遇到图像处理、深度学习等任务时开始有底气、有信心,敢去尝试挑战了。

一个月,独立开发系统


  经过一段时间的学习,我对python的兴趣越发浓厚。为检验自己的学习效果,我和几个同学一同报名参加了当年的创新创业互联网 大赛。虽然大家都不是计算机专业的,但我们就想尝试挑战,想看看别人到底有多么厉害。我们选定的项目是开发一个基于LBS的图书共享系统,我自告奋勇地接下了编程技术的任务。因为我知道,只要舍得花时间去研究,目标是有很大概率实现的。
  网站应用系统是python的基础应用领域,像国内的豆瓣网,国外的youtube等,它们的系统后台都是用python来开发的。于是,我重新回到教程,再次深入学习了与python web编程相关的知识点,比如IO编程、数据库、web框架和引入第三方模块等知识,然后从GitHub上找了一个与我所需要开发的系统类似的python项目,认真研读源码后,我开始边模仿边开发自己的新系统。
  在开发过程中,我经常会遇到一些报错信息,因为身边没有精通python的同学请教,我只好去百度,甚至去国外网站查找问题的解决办法,这对英语水平不高的我来说,又是一个挑战。经过一个多月的努力,我终于把系统开发出来了。当自己设计的网站首页出现在眼前的时候,我的心里别提有多激动了。
  尽管最终我们没拿到好的名次,但通过参加比赛,我在短时间内成功建立了一个完整的python系统项目,这让我收获了满满的知识和信心。随后,我发现在老师的很多科研项目中,自己甚至都可以承担起整个项目的开发任务了,这是我身边很多同学都做不到的。
  如今,我学习python已经有3年多了,python早已成为我科研学习路上的得力助手。我认为,在技术升级发展日新月异的今天,及时跟进科技发展的脚步,敢于利用新技术新知识来强化自己的专业能力,实现跨界融合,是大学生在专业领域得到提高的有效途径。
  责任编辑:曹晓晨
其他文献
北京林业大学2020年录取通知书名为“大觉”,寓意“观天地之大,觉寰宇之灵”。“大觉”取自北京西山大觉寺,这是北林建校之初的临时院址。  “大觉”录取通知书由“凝”——起點、“启”——初创、“觉”——生发三部分组成。主图案原型取自大觉寺正殿屋脊俯瞰图,主色取自正脊青砖,主材质采用环保再生纸浆灰板。  “凝”(信封)的封面主图案以白色油墨压印于半透明硫酸纸上,“凝”是起点,凝霜似雪,四方汇聚,蓄势待
前几日,早上5点多突然醒来,比平常要早了一两小时,便索性起床,穿上运动鞋和短裤背心,去外面跑步。我向来是喜欢跑步的,去年在学校里经常在夜晚时分绕着校园跑上几圈,于热汗挥洒中见证校园里莘莘学子的青春年华。前半年,久居在家,人也变得慵懒起来,锻炼的时间大大减少,跑步时明显感觉到自己体能下降了,便索性散起步来,仔细端详故乡这静谧的清晨。幼时“故人”惊再逢悠悠南山下,蕉花竞争艳。  走出村庄,走在去往别村
10月13日—15日,“建行杯”第五届中国“互联网 ”大学生创新创业大赛总决赛在浙江大学举行。  清华大学的85后博士生李京阳硬科技创业,在总冠军争夺赛上晒出“赤膊上阵”照,同台路演的浙江大学的易昊翔则调侃自己,为了项目发际线一直往后退,“头发每掉一根,脑电这件事往前推进了一小步”。事实上,为了梦想,每个创业者都一直努力奔跑。  创业选手在台上紧张比赛,项目指导老师、学校带队老师在台下认真观摩,不
公元1700年,从东洋到西洋,话不尽疯狂;自莱茵至长江,道不尽苍凉。  从东方到西方  这一年,东方太阳升起的日本海水面上,从江户赶往登州的船只络绎不绝。谁曾想100年前,这里竟是尸横遍野,印有“德川”二字的战旗在阳光下熠熠闪光。谁又曾想那年群雄逐鹿,笑到最后的,不是一代枭雄织田信长,更非野心勃勃丰臣秀吉,而是这所谓的忍者大师德川家康。  德川氏在日本的崛起令人始料未及,包括它一衣带水的近邻中国。
2011年6月,高考后的我该报志愿了。我自小受到的教育是要拥有一技之长,才能安身立命。看到汽车行业的年产量和年销售量逐年攀升,日益成为国家经济的支柱产业之一,我选择了汽车工程专业。发动机学问太深了  本科四年,我对汽车及汽车行业的方方面面都有了了解。从汽车的发展历程到目前的前沿技术、从结构到设计、从性能技术到保险理赔……也掌握了基础的专业技能——零部件设计、维修技术、整车设计……  大二暑假,我去
对于武大的新生来说,梅园小操场是他们与武大结缘的开始,也是离校多年后依旧挥之不去的记忆。  于我而言,也是如此。  我研究生入学那天,夏日的热辣在九月的武汉依旧保持着浓烈。因为研究生都住在远离武大校园的三环和宏博,于是,我提着行李,还没坐热宿舍的凳子就马不停蹄地奔向武大校内。武大真的好大,我一路洒汗狂奔,一路问着路边的学生:请问梅园操场在哪里呀?在热心小伙伴们的接力指路下,我终于来到了梅园操场。还
5G作为下一代移动网络技術,是支持党和国家互联网相关战略的重要技术基石。  十九大报告中曾多处提及互联网,比如“互联网建设管理运用不断完善”、“善于运用互联网技术和信息化手段开展工作”等等。在科研工作者的不懈努力下,5G也将很快走进我们的生活。  5G相比4G,有什么优势呢?首先是“更快”。在5G时代,用户手机的下载速率能够达到10Mbps。这意味着用手机观看NBA的超清直播,或者看在线电影的时候
三年的硕士生涯即将结束,而成为研三学生不过四个月左右的我,却已然经历了考博和求职两场大战——今年九月中旬忙完了考博,十月底等到了一个自己不愿接受的结果,于是迅速调整好心态加入秋招大军,当下已经收获了一个让自己颇为满意的Offer——而也正是在一切都尘埃落定之后,我才发现,自己在这整个过程中,收获了很多,关于学术、关于梦想、关于人生……  清华梦:不忘初心  我在研一寒假时确定要考博,目标院校、目标
从少年起,我一直想做一位作品激昂雄浑,受人尊敬的艺术家。从投考北京电影学院到开学前,我认知的动画专业,多是想象出来的样貌:兼具思想、艺术和前沿科技,学这专业应是最自由、最酷的一件事。但入学后,我居然不满意自己的专业!  北京电影学院所有专业,都建立在电影、影像艺术背景上。电影是现代文化工业的代表。既然带有“工业化”特点,专业学习必然强调团队、配合。我们所有专业课教师都会提醒同学注意团队合作,而不是
北京林业大学昆虫爱好者协会隶属于林学院,成立于2014年,发展至今已有300余名成员。  协会的特色活动包括野外昆虫采集、昆虫标本制作、昆虫知识科普活动等。每年十一、五一假期,协会都会组织成员前往鹫峰、虎峪进行野外昆虫采集活动,近距离观察昆虫。在每年迎来新成员后,协会会举办标本制作活动,并安排具有标本制作经验的成员进行现场教学,手把手教大家制作蝴蝶、甲虫等标本。  当非专业的协会成员在校园中发现感