招生合作
课程分类
您当前的位置:成都凯学网 >成都凯学网 >应用统计大数据学习经验分享-成都大数据培训机构

成都大数据学习网

应用统计大数据学习经验分享-成都大数据培训机构

发布时间:2020-06-23 13:35:00 已帮助:295人

应用统计大数据学习经验分享-成都大数据培训机构

应用统计大数据学习经验分享-成都大数据培训机构

应用统计大数据学习经验分享

  大数据时代背景下,有许多同学对应用统计大数据学习很感兴趣,这里成都大数据培训机构为大家分享一位同学的应用统计大数据学习经验,希望对学习应用统计大数据的同学有帮助。
  1、跨专业启蒙
  刚开始接触数据科学追溯于大二选修信息计算与科学双学位。当时本科修读了城市经济管理专业,只在地理数据处理(ArcGIS)和前端(JavaScript)上有一些经验,在好奇心驱使下参加了R语言大会,领略了数据科学家们的魅力,也尝试用R语言做了一些实验,之后由于兴趣开始在网上寻找Python资源,例如菜鸟教程、廖雪峰Python等等,前者简略大致只需要花几个小时时间即可对Python基础有一个全貌的了解,后者则需要花费较多的功夫但收获也是巨大的;笔者的启蒙教程为张宏伦直博生(现任职腾讯)的全栈数据工程师养成攻略,所谓启蒙就是为小白打开了新世界的大门,此教程从Python基础讲起,基本涵盖爬虫、数据库与后端、可视化、NLP、Web、ML&DL的全套学习路线,遗憾的是教程较早(为Python2)且全部为入门级教程,但对于笔者当时的学习帮助是的。之后进一步学习了MOOC上嵩天老师的爬虫系统教程与数据分析与展示教程。兴趣很重要哦。
  2、在校学习
  在研究生学校阶段跟随导师进一步学习了Python的详细基础教程,并以课堂展示的形式展现出来。期间参加了全国研究生数学建模竞赛(国二)、Kaggle(重在参与),逛了无数的Github和CSDN,写了三篇论文,也自学了Scala、Java语言,Spark、Flink集群架构,并且水了一些Keras、Tensorflow、Pytorch等DL框架。扪心自问,每一门语言或者技术都不出彩,只是出于兴趣想知道可以造出什么轮子。且作为交叉学科就是要有相应的觉悟,即跟计算机比统计,跟统计比计算机,但稍不留神就是都比不过。学习、讨论、质疑、写作、定位,机遇是给有准备的人。
  3、实习面试
  在学校呆了大半年,之后就面临找实习。当时心里没有一点底,也是通过各种渠道(主要是牛客网)去获取内推或招聘信息,刷了少量SQL和少部分LeetCode,但可能节点太早只收到了阿里(算法)的面试信息,准确的说次面试就献给了阿里。阿里共有五面:简历面、两轮技术面、高P交叉面和HR面,每面平均间隔一个月,非常磨人,简历面(20min)的时候就知道大概够不上,问了linux及通信底层(三次握手、四次挥手)的基础知识(但这些很多都答不上来),之后开始手撕反转链表,勉强写出来一种算法,之后开始等待二面。过程中从师兄师姐那里获取到一个百度远程面试机会(数据RD),之后同样开始准备。一面(2h)上来就给了coding链接,手撕快排、Python版的MapReduce和spark版的wordcount源码,同时还问了假设检验、AB测试的业务类知识,相对来说比较熟悉;二面(30min)主要询问机器学习算法包括Kmeans算法流程、Bagging和Boosting的对比以及基础的LSTM流程绘制,没有网传手推公式那么夸张,还是看具体部门吧;之后两轮主要是业务面和Manager面,相比较阿里少一轮面试,感觉不是太难(去了之后才知道是当时比较缺人)。待百度面完且敲定好实习时间之后阿里才给二面通知,那时候已经心不在焉了,二面凉凉。要百折不挠,勇往直前。
  4、实习经历
  之后就是不太漫长的实习岁月,实习过程中如果觉得兴奋说明还很早,coding代表着枯燥,业务代表着繁琐,工作本身并不轻松。百度实习是标准的1075(除了周三晚上的讨论班),时间相对宽松,因此中间穿插了很多复(预)盘(习)机会,首先是陆续刷完Leetcode高频和前100道,之后翻阅牛客上的面经汇总以及经验帖,最后就是到处面试了。在北京陆续面了字节跳动(数分&算法,宇宙条不是盖的)、昆仑万维(数据挖掘)、阿里(算法)等,9.1提前结束了实习回武汉开始了大规模笔试面试。各个大中小厂都会在武汉设立面试点或者先远程再跨区域现场面,当时的行业选择主要是互联网,其次是银行等。互联网偏向北上广深杭,技术和加班优先,想要获得快速提升的可以考虑;银行遍地都是,现在也开始重视技术,相对轻松,本地或者稳定优先的可以考虑。踏踏实实,好好做事做人。


相关资讯