作者:MaxHo
链接:
https://www.zhihu.com/question/27828225/answer/868731646来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
20200215
在最底下更新了一下最后做project的经历,因为某学弟说他第二学期都开始了一半了我还没更新哈哈哈。生活篇真的很多还是留着下次再说吧哈哈。(这篇东西写完后感觉应该是一个BA学生的海外学习体验。。跟兰卡解读体验好像有点偏题了)
在这里说一下楼主后来找工作的经历。。。欢迎各位海归们DM我大家分享一下辛酸感受啊哈哈。楼主是广州人所以回国后选择留在了南方(虽然都住20多年了但还是要吐槽一下珠三角超潮湿的气候),目前在深圳某家被称做”东南亚小腾讯“的电商外企做数据分析,学弟学妹们明年学有所成之后不如考虑考虑哈哈。
当时做project的公司其实本来说好了可以实习转正留在伦敦(谈完pkg的阶段)。。后来8月左右还是被部门老总鸽了,给出的理由是不愿意sponsor外国人,好吧那其实楼主也没辙。只有签合同和给签证才是硬道理,天下都一样。每年能转T2工签的没有多少人,我后来得知后梅姨时代2021届毕业的同学们都可以无条件获得工签其实是无限羡慕,只能说自己天时地利人和都没占上,所以也开始调整自己备战国内秋招,然后就开始直到11月的漫长的焦虑。
其实出来找data方向的工作整体来说就是以下3种:
很多人说的Data Scientist,通常是互联网行业的公司,主要的工作是做一些算法和技术上的东西,比如说部署机器学习分析用户,改进optimisation的算法等等 “fancy stuff”。代码要求较高,最好是有算法背景。BA会涉及一部分,比如forecasting,optimisation,data ming等等。
Data Engineering / Warehousing 等等,主要也是互联网,主要是做一些数据仓库构建,数据产品,app埋点统计之类的工作,这种是技术岗,BA基本不会涉及。主要涉及的spark,hive
,kafka等大数据技术,java,python等编程语言 etc.
Data Analyst / Analytics等等,遍布各个行业,digital程度比较高的互联网、快消、咨询、会计所等等都会有这样的工作,不考虑学生本身的背景,只谈BA这个专业的学习内容的话,这种我觉得是最对口的。工作以做数据report、dashboard、分析项目、公司的decision data support为主。主要工具有python、R、SQL、Excel / Googlesheet 、PPT 等等。楼主现在从事的也是这样的工作。以上三种工作的所有部门齐全并相互合作的话,大概就能给公司组建一个强有力的“数据中台”,其中DE会处于比较上游的位置(收集数据,做数据仓库,做公司内部的数据产品),data scientist 和 analyst 在下游面对不同方向延伸,scientist面向研发、产品等等(比如做图像or影片识别嵌入产品之中),analyst面向公司的业务人员比如运营、销售、manager等等(比如多维度分析生意、用户画像、项目分析)。
然后楼主从学校出来到industry中找工作打拼就发现,其实英国学习的东西和国内会有gap,回国找工作会有点水土不服。很多analyst的工作需求最多的技能其实是SQL和Excel,其次为Python和PPT,这和很多学校内以R为主的教学不同(可能和R本身比较多学术界的人在开发包有关)。楼主正式入职后用得最多的是SQL拉数据,然后是Google sheet做分析和汇报,如果数据太大就用Python处理。很多人会觉得“SQL不就是拉数据吗?关键是后面分析的过程”所以就忽略了这个技能,但其实很多时候拉数据的同时就已经顺路做了统计分析了,而分析思路就体现在拉数据的方式上,这个非常重要。
于是乎当时刚回国兴冲冲的楼主就投了很多类似data scientist
的岗位,然后大量笔试挂,进了技术面也很难通过,每天都跟秋招的小伙伴传播焦虑。慢慢了解到data的工作岗位,觉得自己技能不对方向不对,之后才找到analytics这个方向,然后针对性地准备,自学SQL(其实只要逻辑思维过关,SQL这个东西学起来很简单)、看书认识统计指标等等。Python、统计模型和Excel等技能兰卡已经帮你equip好了,Forecasting的时间序列分析也会是一个需要的点,在面试中自豪地说出来自己精通数据统计吧!(当然前提是学完不要忘了。。。)
已下为兰卡学习篇:
——————————————————
当年我入学之前也在
@老莫Moly下面评论问了好多问题啊哈哈。毕业回来就贡献一下,从我的生活经历出发介绍一下兰卡吧。希望各位准备要来兰卡的学弟学妹们可以对学校有一个更好的认识。
先说一下我的情况,我是本科在中山大学读的应用气象学
,然后18/19届转专业到兰卡读了MSc Business Analytics。这个专业属于Management Science这个Department下,同系的专业还有Marketing Analytics 还有 Logistic & Supply Chain Management。其实系下面还有好几个专业,但是这三个专业是一起上课的,所以本文关于学习的部分可能只能介绍到我比较熟悉的这几个专业。(所以我其实基本可以算
@老莫Moly的学弟?)
本文基本上可以当作老莫的补充更新版来看。过去的两三年兰卡也发生了一些变化,希望能给准备去的小伙伴们一些参考,也记录一下我在兰卡的“精彩”生活。然后主要分为生活、学习、找工作三个部分。
I. 生活【在这里先占个坑,想起来就更新...】
这部分估计是比较多兰卡其他专业的同学们想看的。。但好多,楼主有点懒,晚点更新哈
II. 学习
在英国其实许多人都会说学习强度比较大。我认为这个大其实是相对而言的,比如说在国内大学本科大一的时候就只有寥寥几门课,有一些还逃掉了,这么来比的话兰卡的学习任务是十分繁重。不过其实我个人体验下来,整体上是可以应付的,如果能够做好时间管理也不至于熬夜通宵赶deadline。不过当然也有见过同班同学连续通顶三晚赶ddl的就是了...
先说说我这个专业的整体情况。10月开学先是一个星期welcome week,这个星期会组织各种学校规章制度、注意事项的讲座,还有安排时间注册警局和GP,还会有专业每门课老师来介绍,周五会组织一次专业或者系的出游(免费的,记得要去,可以多认识点朋友)。这个星期记得勇敢点多和别人交流噢,不然到后面大家各种小圈子以后就交往越来越少。我是在开课前一天才从广州飞到曼城,时差还没倒过来,整个人处于混乱状态就浑浑噩噩过完第一周了。建议有条件的小伙伴还是可以提前几天过来先适应一下。
Welcome过了以后,第一个学期10个星期正课开始。我的专业第一个学期4门必修课,其中三门是和Department里面另外两个专业一起上的。整体上来说到第五周左右会开始有期中考试或者小组作业,然后期末的时候也会有考试,最后大的考试和作业是在放完圣诞假回来以后。学期开头的时候基本上是不太忙的(这个时候周末多去玩一下或者参加学校不同College组织的Day Trip),到期中之后就开始有一点事要做,期末和放假回来考试前会压力比较大。
我那时BA一个班大概30来人,约一半是中国人,听说下一届开始扩招人数翻了一倍(要找找学弟学妹考证一下)。BA有一个很好的就是第三学期有机会能去不同的client公司做不同的project,其实就类似于实习,这是一个很好的经验,写在CV上可是大大加分。下面一门门课去介绍一下BA这个专业。先说第一学期。
Problem Solving Skills for Consultant (BA和logstic
一起上)主要是由两名教授说一些consultancy里面的思考方式以及解决问题的办法。比如说一些关于公司文化,关于不同stakeholders,six hats methods等等。所以其实从课程内容来看是比较理论的,然后上课的时候也比较无聊我看到很多人都在做别的事情,然后老师问问题也没什么反应就是了。这门课没有考试,我们当时期中的时候是帮当地的一家船运公司做了一个case study,4人groupwork
。这个不算分的,然后pre的好的小组是直接去给CEO再pre一次。这个case study不算分。
然后期末占60%的也是需要一个groupwork,当时做的是分析一个英国政府的campaign,要求都会有详细的文件给到学生,最后要上交ppt和pre的影片。当时楼主带领着整个小组完全放飞自我没有跟着评分要求去做,导致最后这部分只有30多分...看到的时候我都惊呆了!发邮件给老师,老师给了非常长的feedback说的我心服口服。。。后来发现学校作业系统出了bug把所有人都当晚交了扣了10分。然后我就顺利的带领全班同学拿回了十分,然后我就成功达到了40分,微笑面对人生。
另外一个占40%的是individual作业,要学生写4篇Learning Journal,这个东西其实就是你在课程上学到了什么有什么思考什么感受之类的。其实我写完以后也不太知道自己写了什么东西。不过最后分数出来成功把分数拉回来及格了,好吧还好过了。。
2. Statistics
统计学,基本上第一个学期挂科的同学就集中在这里了。课程内容分为两个部分:第一部分是类似国内本科读的统计,涵盖的内容都是不同的distribution,假设检验,p-value
,t-test, f-test等等,然后还有几个non-patamatric的test只要求会就好,不需要懂计算。这一部分是由一个老教授教,很多人说他上课很困然后经常听到睡着,或者是一开始能跟上后面跟不上了就干脆不听了。其实我觉得如果本科有学过这门课不会很难,没学过的话其实也不是难,但是内容很多,买的教材原价53镑(有机会多收师兄师姐的,我们今年基本上就是自己买的书,肉痛),一次课两个小时就可以飞奔3章书。对于没基础的同学来说这个知识量是很overwhelming的。期末考试占50%,在放完假回来考,开卷,考的只包括这一部分,印象中好像是3大题。基本上题型跟平时作业、往年考卷一样,这些做好了能拿50-60分一定是没问题的,但考的题稍微有点灵活,会要求掌握不同知识点然后变着来运用,这一部分如果掌握得好就可以拿70多甚至80分了。但事实是很多人挂了哈哈。
这门课上到一半会换一个年轻的俄罗斯帅哥老师来教Linear Regression,他好像是16or17年从兰卡phd毕业的,这位帅哥老师后来也成为了我第三学期project的supervisor,人真的非常ncie。这一部分就是只教线性回归,不同的假设,OLS,残差分析
,variable selection。还会有涵盖到maximum likelihood estimate等等为下学期打好基础。从部分的课程会有lecture和workshop,workshop就是上机用SPSS去实践,然后到学期末老师会开始教如何用R进行分析。R语言也是为下学期各种数据分析类的课程打好基础。线性回归这部分会要求做一份作业,占50%,放完假回来交。作业就是两大题然后需要自己分析变量、建模、解析结果等等。这一部分据说也是很多人最后交之前很suffer,各种熬夜通宵不停找同学老师问问题。然后最后结果出来的话其实蛮多人60多70多分的,就结果很不错啦。
3. Introduction to Business Analytics & Operational Research
这门课其实就是运筹学基础
,线性规划,动态规划,随机过程模拟,库存控制等等。会有一个期中考20%,期末交一份作业20%,放假回来考试60%。期中考是考当时已经学到的内容,不太多,但应该是大家去到uk的第一门考试,好好复习啊。因为题目很少,所以一道题会占20多30分,做错两题就不及格了。期末的一份作业我印象中也是做一个case study,帮客户解决一个quantitative的管理问题,这个题目可能会要求涉及到之前学的多方面运筹学内容,比较综合运用,是一个非常好的锻炼。然后最后的考试是4大题选3,也是开卷的。但实话实说,开卷其实也没什么用,如果不会算的题目还是做不出来,时间也非常紧。好在题目也是基本和过往试卷或者作业雷同,可以提前做好充分准备。
4. Spreadsheet Modelling
第一学期最良心课程没有之一。老师自己编的notes,全部打印好装订给学生,非常非常详细。从最开始的excel基本操作,再教函数的运用,到后面VBA,还有构建dashboard,一次lecture配一次workshop手把手教学。基本上每个人最后都成为Excel大师哈哈(有点夸张)。老师也很风趣幽默,整天喜欢夸自己踩单车穿越多少多少山峰。一个期中小组作业40%,一个期末个人作业60%,都是需要用函数或者VBA去做一些计算,老师会把题目放在表格里面,然后学生把答案放进去。但是要求全部都是可变的。基本上所有人最后都能做出来一个完全动态的表格,修改一个数字会整个文件变动,答案的格子也会变。老师人很好,给分高,学到的知识真的非常实用,良心课程。
上完10周课第一学期就结束了,圣诞假期4周,考虑到放假回来的两周就要交作业和考试,建议同学们还是不要去玩太久(比如说玩3周剩1周复习,这样可能就有点作死了,亲眼目睹过这样的同学回来之后的惨烈)。 当时我是去伦敦玩了几天,然后回来过圣诞,然后复习准备考试。圣诞节那三天伦敦是几乎整个瘫痪掉,公共服务都几乎停摆那种。新年的时候去了Edingburgh看了烟花,住到了很nice的Airbnb,倒数人挤人,第一次见到uk有这么多人,想起来也是很开心啊。
然后,考完试,交了作业,第二个学期来了。这个学期BA的话是4门必修课里面选3门上,再从一大堆选修课选3门上,一共6门课。这么多课也有对应的考试和作业量。。所以这学期是真的比较辛苦的,线性回归的帅哥教授早在第一个学期末就说了“You think this is overwhelming?Wait for next term."。这学期因为课程可选的类型有很多,主体上可以选成偏向strategic consulting那种,或是偏向data science应用的两个方向。楼主选的几乎都是数据分析相关的课程。会涵盖到不同的编程,统计模型,排队理论
随机过程,最优化策略,时间序列分析,机器学习原理等方面。学得好的话就求职可以走数据分析,数据科学家
等等的路线(当然光靠课本知识可能不够,但有一门课会给到很好的资源可以自学)来简单说一下我选的这几门课。先是必修部分:
5. Computer Simulation
用一个叫做Witness的流程模拟软件,这个软件有挺好的UI、逻辑和数据统计功能,所以其实用起来有点像玩乐高一个个东西放上去,最后输出的结果也很方便导出分析
。但是这个软件很贵,所以除了学校好像外面基本没什么公司买了使用的。这门课其实就不太实用。老师上课也是理论+实践,考核的方式是一份小组作业,交一个模拟医院病人看病的模型和分析结果的report,还有一个闭卷考试,考的模拟的一些理论。小组作业不太难,但分也不高,大概都是60多分上下。考试偏难,需要背的理论很多,老师也不画重点,有一部分还需要自己计算。我其实在第三学期做project的时候也想用过一个流程模拟来解决一个问题,但是witness太贵了公司也不愿意给钱。开源的当时没找到有图形界面方便实用的。所以基本上这门课就没什么用了。
6. Optimisation & Heuristic
上学期BA&OR的同一个老师,这个会深入讲解线性规划,非线性规划
,一些比较常见的Optimizer (Gradient Descent,各种各样Local Search,牛顿法
等等)。这些都是统计建模难以避开的一些部分,跟机器学习相辅相成(虽然不用自己写,但总得了解这些算法的思想)。然后一份作业一个考试,作业用的是LINGO做线性规划,但老师当时说的是做不同的heuristic,碍于教课进程不够快所以考线性规划,以后不确定会不会变。考试主要考的也是线性规划的各种问题,比如整数规划,simplex method,dual simplex等等。总的来说老师讲课有点无聊,但是各种算法也是比较实用的,不过很容易考完就忘了。
7. Stochastic Modelling
上学期统计的老教授教,讲课也是有点昏昏欲睡。主要涵盖了risk mgt,queueing theory,markov chain的一些理论。这个risk mgt
跟金融的不一样,主要是管理上出现意外的风险。考核同样是考试和作业。都是放假回来教,考试好像4选3,然后包括全部内容。作业是一个老师开发的DoS界面的小软件做一些queueing的模拟,根据公司业务的queue来优化人员安排,写一份报告。当时写这份报告的时候感觉其实更像是optimisation
的内容。。。不是很难,考试也是记得复习作业和往年试卷即可,但当时大家出分好像都是50多60分不太高。
8. Problem Structuring
这门课我没选,但风评很好,据说是上一学期Problem Solving的进阶,听朋友说老师教的很有条理。做consulting
的时候很有用,我建议可以考虑一下选这门,毕竟computer simulation
没什么用。。。
接下来就是说一下楼主选的选修课,因为我从去之前就打算做数据分析这方向,所以选的都是比较“硬核”的课程。
9. Forecasting
时间序列分析,用统计模型去预测未来,老师是一个德国人,讲课也很风趣幽默。但是一次课教的量非常大,然后可能大家都没接触过所以都做得有点困难。从简单地moving average,到Exponential Smoothing和变体,ARIMA模型(上世纪兰卡的教授发明了ARIMA手动选择parameters的Box Jenkins Method),Regression。最后会简单延伸一下一些比较高级的TBATS,机器学习和神经网络的预测模型等等。时间序列分析
算是现在数据分析里面一个比较大的分支吧,然后用的办法都是“统计学家”创建的模型。其实整体的思想和运用机器学习做classification是一致的。这门课跟下面会说到的Data Mining相辅相成。考核是一份作业100%,一篇报告定生死。不过不用担心,老师会给很详细的评分指南,所以只要对着指南做基本上都还是可以的,最后大家都分数不错,60多分的很多,所以不用担心。可能就是做的过程因为都需要R编程,不熟悉编程的可能会有点痛苦。(就是这门课交作业前见过有朋友60小时不睡觉狂赶的。。。)
10. Introduction to Python
Python入门,然后介绍用Pandas,Numpy,Matplotlib或者Seaborn等等。这门课比较烦的是刚开始两周就要交一个作业,然后要期中考,期末还得交一个作业。说实话因为都是上机workshop,然后人很多(跟其他department的比如quantitative finance等等一起上课),老师讲课其实挺困难的,所以其实很需要靠自己回去学习一些函数的运用。第一份小作业做的是一个关于market return
的几个函数和主程序,不太难,但是老师很刁钻,因为他用程序自动去看你写的代码,稍微格式有点不对就某部分全错了,分不高。期中考就是两个小时坐在电脑前限时编程,纸质材料开卷但不能上网查文档,主要考察对pandas的一些函数的运用,记得就记得,不记得就不记得坐在那里也想不出来哈哈。但老师比较手下留情,最后期中考分挺高的。期末考是用python自己写一个关于Vehicle Routing Problem的Optimisation算法,是不是很熟悉?没错就是上面必修课里面有的,基本上就是写一个简单的local search的算法,写高级一点的比如simulated annealing会加一点点分这样。这个作业也是最后大家都挺高分的。整体来说这门课教的不太好,但是回去自学的话,给分很高。
11. Data Mining
大名鼎鼎,很多人挂的课。。。老师是个希腊人,回邮件可能要等10天甚至不回。这门课从怎么样做exploratory analysis开始,教大家用不同的可视化图去分析。然后到机器学习基础,比如logstic regression
,decision tree,PCA等等。中间还会有穿插一些classification问题的一些基础(information theory),怎么判断模型好不好等等。学的时候已经很多人听不懂,关键是考核方式也是一份占100%的作业。作业给了一个dataset,做的是credit card fraud
(Kaggle上很经典的数据),里面就两个问题,一个问题40分一个问题60分,然后就什么都没有了。。。之后大家就凭丰富的创造力和“团队协作”能力一起做作业,但最后据说很多人及格线上徘徊和不及格的。总的来说,其实学的东西是非常有用的,logstic是非常非常常见以及容易大规模部署的classification算法,decision tree也是random forest等算法的基础,PCA可以用于clustering
。但真的那份定生死的作业实在太难理解了,老师教的也不太好,所以导致学习结果可能不太好。
但是这门课会附带一个Datacamp的在线网课平台的Premium会员,如果我们自己买那可是25英镑一个月的,这个平台上有大量的python,R,SQL的数据分析和建模的课程,这些可以趁过期之前多多去看一下。也可以补一下缺失的SQL这一块(国内的公司很多很多要求SQL)。
以上就是第二学期了,这个学期会非常的忙碌,过得非常快,在各种各样的ddl
中不知不觉就没了。之后又是放一个easter break
(好像三个星期还是4个),回来就考试交作业。之后会有一天是老师来给大家做第三学期项目的介绍,给几天大家回去思考要选什么项目。这里有两种项目,一种是去帮外面的客户解决一个实际问题的,这些很多是要求去到公司上班的,其中有大公司比如说有Heathrow,Amazon,Heineken。这些都是非常抢手的项目,按照个人选择和成绩排序来分配。还有一种是在学校给老师做一个research项目,也包括很多很多方面。公司项目是需要当时成绩达到60%以上才可以选,有一些项目也会要求之前选了xxx课程(比如当年就很多要求simulation和forecasting),有几个志愿可以填,然后按成绩分配。当时已经很多人选不到自己的前3志愿,可想而知扩招之后竞争有多激烈。
12. Dissertation
价值60个学分(1/3呢,毕业项目定生死),在第二学期后summer的大概5-9月之间进行,easter break之后会有一两个星期选择,期间公司的人或老师会有pre来介绍一下项目,也有上文提到的填志愿和筛选。一共有两种项目可以选:
一种是Company Based也就是帮外面的一些公司解决某个问题,会分配一到两个学专业的导师作为supervisor。导师不会太过插手你的项目,一般只充当提出建议、帮你解决一些和client交流问题的辅助角色,当然如果项目进度太落后也会小小来提醒一下。这个项目非常好的一点就是真的会有个外面公司的问题需要我们去解决,虽然老师一再强调不是实习,但实际上很多都要去到公司当地上班,一个人体验找房子(学校会帮忙)、搬家、在英国甚至欧洲上班、和老板喝咖啡吹水聊天等等,所以其实跟实习也没差很远啊哈哈。一般要搬出去的都是大概2个半月左右的时间,也有的项目可以base在学校然后每一两周就来回穿梭于公司和学校之间(楼主的项目就是这样)。整个summer的经历充满了新奇和挑战,第一次在伦敦穿西装上班啦,蹭了一下公司报销的酒店啦,在公司那种“混乱”的环境中做数据分析啦,跟很多同事交流经历等等。这种project会需要提交一份focus在client提出的问题的解决方案的report,professional & academic都要兼顾,还需要提交另外一份短的只focus在academic上的report,再在整个项目基础上写一个简单的executive summary,这些东西合起来作为dissertation交给客户和学校。通常academic
的那一份都是挑第一份report中的某一两点作更多学术研究上的讨论。整个下来其实3 4个月真的很充实,真的是老师说的amazing experience,不过还是那句话,时间管理要做好,因为client和supervisor
都会不定期来问进度,最后也会根据整个过程的表现打分,所以不能拖到最后再做。 未来的学弟学妹们要好好表现哟。我毕业的时候回去跟programme coordinator聊天,她说未来学生多了可能都需要两人做一个project ,不过也希望兰卡未来有更强的industry connection可以给学生拉到更多project哈。
另一种是Research Based比较偏向研究型,推荐未来想申请phd
的同学们选这种project。这种就是国内比较常见的论文方式,导师给出几个题目候选,然后大家分配好题目后就写学术论文。楼主在回国以后才意识到,其实company based的project真的非常职业导向,整个会对简历加很多分,也会多了很大段经历作为面试谈资,输出的report也比较像职场上汇报的格式,academic的那一部分短report其实在不太足够用于研究一个算法啊模型等题目,自然在申请phd上竞争力是不如research based的项目。反之亦然,research based会给学术经历增添一笔,但自然在找工作中的加分就小于company based啦。但research的工作量楼主认为除了不用travel到company site以外不亚于company report。当时楼主的好朋友就在旁边做一个research边做边哭,ddl那天楼主最后半个小时跑步穿越整个学校帮她交纸质论文(中间省略万字故事。。。),也是很难了。
楼主当时交论文ddl的两天后学校宿舍就到期了,所以其实最后那个星期一边收拾东西一边改论文一边和朋友吃喝玩乐一边感伤告别,交完后就匆匆搬离准备打飞机离开UK,心情还是蛮复杂的。所以其实最好就是论文提前点弄完,最后的时光可以多点留给准备前往世界各地的朋友,多点留给UK没见过的风光,多点留给学习了一年的自己,算是给这一年的经历画上圆满的句号。