作者:MaxHo
連結:
https://www.zhihu.com/question/27828225/answer/868731646來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。
20200215
在最底下更新了一下最後做project的經歷,因為某學弟說他第二學期都開始了一半了我還沒更新哈哈哈。生活篇真的很多還是留著下次再說吧哈哈。(這篇東西寫完後感覺應該是一個BA學生的海外學習體驗。。跟蘭卡解讀體驗好像有點偏題了)
在這裡說一下樓主後來找工作的經歷。。。歡迎各位海歸們DM我大家分享一下辛酸感受啊哈哈。樓主是廣州人所以回國後選擇留在了南方(雖然都住20多年了但還是要吐槽一下珠三角超潮濕的氣候),目前在深圳某家被稱做」東南亞小騰訊「的電商外企做數據分析,學弟學妹們明年學有所成之後不如考慮考慮哈哈。
當時做project的公司其實本來說好了可以實習轉正留在倫敦(談完pkg的階段)。。後來8月左右還是被部門老總鴿了,給出的理由是不願意sponsor外國人,好吧那其實樓主也沒轍。只有簽合同和給簽證才是硬道理,天下都一樣。每年能轉T2工簽的沒有多少人,我後來得知後梅姨時代2021屆畢業的同學們都可以無條件獲得工簽其實是無限羨慕,只能說自己天時地利人和都沒占上,所以也開始調整自己備戰國內秋招,然後就開始直到11月的漫長的焦慮。
其實出來找data方向的工作整體來說就是以下3種:
很多人說的Data Scientist,通常是網際網路行業的公司,主要的工作是做一些演算法和技術上的東西,比如說部署機器學習分析用戶,改進optimisation的演算法等等 「fancy stuff」。代碼要求較高,最好是有演算法背景。BA會涉及一部分,比如forecasting,optimisation,data ming等等。
Data Engineering / Warehousing 等等,主要也是網際網路,主要是做一些數據倉庫構建,數據產品,app埋點統計之類的工作,這種是技術崗,BA基本不會涉及。主要涉及的spark,hive
,kafka等大數據技術,java,python等程式語言 etc.
Data Analyst / Analytics等等,遍布各個行業,digital程度比較高的網際網路、快消、諮詢、會計所等等都會有這樣的工作,不考慮學生本身的背景,只談BA這個專業的學習內容的話,這種我覺得是最對口的。工作以做數據report、dashboard、分析項目、公司的decision data support為主。主要工具有python、R、SQL、Excel / Googlesheet 、PPT 等等。樓主現在從事的也是這樣的工作。以上三種工作的所有部門齊全並相互合作的話,大概就能給公司組建一個強有力的「數據中台」,其中DE會處於比較上游的位置(收集數據,做數據倉庫,做公司內部的數據產品),data scientist 和 analyst 在下游面對不同方向延伸,scientist面向研發、產品等等(比如做圖像or影片識別嵌入產品之中),analyst面向公司的業務人員比如運營、銷售、manager等等(比如多維度分析生意、用戶畫像、項目分析)。
然後樓主從學校出來到industry中找工作打拚就發現,其實英國學習的東西和國內會有gap,回國找工作會有點水土不服。很多analyst的工作需求最多的技能其實是SQL和Excel,其次為Python和PPT,這和很多學校內以R為主的教學不同(可能和R本身比較多學術界的人在開發包有關)。樓主正式入職後用得最多的是SQL拉數據,然後是Google sheet做分析和彙報,如果數據太大就用Python處理。很多人會覺得「SQL不就是拉數據嗎?關鍵是後面分析的過程」所以就忽略了這個技能,但其實很多時候拉數據的同時就已經順路做了統計分析了,而分析思路就體現在拉數據的方式上,這個非常重要。
於是乎當時剛回國興沖沖的樓主就投了很多類似data scientist
的崗位,然後大量筆試掛,進了技術面也很難通過,每天都跟秋招的小夥伴傳播焦慮。慢慢了解到data的工作崗位,覺得自己技能不對方向不對,之後才找到analytics這個方向,然後針對性地準備,自學SQL(其實只要邏輯思維過關,SQL這個東西學起來很簡單)、看書認識統計指標等等。Python、統計模型和Excel等技能蘭卡已經幫你equip好了,Forecasting的時間序列分析也會是一個需要的點,在面試中自豪地說出來自己精通數據統計吧!(當然前提是學完不要忘了。。。)
已下為蘭卡學習篇:
——————————————————
當年我入學之前也在
@老莫Moly下面評論問了好多問題啊哈哈。畢業回來就貢獻一下,從我的生活經歷出發介紹一下蘭卡吧。希望各位準備要來蘭卡的學弟學妹們可以對學校有一個更好的認識。
先說一下我的情況,我是本科在中山大學讀的應用氣象學
,然後18/19屆轉專業到蘭卡讀了MSc Business Analytics。這個專業屬於Management Science這個Department下,同系的專業還有Marketing Analytics 還有 Logistic & Supply Chain Management。其實系下面還有好幾個專業,但是這三個專業是一起上課的,所以本文關於學習的部分可能只能介紹到我比較熟悉的這幾個專業。(所以我其實基本可以算
@老莫Moly的學弟?)
本文基本上可以當作老莫的補充更新版來看。過去的兩三年蘭卡也發生了一些變化,希望能給準備去的小夥伴們一些參考,也記錄一下我在蘭卡的「精彩」生活。然後主要分為生活、學習、找工作三個部分。
I. 生活【在這裡先佔個坑,想起來就更新...】
這部分估計是比較多蘭卡其他專業的同學們想看的。。但好多,樓主有點懶,晚點更新哈
II. 學習
在英國其實許多人都會說學習強度比較大。我認為這個大其實是相對而言的,比如說在國內大學本科大一的時候就只有寥寥幾門課,有一些還逃掉了,這麼來比的話蘭卡的學習任務是十分繁重。不過其實我個人體驗下來,整體上是可以應付的,如果能夠做好時間管理也不至於熬夜通宵趕deadline。不過當然也有見過同班同學連續通頂三晚趕ddl的就是了...
先說說我這個專業的整體情況。10月開學先是一個星期welcome week,這個星期會組織各種學校規章制度、注意事項的講座,還有安排時間註冊警局和GP,還會有專業每門課老師來介紹,周五會組織一次專業或者系的出遊(免費的,記得要去,可以多認識點朋友)。這個星期記得勇敢點多和別人交流噢,不然到後面大家各種小圈子以後就交往越來越少。我是在開課前一天才從廣州飛到曼城,時差還沒倒過來,整個人處於混亂狀態就渾渾噩噩過完第一周了。建議有條件的小夥伴還是可以提前幾天過來先適應一下。
Welcome過了以後,第一個學期10個星期正課開始。我的專業第一個學期4門必修課,其中三門是和Department裡面另外兩個專業一起上的。整體上來說到第五周左右會開始有期中考試或者小組作業,然後期末的時候也會有考試,最後大的考試和作業是在放完聖誕假回來以後。學期開頭的時候基本上是不太忙的(這個時候周末多去玩一下或者參加學校不同College組織的Day Trip),到期中之後就開始有一點事要做,期末和放假回來考試前會壓力比較大。
我那時BA一個班大概30來人,約一半是中國人,聽說下一屆開始擴招人數翻了一倍(要找找學弟學妹考證一下)。BA有一個很好的就是第三學期有機會能去不同的client公司做不同的project,其實就類似於實習,這是一個很好的經驗,寫在CV上可是大大加分。下面一門門課去介紹一下BA這個專業。先說第一學期。
Problem Solving Skills for Consultant (BA和logstic
一起上)主要是由兩名教授說一些consultancy裡面的思考方式以及解決問題的辦法。比如說一些關於公司文化,關於不同stakeholders,six hats methods等等。所以其實從課程內容來看是比較理論的,然後上課的時候也比較無聊我看到很多人都在做別的事情,然後老師問問題也沒什麼反應就是了。這門課沒有考試,我們當時期中的時候是幫當地的一家船運公司做了一個case study,4人groupwork
。這個不算分的,然後pre的好的小組是直接去給CEO再pre一次。這個case study不算分。
然後期末佔60%的也是需要一個groupwork,當時做的是分析一個英國政府的campaign,要求都會有詳細的文件給到學生,最後要上交ppt和pre的影片。當時樓主帶領著整個小組完全放飛自我沒有跟著評分要求去做,導致最後這部分只有30多分...看到的時候我都驚呆了!發郵件給老師,老師給了非常長的feedback說的我心服口服。。。後來發現學校作業系統出了bug把所有人都當晚交了扣了10分。然後我就順利的帶領全班同學拿回了十分,然後我就成功達到了40分,微笑面對人生。
另外一個佔40%的是individual作業,要學生寫4篇Learning Journal,這個東西其實就是你在課程上學到了什麼有什麼思考什麼感受之類的。其實我寫完以後也不太知道自己寫了什麼東西。不過最後分數出來成功把分數拉回來及格了,好吧還好過了。。
2. Statistics
統計學,基本上第一個學期掛科的同學就集中在這裡了。課程內容分為兩個部分:第一部分是類似國內本科讀的統計,涵蓋的內容都是不同的distribution,假設檢驗,p-value
,t-test, f-test等等,然後還有幾個non-patamatric的test只要求會就好,不需要懂計算。這一部分是由一個老教授教,很多人說他上課很困然後經常聽到睡著,或者是一開始能跟上後面跟不上了就乾脆不聽了。其實我覺得如果本科有學過這門課不會很難,沒學過的話其實也不是難,但是內容很多,買的教材原價53鎊(有機會多收師兄師姐的,我們今年基本上就是自己買的書,肉痛),一次課兩個小時就可以飛奔3章書。對於沒基礎的同學來說這個知識量是很overwhelming的。期末考試佔50%,在放完假回來考,開卷,考的只包括這一部分,印象中好像是3大題。基本上題型跟平時作業、往年考卷一樣,這些做好了能拿50-60分一定是沒問題的,但考的題稍微有點靈活,會要求掌握不同知識點然後變著來運用,這一部分如果掌握得好就可以拿70多甚至80分了。但事實是很多人掛了哈哈。
這門課上到一半會換一個年輕的俄羅斯帥哥老師來教Linear Regression,他好像是16or17年從蘭卡phd畢業的,這位帥哥老師後來也成為了我第三學期project的supervisor,人真的非常ncie。這一部分就是只教線性回歸,不同的假設,OLS,殘差分析
,variable selection。還會有涵蓋到maximum likelihood estimate等等為下學期打好基礎。從部分的課程會有lecture和workshop,workshop就是上機用SPSS去實踐,然後到學期末老師會開始教如何用R進行分析。R語言也是為下學期各種數據分析類的課程打好基礎。線性回歸這部分會要求做一份作業,佔50%,放完假回來交。作業就是兩大題然後需要自己分析變數、建模、解析結果等等。這一部分據說也是很多人最後交之前很suffer,各種熬夜通宵不停找同學老師問問題。然後最後結果出來的話其實蠻多人60多70多分的,就結果很不錯啦。
3. Introduction to Business Analytics & Operational Research
這門課其實就是運籌學基礎
,線性規劃,動態規劃,隨機過程模擬,庫存控制等等。會有一個期中考20%,期末交一份作業20%,放假回來考試60%。期中考是考當時已經學到的內容,不太多,但應該是大家去到uk的第一門考試,好好複習啊。因為題目很少,所以一道題會佔20多30分,做錯兩題就不及格了。期末的一份作業我印象中也是做一個case study,幫客戶解決一個quantitative的管理問題,這個題目可能會要求涉及到之前學的多方面運籌學內容,比較綜合運用,是一個非常好的鍛煉。然後最後的考試是4大題選3,也是開卷的。但實話實說,開卷其實也沒什麼用,如果不會算的題目還是做不出來,時間也非常緊。好在題目也是基本和過往試卷或者作業雷同,可以提前做好充分準備。
4. Spreadsheet Modelling
第一學期最良心課程沒有之一。老師自己編的notes,全部列印好裝訂給學生,非常非常詳細。從最開始的excel基本操作,再教函數的運用,到後面VBA,還有構建dashboard,一次lecture配一次workshop手把手教學。基本上每個人最後都成為Excel大師哈哈(有點誇張)。老師也很風趣幽默,整天喜歡誇自己踩單車穿越多少多少山峰。一個期中小組作業40%,一個期末個人作業60%,都是需要用函數或者VBA去做一些計算,老師會把題目放在表格裡面,然後學生把答案放進去。但是要求全部都是可變的。基本上所有人最後都能做出來一個完全動態的表格,修改一個數字會整個文件變動,答案的格子也會變。老師人很好,給分高,學到的知識真的非常實用,良心課程。
上完10周課第一學期就結束了,聖誕假期4周,考慮到放假回來的兩周就要交作業和考試,建議同學們還是不要去玩太久(比如說玩3周剩1周複習,這樣可能就有點作死了,親眼目睹過這樣的同學回來之後的慘烈)。 當時我是去倫敦玩了幾天,然後回來過聖誕,然後複習準備考試。聖誕節那三天倫敦是幾乎整個癱瘓掉,公共服務都幾乎停擺那種。新年的時候去了Edingburgh看了煙花,住到了很nice的Airbnb,倒數人擠人,第一次見到uk有這麼多人,想起來也是很開心啊。
然後,考完試,交了作業,第二個學期來了。這個學期BA的話是4門必修課裡面選3門上,再從一大堆選修課選3門上,一共6門課。這麼多課也有對應的考試和作業量。。所以這學期是真的比較辛苦的,線性回歸的帥哥教授早在第一個學期末就說了「You think this is overwhelming?Wait for next term."。這學期因為課程可選的類型有很多,主體上可以選成偏向strategic consulting那種,或是偏向data science應用的兩個方向。樓主選的幾乎都是數據分析相關的課程。會涵蓋到不同的編程,統計模型,排隊理論
隨機過程,最優化策略,時間序列分析,機器學習原理等方面。學得好的話就求職可以走數據分析,數據科學家
等等的路線(當然光靠課本知識可能不夠,但有一門課會給到很好的資源可以自學)來簡單說一下我選的這幾門課。先是必修部分:
5. Computer Simulation
用一個叫做Witness的流程模擬軟體,這個軟體有挺好的UI、邏輯和數據統計功能,所以其實用起來有點像玩樂高一個個東西放上去,最後輸出的結果也很方便導出分析
。但是這個軟體很貴,所以除了學校好像外面基本沒什麼公司買了使用的。這門課其實就不太實用。老師上課也是理論+實踐,考核的方式是一份小組作業,交一個模擬醫院病人看病的模型和分析結果的report,還有一個閉卷考試,考的模擬的一些理論。小組作業不太難,但分也不高,大概都是60多分上下。考試偏難,需要背的理論很多,老師也不畫重點,有一部分還需要自己計算。我其實在第三學期做project的時候也想用過一個流程模擬來解決一個問題,但是witness太貴了公司也不願意給錢。開源的當時沒找到有圖形界面方便實用的。所以基本上這門課就沒什麼用了。
6. Optimisation & Heuristic
上學期BA&OR的同一個老師,這個會深入講解線性規劃,非線性規劃
,一些比較常見的Optimizer (Gradient Descent,各種各樣Local Search,牛頓法
等等)。這些都是統計建模難以避開的一些部分,跟機器學習相輔相成(雖然不用自己寫,但總得了解這些演算法的思想)。然後一份作業一個考試,作業用的是LINGO做線性規劃,但老師當時說的是做不同的heuristic,礙於教課進程不夠快所以考線性規劃,以後不確定會不會變。考試主要考的也是線性規劃的各種問題,比如整數規劃,simplex method,dual simplex等等。總的來說老師講課有點無聊,但是各種演算法也是比較實用的,不過很容易考完就忘了。
7. Stochastic Modelling
上學期統計的老教授教,講課也是有點昏昏欲睡。主要涵蓋了risk mgt,queueing theory,markov chain的一些理論。這個risk mgt
跟金融的不一樣,主要是管理上出現意外的風險。考核同樣是考試和作業。都是放假回來教,考試好像4選3,然後包括全部內容。作業是一個老師開發的DoS界面的小軟體做一些queueing的模擬,根據公司業務的queue來優化人員安排,寫一份報告。當時寫這份報告的時候感覺其實更像是optimisation
的內容。。。不是很難,考試也是記得複習作業和往年試卷即可,但當時大家出分好像都是50多60分不太高。
8. Problem Structuring
這門課我沒選,但風評很好,據說是上一學期Problem Solving的進階,聽朋友說老師教的很有條理。做consulting
的時候很有用,我建議可以考慮一下選這門,畢竟computer simulation
沒什麼用。。。
接下來就是說一下樓主選的選修課,因為我從去之前就打算做數據分析這方向,所以選的都是比較「硬核」的課程。
9. Forecasting
時間序列分析,用統計模型去預測未來,老師是一個德國人,講課也很風趣幽默。但是一次課教的量非常大,然後可能大家都沒接觸過所以都做得有點困難。從簡單地moving average,到Exponential Smoothing和變體,ARIMA模型(上世紀蘭卡的教授發明了ARIMA手動選擇parameters的Box Jenkins Method),Regression。最後會簡單延伸一下一些比較高級的TBATS,機器學習和神經網路的預測模型等等。時間序列分析
算是現在數據分析裡面一個比較大的分支吧,然後用的辦法都是「統計學家」創建的模型。其實整體的思想和運用機器學習做classification是一致的。這門課跟下面會說到的Data Mining相輔相成。考核是一份作業100%,一篇報告定生死。不過不用擔心,老師會給很詳細的評分指南,所以只要對著指南做基本上都還是可以的,最後大家都分數不錯,60多分的很多,所以不用擔心。可能就是做的過程因為都需要R編程,不熟悉編程的可能會有點痛苦。(就是這門課交作業前見過有朋友60小時不睡覺狂趕的。。。)
10. Introduction to Python
Python入門,然後介紹用Pandas,Numpy,Matplotlib或者Seaborn等等。這門課比較煩的是剛開始兩周就要交一個作業,然後要期中考,期末還得交一個作業。說實話因為都是上機workshop,然後人很多(跟其他department的比如quantitative finance等等一起上課),老師講課其實挺困難的,所以其實很需要靠自己回去學習一些函數的運用。第一份小作業做的是一個關於market return
的幾個函數和主程序,不太難,但是老師很刁鑽,因為他用程序自動去看你寫的代碼,稍微格式有點不對就某部分全錯了,分不高。期中考就是兩個小時坐在電腦前限時編程,紙質材料開卷但不能上網查文檔,主要考察對pandas的一些函數的運用,記得就記得,不記得就不記得坐在那裡也想不出來哈哈。但老師比較手下留情,最後期中考分挺高的。期末考是用python自己寫一個關於Vehicle Routing Problem的Optimisation演算法,是不是很熟悉?沒錯就是上面必修課裡面有的,基本上就是寫一個簡單的local search的演算法,寫高級一點的比如simulated annealing會加一點點分這樣。這個作業也是最後大家都挺高分的。整體來說這門課教的不太好,但是回去自學的話,給分很高。
11. Data Mining
大名鼎鼎,很多人掛的課。。。老師是個希臘人,回郵件可能要等10天甚至不回。這門課從怎麼樣做exploratory analysis開始,教大家用不同的可視化圖去分析。然後到機器學習基礎,比如logstic regression
,decision tree,PCA等等。中間還會有穿插一些classification問題的一些基礎(information theory),怎麼判斷模型好不好等等。學的時候已經很多人聽不懂,關鍵是考核方式也是一份佔100%的作業。作業給了一個dataset,做的是credit card fraud
(Kaggle上很經典的數據),裡面就兩個問題,一個問題40分一個問題60分,然後就什麼都沒有了。。。之後大家就憑豐富的創造力和「團隊協作」能力一起做作業,但最後據說很多人及格線上徘徊和不及格的。總的來說,其實學的東西是非常有用的,logstic是非常非常常見以及容易大規模部署的classification演算法,decision tree也是random forest等演算法的基礎,PCA可以用於clustering
。但真的那份定生死的作業實在太難理解了,老師教的也不太好,所以導致學習結果可能不太好。
但是這門課會附帶一個Datacamp的在線網課平台的Premium會員,如果我們自己買那可是25英鎊一個月的,這個平台上有大量的python,R,SQL的數據分析和建模的課程,這些可以趁過期之前多多去看一下。也可以補一下缺失的SQL這一塊(國內的公司很多很多要求SQL)。
以上就是第二學期了,這個學期會非常的忙碌,過得非常快,在各種各樣的ddl
中不知不覺就沒了。之後又是放一個easter break
(好像三個星期還是4個),回來就考試交作業。之後會有一天是老師來給大家做第三學期項目的介紹,給幾天大家回去思考要選什麼項目。這裡有兩種項目,一種是去幫外面的客戶解決一個實際問題的,這些很多是要求去到公司上班的,其中有大公司比如說有Heathrow,Amazon,Heineken。這些都是非常搶手的項目,按照個人選擇和成績排序來分配。還有一種是在學校給老師做一個research項目,也包括很多很多方面。公司項目是需要當時成績達到60%以上才可以選,有一些項目也會要求之前選了xxx課程(比如當年就很多要求simulation和forecasting),有幾個志願可以填,然後按成績分配。當時已經很多人選不到自己的前3志願,可想而知擴招之後競爭有多激烈。
12. Dissertation
價值60個學分(1/3呢,畢業項目定生死),在第二學期後summer的大概5-9月之間進行,easter break之後會有一兩個星期選擇,期間公司的人或老師會有pre來介紹一下項目,也有上文提到的填志願和篩選。一共有兩種項目可以選:
一種是Company Based也就是幫外面的一些公司解決某個問題,會分配一到兩個學專業的導師作為supervisor。導師不會太過插手你的項目,一般只充當提出建議、幫你解決一些和client交流問題的輔助角色,當然如果項目進度太落後也會小小來提醒一下。這個項目非常好的一點就是真的會有個外面公司的問題需要我們去解決,雖然老師一再強調不是實習,但實際上很多都要去到公司當地上班,一個人體驗找房子(學校會幫忙)、搬家、在英國甚至歐洲上班、和老闆喝咖啡吹水聊天等等,所以其實跟實習也沒差很遠啊哈哈。一般要搬出去的都是大概2個半月左右的時間,也有的項目可以base在學校然後每一兩周就來回穿梭於公司和學校之間(樓主的項目就是這樣)。整個summer的經歷充滿了新奇和挑戰,第一次在倫敦穿西裝上班啦,蹭了一下公司報銷的酒店啦,在公司那種「混亂」的環境中做數據分析啦,跟很多同事交流經歷等等。這種project會需要提交一份focus在client提出的問題的解決方案的report,professional & academic都要兼顧,還需要提交另外一份短的只focus在academic上的report,再在整個項目基礎上寫一個簡單的executive summary,這些東西合起來作為dissertation交給客戶和學校。通常academic
的那一份都是挑第一份report中的某一兩點作更多學術研究上的討論。整個下來其實3 4個月真的很充實,真的是老師說的amazing experience,不過還是那句話,時間管理要做好,因為client和supervisor
都會不定期來問進度,最後也會根據整個過程的表現打分,所以不能拖到最後再做。 未來的學弟學妹們要好好表現喲。我畢業的時候回去跟programme coordinator聊天,她說未來學生多了可能都需要兩人做一個project ,不過也希望蘭卡未來有更強的industry connection可以給學生拉到更多project哈。
另一種是Research Based比較偏向研究型,推薦未來想申請phd
的同學們選這種project。這種就是國內比較常見的論文方式,導師給出幾個題目候選,然後大家分配好題目後就寫學術論文。樓主在回國以後才意識到,其實company based的project真的非常職業導向,整個會對簡歷加很多分,也會多了很大段經歷作為面試談資,輸出的report也比較像職場上彙報的格式,academic的那一部分短report其實在不太足夠用於研究一個演算法啊模型等題目,自然在申請phd上競爭力是不如research based的項目。反之亦然,research based會給學術經歷增添一筆,但自然在找工作中的加分就小於company based啦。但research的工作量樓主認為除了不用travel到company site以外不亞於company report。當時樓主的好朋友就在旁邊做一個research邊做邊哭,ddl那天樓主最後半個小時跑步穿越整個學校幫她交紙質論文(中間省略萬字故事。。。),也是很難了。
樓主當時交論文ddl的兩天後學校宿舍就到期了,所以其實最後那個星期一邊收拾東西一邊改論文一邊和朋友吃喝玩樂一邊感傷告別,交完後就匆匆搬離準備打飛機離開UK,心情還是蠻複雜的。所以其實最好就是論文提前點弄完,最後的時光可以多點留給準備前往世界各地的朋友,多點留給UK沒見過的風光,多點留給學習了一年的自己,算是給這一年的經歷畫上圓滿的句號。