我眼中的數(shù)據(jù)分析_數(shù)據(jù)分析師需要具備哪些能力
我覺得數(shù)據(jù)分析是個雜家,什么要懂一些,數(shù)據(jù)分析師需要具備的能力我概括起來包括4個方面的。
1)數(shù)據(jù)處理能力,就是能數(shù)據(jù)庫中的數(shù)據(jù)組織成你想要的形式。
這里面最基本的就是EXCEL能力(你別小看EXCEL,EXCEL用活了也很牛逼的),再高級一點(diǎn)的數(shù)據(jù)庫操作技巧(比如:編寫T-SQL代碼的技巧,再或者用第三方軟件處理,比如SAS等),再牛一些就是能用編寫一些腳本語言處理數(shù)據(jù),比如python等。
另外就是數(shù)據(jù)庫語言SQL也是分析師的最基本能力。
2)建立模型的能力,這個不光是能在一些軟件是擺弄一些組件或方法,最關(guān)鍵的是要知道一些模型的適用原則和結(jié)果解釋。
在我們用的比較常見有比如logist回歸,K-mean等,以及其他一些線性模型。這些模型的算法一般都不需要你寫了,通過SAS等軟件能自動實(shí)現(xiàn),但是對很多并不了解的這些模型的基本原理,稀里糊涂做了。這里我建議你讀一些數(shù)據(jù)挖掘技術(shù)和統(tǒng)計(jì)方法的書。此外,我要強(qiáng)調(diào)的是數(shù)據(jù)分析是為了解決問題,不要為了分析而分析?催^不少人,做了不少模型,但那些模型一定用處都沒有,或者不需要模型就能解決問題。當(dāng)然,如果你能自己寫一些算法最好了,比如一些推薦算法等。
3)數(shù)據(jù)分析是雜家,需要你去了解很多管理和經(jīng)濟(jì)學(xué)方面的知識。
有了這些知識對你了解事物,結(jié)構(gòu)問題很有幫助,比如你了解了營銷理論后你對用戶細(xì)分、用戶行為以及渠道分析就很有感覺了。數(shù)據(jù)分析最重要就是思路,而思路往往來自于這些管理和經(jīng)濟(jì)方面的知識,數(shù)據(jù)分析的模型只是讓你將這些思路簡化和處理的手段而已。這就說明為什么很多做數(shù)據(jù)分析咨詢方面的很多人來自MBA的原因。這個需要慢慢積累。
4)對行業(yè)的認(rèn)識,這個最容易入手,但也最難深入。
如果一個人對行業(yè)一點(diǎn)了解,這個人不可能做好數(shù)據(jù)分析,他解決問題找不到關(guān)鍵點(diǎn)。此外,對于增強(qiáng)行業(yè)的認(rèn)識我覺得沒有什么太好辦法,能做的就是時(shí)間對上去,慢慢了解這個產(chǎn)業(yè)鏈。這里我覺得有一些波士頓和波特的書就蠻好的。