入門讀物:
深入淺出數(shù)據(jù)分析 (豆瓣) 這書挺簡單的,基本的內(nèi)容都涉及了,說得也比較清楚,最后談到了R是大加分。難易程度:非常易。
啤酒與尿布 (豆瓣) 通過案例來說事情,而且是最經(jīng)典的例子。難易程度:非常易。
數(shù)據(jù)之美 (豆瓣) 一本介紹性的書籍,每章都解決一個具體的問題,甚至還有代碼,對理解數(shù)據(jù)分析的應(yīng)用領(lǐng)域和做法非常有幫助。難易程度:易。
數(shù)學(xué)之美 (豆瓣) 這本書非常棒啦,入門讀起來很不錯!
數(shù)據(jù)分析:
SciPy and NumPy (豆瓣) 這本書可以歸類為數(shù)據(jù)分析書吧,因?yàn)閚umpy和scipy真的是非常強(qiáng)大啊。
Python for Data Analysis (豆瓣) 作者是Pandas這個包的作者,看過他在Scipy會議上的演講,實(shí)例非常強(qiáng)!
Bad Data Handbook (豆瓣) 很好玩的書,作者的角度很不同。
適合入門的教程:
集體智慧編程 (豆瓣) 學(xué)習(xí)數(shù)據(jù)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)人員應(yīng)該仔細(xì)閱讀的第一本書。作者通過實(shí)際例子介紹了機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘中的算法,淺顯易懂,還有可執(zhí)行的Python代碼。難易程度:中。
Machine Learning in Action (豆瓣) 用人話把復(fù)雜難懂的機(jī)器學(xué)習(xí)算法解釋清楚了,其中有零星的數(shù)學(xué)公式,但是是以解釋清楚為目的的。而且有Python代碼,大贊!目前中科院的王斌老師(微博: 王斌_ICTIR)已經(jīng)翻譯這本書了 機(jī)器學(xué)習(xí)實(shí)戰(zhàn) (豆瓣)。這本書本身質(zhì)量就很高,王老師的翻譯質(zhì)量也很高。難易程度:中。我?guī)У难芯可腴T必看數(shù)目之一!
Building Machine Learning Systems with Python (豆瓣) 雖然是英文的,但是由于寫得很簡單,比較理解,又有 Python 代碼跟著,輔助理解。
數(shù)據(jù)挖掘?qū)д?(豆瓣) 最近幾年數(shù)據(jù)挖掘教材中比較好的一本書,被美國諸多大學(xué)的數(shù)據(jù)挖掘課作為教材,沒有推薦Jiawei Han老師的那本書,因?yàn)閭人覺得那本書對于初學(xué)者來說不太容易讀懂。難易程度:中上。
Machine Learning for Hackers (豆瓣) 也是通過實(shí)例講解機(jī)器學(xué)習(xí)算法,用R實(shí)現(xiàn)的,可以一邊學(xué)習(xí)機(jī)器學(xué)習(xí)一邊學(xué)習(xí)R。
稍微專業(yè)些的:
Introduction to Semi-Supervised Learning (豆瓣) 半監(jiān)督學(xué)習(xí)必讀必看的書。
Learning to Rank for Information Retrieval (豆瓣) 微軟亞院劉鐵巖老師關(guān)于LTR的著作,啥都不說了,推薦!
Learning to Rank for Information Retrieval and Natural Language Processing (豆瓣) 李航老師關(guān)于LTR的書,也是當(dāng)時他在微軟亞院時候的書,可見微軟亞院對LTR的研究之深,貢獻(xiàn)之大。
推薦系統(tǒng)實(shí)踐 (豆瓣) 這本書不用說了,研究推薦系統(tǒng)必須要讀的書,而且是第一本要讀的書。
Graphical Models, Exponential Families, and Variational Inference (豆瓣) 這個是Jordan老爺子和他的得意門徒 Martin J Wainwright 在 Foundation of Machine Learning Research上的創(chuàng)刊號,可以免費(fèi)下載,比較難懂,但是一旦讀通了,graphical model的相關(guān)內(nèi)容就可以踏平了。
Natural Language Processing with Python (豆瓣) NLP 經(jīng)典,其實(shí)主要是講 NLTK 這個包,但是啊,NLTK 這個包幾乎涵蓋了 NLP 的很多內(nèi)容了!
機(jī)器學(xué)習(xí)教材:
The Elements of Statistical Learning (豆瓣) 這本書有對應(yīng)的中文版:統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ) (豆瓣)。書中配有R包,非常贊!可以參照著代碼學(xué)習(xí)算法。
統(tǒng)計(jì)學(xué)習(xí)方法 (豆瓣) 李航老師的扛鼎之作,強(qiáng)烈推薦。難易程度:難。
Machine Learning (豆瓣) 去年出版的新書,作者Kevin Murrphy教授是機(jī)器學(xué)習(xí)領(lǐng)域中年少有為的代表。這書是他的集大成之作,寫完之后,就去Google了,產(chǎn)學(xué)研結(jié)合,沒有比這個更好的了。
Machine Learning (豆瓣) 這書和上面的書不是一本!這書叫:Machine Learning: An Algorithmic Perspective 之前做過我?guī)У难芯可滩,由于配有代碼,所以理解起來比較容易。
Pattern Recognition And Machine Learning (豆瓣) 經(jīng)典中的經(jīng)典。
Bayesian Reasoning and Machine Learning (豆瓣) 看名字就知道了,徹徹底底的Bayesian學(xué)派的書,里面的內(nèi)容非常多,有一張圖將機(jī)器學(xué)習(xí)中設(shè)計(jì)算法的關(guān)系總結(jié)了一下,很棒。
Probabilistic Graphical Models (豆瓣) 鴻篇巨制,這書誰要是讀完了告訴我一聲。
Convex Optimization (豆瓣) 凸優(yōu)化中最好的教材,沒有之一了。課程也非常棒,Stephen老師拿著紙一步一步推到,圖一點(diǎn)一點(diǎn)畫,太棒了。