Ilya+Narsky
隨著計算技術(shù)的發(fā)展,科學(xué)研究的方法也出現(xiàn)了一些新的可能性。首先是“計算機(jī)計算”本身變成了一種進(jìn)行科學(xué)探索的手段,而隨著大數(shù)據(jù)技術(shù)的興起,“數(shù)據(jù)分析”也逐漸成為科學(xué)研究中的重要手段。回顧物理學(xué)發(fā)展史,“數(shù)據(jù)分析”技術(shù)正在扮演著越來越重要的角色。因此,從某種角度來看,數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)本身并不是計算機(jī)科學(xué)領(lǐng)域獨有的,可以說任何需要對數(shù)據(jù)進(jìn)行分析的領(lǐng)域都會涉及到。本書的兩位作者都是物理學(xué)教授,他們希望借助這本書將機(jī)器學(xué)習(xí)的基本理論與粒子物理學(xué)中的數(shù)據(jù)分析結(jié)合在一起介紹給相關(guān)的研究人員。
全書分為20章:1.引言,為什么寫這本書以及如何閱讀;2.參數(shù)化似然擬合;3.擬合優(yōu)度檢驗;4.重采樣技術(shù);5.密度估計;6.機(jī)器學(xué)習(xí)中的基本概念和定義;7.數(shù)據(jù)預(yù)處理;8.線性變換及維度約減;9.分類理論介紹;10.分類器性能;11.線性和二次判別分析,Logistic回歸,以及偏最小二乘回歸;12.神經(jīng)網(wǎng)絡(luò);13.局部學(xué)習(xí)及核分解;14.決策樹;15.集成學(xué)習(xí);16.將多分類轉(zhuǎn)化為二分類;17.如何選擇正確的分類器以及如何正確應(yīng)用;18.變量排序和選擇的方法;19.多維數(shù)據(jù)中的塊搜索;20.機(jī)器學(xué)習(xí)中的軟件包。
本書的兩位作者都有很強(qiáng)的統(tǒng)計學(xué)和物理學(xué)方面的背景,并且都在加州理工學(xué)院從事過粒子物理的研究。目前第一作者在著名的數(shù)據(jù)分析軟件MathWorks公司擔(dān)任軟件開發(fā)工程師。本書不僅對機(jī)器學(xué)習(xí)的基本理論作了系統(tǒng)的介紹,還結(jié)合了粒子物理學(xué)中很多真實的研究問題,非常適合相關(guān)的研究人員閱讀。
張志斌,副研究員
endprint