內(nèi)容簡介
書以機器學(xué)習(xí)與計算統(tǒng)計為主題背景,專門講述如何挖掘和分析Web上的數(shù)據(jù)和資源,如何分析用戶體驗、市場營銷、個人品味等諸多信息,并得出有用的結(jié)論,通過復(fù)雜的算法來從Web網(wǎng)站獲取、收集并分析用戶的數(shù)據(jù)和反饋信息,以便創(chuàng)造新的用戶價值和商業(yè)價值。全書內(nèi)容翔實,包括協(xié)作過濾技術(shù)(實現(xiàn)關(guān)聯(lián)產(chǎn)品推薦功能)、集群數(shù)據(jù)分析(在大規(guī)模數(shù)據(jù)集中發(fā)掘相似的數(shù)據(jù)子集)、搜索引擎核心技術(shù)(爬蟲、索引、查詢引擎、PageRank算法等)、搜索海量信息并進行分析統(tǒng)計得出結(jié)論的優(yōu)化算法、貝葉斯過濾技術(shù)(垃圾郵件過濾、文本過濾)、用決策樹技術(shù)實現(xiàn)預(yù)測和決策建模功能、社交網(wǎng)絡(luò)的信息匹配技術(shù)、機器學(xué)習(xí)和人工智能應(yīng)用等。
本書是Web開發(fā)者、架構(gòu)師、應(yīng)用工程師等的絕佳選擇。
作者簡介
Toby Segaran是Genstruct公司的軟件開發(fā)主管,這家公司涉足計算生物領(lǐng)域,他本人的職責(zé)是設(shè)計算法,并利用數(shù)據(jù)挖掘技術(shù)來輔助了解藥品機理。Toby Segaran還為其他幾家公司和數(shù)個開源項目服務(wù),幫助它們從收集到的數(shù)據(jù)當中分析并發(fā)掘價值。除此以外,TobySegaran還建立了幾個免費的網(wǎng)站應(yīng)用,包括流行的tasktoy和Lazybase。他非常喜歡滑雪與品酒,其博客地址是kiwitobes.com,現(xiàn)居于舊金山。
在線閱讀
本書PDF版本下載