Toby Segaran是Genstruct公司的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。Toby Segaran还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,Toby Segaran还建立了几个免费的网站应用,包括流行的tasktoy和Lazybase。他非常喜欢滑雪与品酒,其博客地址是blog.kiwitobes.com,现居于旧金山。
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
本书是Web开发者、架构师、应用工程师等的绝佳选择。
##上周50周年系庆的时候 张钹 院士说了这样一句话:”人工智能以前大多基于经验和领域知识,直到上万上亿的数据出现时,基于数据的人工智能更有了广阔的天空。”《集体智慧》就是这样一本告诉你如何从数据中挖掘金矿的经典之作。 由于现在所从事的是信息检索,文本挖掘方面的研究...
评分 评分 评分 评分##入门佳作,不懂数学也可以数据挖掘哟~~~即使API过时了还是非常好用。(当然你不能做梦不懂数学看了它就熟练掌握DM
评分##都是干货,没什么废话。注重由浅入深向读者讲解,兼顾各种细节。作者的编程经验丰富,书里的代码都是选自案例,可以直接应用。所以,这本书特别实用。 对我来说,终于搞明白了一种神经网络:多层感知机。首先将抽象神经元的权重(突触强度)存入到数据库中,或者通过反向传播...
评分 评分##为了更好地学习本书,我从学习python开始到后来调试书中的网站实例。花了不少功夫,希望朋友们不要走弯路。这里提供了图文并茂的指导过程。请参考: http://blog.csdn.net/zjmwqx/article/details/7007438
评分##这本书的标题多多少少显得有点怪异。那这里主要就我个人的理解追溯一下历史,谈一谈为什么叫作“集体智慧”,说说我自己的揣测。 带大家回顾一下时间背景。本书英文版出版于2007年,党的十七大这一年召开,北京奥运还未举办,网络游戏跑跑卡丁车广受欢迎,电视剧《潜伏》尚未播...
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.qciss.net All Rights Reserved. 图书大百科 版权所有