编辑推荐
结合案例来描述每一种统计学模型,解释如何开展数据分析,讨论采用模拟手段来检验模型,这是模型开发与评估中的重要方面,给出多层回归模型(如多层ANOVA、多层线性回归和广义多层模型),指导如何用R语言采实现诸多方法,在线提供书中所用到的数据集和R语言脚本。
内容简介
在强调统计思维的归纳性本质基础上,《环境与生态统计:R语言的应用》把应用统计学跟环境与生态领域关联到一起。《环境与生态统计:R语言的应用》遵循解决统计建模问题的一般方法。内容覆盖了模型界定、参数估值和模型评估。作者用了很多实例来阐述统计学模型以及如何用R语言来实现模型。本书首先为开展简单的数据分析任务提供了基础知识。例如探索性数据分析和线性回归模型拟合。接下来重点介绍了统计建模,包括线性和非线性模型、分类和回归树以及广义线性模型。书中还讨论了用于模型检验的模拟,为开发出的模型提供评估工具,同时探讨了多层回归模型这类会对环境和生态学数据分析产生广泛影响的模型。
本书重点针对的是环境和生态学问题的统计建模和数据分析。通过引导读者理解解决科学问题和开发统计模型的过程,轻松地从科学假设过渡到统计模型。
作者简介
钱松,1985年于清华大学环境工程系获学士学位,1988年于南京大学地理系获硕士学位,1995年于美国杜克大学(Duke University)获环境科学博士与统计学硕士双学位。曾任中国国家环境保护部华南环境科学研究所工程师,先后在美国杜克大学湿地研究中心从事博士后研究,在波特兰州立大学(Portland State University)任教。现任美国杜克大学环境学院(Nicholas school of the Environment)研究副教授,兼任美国地质调查局北卡罗来纳水环境科学中心(North Carolina Water Science Center:U.S.Geological Survey)研究员。
长期从事环境和生态统计方面的科研与教学工作。目前以土地利用(例如城市化)对水环境和水生生态系统的影响为研究重点。多年来,在环境和生态统计领域不断有所创新,尤其是将贝叶斯统计方法应用于环境和生态学研究领域,取得了丰硕的成果。
内页插图
目录
表清单
图清单
第1部分 基本概念
第1章 引言
1.1 美国佛罗里达Everglades湿地案例
1.2 统计学问题
1.3 参考文献说明
第2章 R语言
2.1 什么是R语言?
2.2 开始使用R语言
2.2.1 R提示符与赋值
2.2.2 数据类型
2,2.3 R的函数
2.3 RCommander
第3章 统计假设
3.1 正态性假设
3.2 独立性假设
3.3 等方差假设
3.4 探索性数据分析
3.4.1 展示分布的图形
3.4.2 比较分布的图形
3.4.3 识别变量问依存关系的图形
3.5 从图形到统计学思维
3.6 参考文献说明
第4章 统计推断
4.1 总体均值和置信区间的估计
4.1.1 估计标准误的自举法
4.2 假设检验
4.2.1 t检验
4.2.2 双侧备择
4.2.3 用置信区间进行假设检验
4.3 一般过程
4.4 假设检验的非参数方法
4.4.1 秩变换
4.4.2 wilcoxon符号秩检验
4.4.3 wilcoxon秩和检验
4.4.4 关于分布无关检验方法的讨论
4.5 置信水平α、统计功效1β和P值
4.6 单因素方差分析
4.6.1 方差分析
4.6.2 统计推断
4.6.3 多重比较
4.7 案例
4.7.1 美国佛罗里达Everglades湿地案例
4.7.2 Kemp的鳞龟
4.7.3 水质达标评价
4.7.4 红树林和海绵体之间的相互作用
4.8 参考文献说明
第Ⅱ部分 统计建模
第5章 线性模型
5.1 作为线性模型的ANOVA
5.2 简单和多元线性回归模型
5.2.1 最小平方法
5.2.2 鱼样本中的:PCBs
5.2.3 用一个预测变量来回归
5.2.4 多元回归
5.2.5 相互作用
5.2.6 残差和模型评估
5.2.7 类型预测变量
5.2.8 芬兰湖泊案例和共线性
5.3 构建预测性模型的一般考虑
5.4 模型预测的不确定性
5.5 双因素ANOVA
5.5.1 相互作用
5.6 参考文献说明
……
第Ⅲ部分 高级统计建模
参考文献
索引
精彩书摘
(3)统计推断不仅能提供参数值,而且可以提供跟估计值联系在一起的不确定性的信息。在实践中,采样误差和测量误差同时存在于数据中。采样误差描述的是估计出的总体特征与真实总体之间的差异。例如,12个月TP浓度监测值的平均值与真正的均值浓度之间的差异就是采样误差。采样误差之所以发生是因为我们用总体的一部分来推断总体。采样误差是抽样模型的话题,而抽样模型不会直接涉及测量误差。测量误差即使在整个总体(或全部数据)得到观测的情况下都会发生。测量误差模型是处理这一不确定性的工具。通常地,我们把这两种方法结合起来构建统计模型。统计推断的重点则是对误差予以量化。
(4)统计假设是统计推断的基础。最常使用的统计假设就是测量误差的正态性假设。测量误差被假设为服从均值为0、标准差为盯的正态分布。当这些基本假设不能满足,对不确定性的统计推断就可能造成误导。所有的统计学方法依赖于以下假设:数据是总体这样或那样的随机样本。
采用参考条件方法制定环境标准取决于识别参考站点的能力。在南佛罗里达,对参考站点的识别是通过对生态学者筛选出的代表生态“平衡”的生态变量进行统计模拟来实现的。这个过程虽然复杂,但实质上是比较两个总体,即比较参考总体和受影响的总体的过程。
一旦环境标准确定了,评价水体是否满足标准就成为一个不断进行统计假设检验的问题。如果将上述工作翻译成假设检验问题,实际上我们是在检验水体达标的零假设和水体不达标的备择假设。在美国,很多州要求,如果宣称水体达标,那么水体超标的时间不能超过10%。因此,特别重要的量就是浓度分布的第90个百分点。当第90个百分点低于水质标准,水体被认为是达标的;当第90个百分点高于水质标准,水体被认为是超标的。
除此之外,大量的生态学指标(或度量)被测量后用于研究湿地生态系统对农业径流造成的磷浓度升高的响应。这些研究收集了大量数据,并且常需要进行复杂的统计分析。例如,生态阈值概念通常被定义为一种条件,一旦超过该条件,生态系统就会发生质量、性质或现象的突然急剧变化。
……
环境与生态统计:R语言的应用 [Environmental and Ecological Statistics with R] 下载 mobi epub pdf txt 电子书 格式
环境与生态统计:R语言的应用 [Environmental and Ecological Statistics with R] 下载 mobi pdf epub txt 电子书 格式 2025
环境与生态统计:R语言的应用 [Environmental and Ecological Statistics with R] mobi epub pdf txt 电子书 格式下载 2025