发表于2024-12-19
SAS公司官方出品,SAS大学授权编写,SAS全国高校数据分析大赛指定参考书
作者在银行等金融领域有近20年工作经验,是资深的数据挖掘与分析专家
本书以金融客户生命周期管理为主线,纯实战导向,通过5个经典案例详细讲解金融数据挖掘与建模的方法与技巧
这是一部从实战角度讲解如何利用SAS对金融数据进行挖掘与建模的专著,由SAS大学授权撰写,是SAS大学的指定参考书,也是“SAS大学技术丛书”的*一本书。
全书两条主线:
主线1:金融客户(信贷)的生命周期管理,通过5个具有代表性的案例,讲解了金融客户再获取、提升、成熟、衰退、挽留这5个阶段的关键数据的挖掘与建模方法;
主线2:数据挖掘项目的生命周期管理,把项目生命周期的各个阶段的关键技术和处理方法融入到案例中,串接起一个一个独立、完整的实战场景。
全书一共6章:
第1章介绍了数据挖掘和建模在信贷(信用卡)客户生命周期管理中的15个主要应用场景;
第2章通过信用卡客户反欺诈案例,讲解了如何应用随机森林算法构建欺诈评分模型;
第3章通过信用卡客户精准营销案例,讲解了营销响应模型的构建、评估与应用;
第4章通过信用卡客户细分讲解了完整的聚类过程,对聚类做了*完整的阐释;
第5章通过贷款违约预测案例,为零建模基础的读者提供了一个简化版的行为评分模型;
第6章结合信用卡客户流失预警与挽留案例,讲解了客户价值(数值)预测与流失倾向(事件)预测两类问题的组合建模与应用。
不拘泥于方法本身,彰显了以企业实际运用为导向的写作思路,让案例更具实用参考价值。五个案例之后,你会发现这些方法和模型在大部分业务场景中似曾相识,金融企业数据挖掘与建模将变得迎刃而解。
陈春宝
上海交通大学工业工程博士,现任职于某商业银行,担任大数据专家。在银行、信用卡、医药与电信等行业拥有十年数据挖掘与建模经验,工作跨大数据、营销、风控、运营等多个领域,擅长诊断各类业务问题,应用商业和大数据手段获得创新性的解决方案并有效实施。曾担任美国管理科学协会咨询顾问、交通银行信用卡中心数据分析经理、上海交大工程硕士企业导师。
著有《大数据与机器学习:实践方法与行业案例》一书,在SCI&EI;索引期刊发表论文10余篇。
徐筱刚
上海某金融机构高级数据分析师,具有深厚的数理统计与应用数据分析专业背景,8年数据分析与挖掘从业经验,曾就职零售企业、咨询公司等,独立或带团队完成零售、电信、金融等多个大型数据挖掘项目。
田建中
北京师范大学管理学硕士,先后在电信业、银行业从事数据仓库建设、数据建模咨询等工作,对数据挖掘在营销中的应用有深入研究,拥有10多年的SAS开发经验。曾就职于河北移动、美商天睿有限公司,现就职于某大型商业银行大数据管理部,从事数据挖掘、业务用例研究及营销体系建设等工作。
如何挖掘数据资产,并应用于业务实践,产生价值,需要一套系统的方法和工具,本书正好结合具体的案例,深入浅出地回答了这个问题,对从事大数据分析与挖掘的数据人有很好的参考价值。
——郑承满 厦门银行CIO
数字化是银行经营客户的趋势,数据分析和应用的变现能力是核心。本书归纳了客户数字化经营的主要场景,并选取代表性案例进了行剖析和介绍,对从业人员授之以渔,值得推荐。
——杨志敏 浦发银行零售业务管理部副总经理
把数据挖掘比作一场猎取宝藏的屠龙之旅,却有太多屠龙之术浓墨重彩于宝藏之瑰丽或神兵之锋利。而本书更像是作者把他们亲历的一次次真实冒险娓娓道来,把读者带入一个个真实的场景,与作者一起面临险境,审时度势,化险为夷。历经百转千回才得峰回路转,柳暗花明。一气读完,顿觉身上的行囊充实了许多,远处宝藏的光辉也真实了几分,便急不可耐的踏上了新的冒险旅程。
——王晓 太平洋人寿保险客户资源整合部高级经理
写法化繁为简,案例源自实践,很多分析方法和代码可以直接复用,对挖掘建模人员具有很强的导向性和启发性,无论使用SAS或开源工具,都能从分析思路中受益。
——钟飞 蚂蚁金服风控策略专家
这是一套涵盖SAS编程语言、SAS应用实操、SAS统计理论分析的工具书,内容专业精深,语言浅显易懂,案例贴近热点业务需求,真可谓一套心血之作、诚意之品、价值之典!
——万平 平安银行总行大数据决策管理部
数字化转型是银行业未来十年的发展趋势,大数据的分析与应用能力至关重要。本书系统归纳了数字化客户经营的主要场景,并选取*有代表性的案例介绍分析建模过程,写法通俗易懂,对技术和业务人员提升数字化客户经营能力都很有帮助。
——吴纯杰 上海财经大学统计与管理学院副院长
SAS是统计分析软件领域的标杆,以功能强大著称,已经有超过40年的历史。由SAS技术大学精英学院组织撰写的这套书,有SAS编程的主题,有SAS EG和SAS EM这样的重要工具,还有金融数据挖掘与建模这样的行业应用,内容系统、立体、丰富,强烈推荐!
——俞章盛 上海交通大学教授/博士生导师
SAS是全球分析领域的引*者,数十年来一直致力于应用分析解决*困难的业务问题,在统计分析、商业智能、客户智能、数据管理、风险管理、欺诈与安全智能等多个领域独树一帜。相信由SAS技术大学官方编写的系列参考书,一定能将SAS的技术精华和优秀实践总结、提炼出来,奉献给广大的SAS技术、产品的支持者和使用者们。
——宇传华 武汉大学教授/博士生导师
在开源软件大行其道的今天,作为商业软件,SAS不仅没有没落,反而正爆发出更强大的生命力,这与SAS公司与时具进的创新能力是分不开的。SAS的技术和产品在不断改进,SAS的教育工作也一直做得很好,每年一度的“高校SAS数据分析大赛”在教育界的影响力越来越大。他们出版的“SAS大学技术丛书”一定能再为他们的SAS教育工作添砖加瓦。
——杨启贵 华南理工大学教授/数学学院副院长/博士生导师
Contents 目 录
赞誉
序
前言
第1章 金融数据挖掘与建模应用场景 1
1.1 客户数据挖掘的价值 1
1.2 金融客户生命周期及数据应用场景 3
1.3 最具代表性的数据应用场景 7
第2章 客户获取:信用卡客户欺诈评分案例 8
2.1 案例背景 9
2.2 数据准备与预处理 10
2.2.1 数据源 10
2.2.2 变量设计 11
2.3 构建评分模型 13
2.3.1 算法选择 13
2.3.2 模型训练 14
2.3.3 模型评估 16
2.4 评分模型的应用 19
2.5 小结 20
第3章 客户提升:信用卡客户精准营销案例 21
3.1 案例背景 21
3.2 建模准备 21
3.2.1 准备数据 22
3.2.2 数据预处理 26
3.2.3 过度抽样 27
3.2.4 构造训练集及测试集 30
3.3 数据清洗及变量粗筛 32
3.3.1 连续变量与连续变量之间 33
3.3.2 分类变量和分类变量之间 39
3.3.3 分类变量和连续变量之间 43
3.3.4 数据的错误及缺失值 47
3.3.5 数据离群值 53
3.3.6 重编码 59
3.4 变量压缩与转换变量 61
3.4.1 分类变量的水平数压缩 61
3.4.2 连续变量聚类 65
3.4.3 连续变量的分箱 77
3.4.4 变量的转换 79
3.5 模型训练 80
3.5.1 关于Logistic回归 80
3.5.2 变量筛选方法 81
3.6 模型评估 88
3.6.1 模型估计 88
3.6.2 模型评估 89
3.6.3 调整过度抽样 98
3.6.4 收益矩阵 98
3.6.5 模型转换为打分卡 100
3.7 模型的部署及更新 100
3.7.1 模型的部署 100
3.7.2 模型的监测及更新 101
3.8 本章小结 103
第4章 客户成熟:银行零售客户渠道偏好细分案例 104
4.1 案例背景 104
4.2 聚类分析流程 105
4.3 数据标准化 107
4.3.1 标准化介绍 107
4.3.2 标准化实现 110
4.4 变量聚类 111
4.4.1 变量聚类介绍 111
4.4.2 变量聚类基本步骤 112
4.4.3 SAS实现变量聚类 113
4.5 变量降维与可视化 118
4.5.1 图形化探索 118
4.5.2 主成分分析法降维 120
4.6 ACECLUS预处理过程 123
4.6.1 ACECLUS介绍 123
4.6.2 ACECLUS过程 123
4.6.3 ACECLUS示例 123
4.7 系统聚类分析 128
4.7.1 系统聚类法 128
4.7.2 样本与样本之间的度量 129
4.7.3 距离定义与测量 129
4.7.4 相关系数 131
4.7.5 类与类之间的度量 131
4.7.6 系统聚类法 139
4.7.7 不同系统聚类法之间的比较 140
4.7.8 类个数的确定 158
4.8 快速聚类 159
4.8.1 快速聚类法 159
4.8.2 快速聚类法实现 160
4.8.3 快速聚类法优缺点 161
4.9 两步聚类法 161
4.9.1 两步聚类法 161
4.9.2 两步聚类法实现 161
4.10 本章小结 167
第5章 客户衰退:银行贷款违约预测案例 168
5.1 案例背景 169
5.2 维度分析 170
5.3 建模分析 177
5.4 业务应用 179
5.5 小结 179
第6章 客户挽留:信用卡客户流失管理案例 180
6.1 案例背景 181
6.2 数据准备 182
6.2.1 设定目标变量 182
6.2.2 设定时间窗 183
6.2.3 设计预测变量 184
6.2.4 准备数据宽表 185
6.3 流失倾向预警:用Logistic回归构建响应率模型 186
6.3.1 粗分类 187
6.3.2 计算分组变量的WOE值和IV值 191
6.3.3 共线性检验 194
6.3.4 模型训练:显著性检验 195
6.3.5 模型评估 196
6.4 潜在客户价值预测:两阶段建模法 201
6.4.1 阶段1概率预测 201
6.4.2 阶段2 数值预测 201
6.4.3 模型评估 203
6.5 细分:差异化营销服务的基础 204
6.6 小结 208
Praise 赞 誉
数字化转型是银行业未来十年的发展趋势,大数据的分析与应用能力至关重要。本书系统归纳了数字化客户经营的主要场景,并选取最有代表性的案例介绍分析建模过程,写法通俗易懂,对技术和业务人员提升数字化客户经营能力都很有帮助。
——吴纯杰 上海财经大学统计与管理学院副院长
SAS是统计分析软件领域的标杆,以功能强大著称,已经有超过40年的历史。由SAS技术大学精英学院组织撰写的这套书,有SAS编程的主题,有SAS EG和SAS EM这样的重要工具,还有金融数据挖掘与建模这样的行业应用,内容系统、立体、丰富,强烈推荐!
——俞章盛 上海交通大学教授/博士生导师
SAS是全球分析领域的引领者,数十年来一直致力于应用分析解决最困难的业务问题,在统计分析、商业智能、客户智能、数据管理、风险管理、欺诈与安全智能等多个领域独树一帜。相信由SAS技术大学官方编写的系列参考书,一定能将SAS的技术精华和优秀实践总结、提炼出来,奉献给广大的SAS技术、产品的支持者和使用者们。
——宇传华 武汉大学教授/博士生导师
在开源软件大行其道的今天,作为商业软件,SAS不仅没有没落,反而正爆发出更强大的生命力,这与SAS公司与时俱进的创新能力是分不开的。SAS的技术和产品在不断改进,SAS的教育工作也一直做得很好,每年一度的“高校SAS数据分析大赛”在教育界的影响力越来越大。他们出版的“SAS大学技术丛书”一定能再为SAS教育工作添砖加瓦。
——杨启贵 华南理工大学教授/数学学院副院长/博士生导师
Foreword 序
大数据的浪潮正渐渐平静,整个行业已逐渐趋于成熟和理性。喧嚣与嘈杂渐远之时,才能更清晰地透过表象,看清事情的本质。大数据需要精挖掘,好客户需要勤耕耘,再好的故事,再炫的包装,再酷的产品,分析基础还是以CRISP方法为主流,做好数据采集、清洗、整合、建模、分析、部署与调优;经营基础还是“客户为中心”的市场营销,通过信息对称与否的博弈来驾驭经营风险,再给予风险成本加权计算基础上的损益评价。大数据的世界有时确实没表面上那么“性感”,而是非常“感性”。对于从事大数据相关工作的大多数专业人士,尤其是年轻朋友而言,诗与远方虽可筑梦,但要真正走得长远,还是需要真本领,需要耐着寂寞,翻开书本,撸起袖子,在实践中学习,在学习中实践。
书如其人。陈春宝博士的这本书和他本人一样,不太容易评价。多样、丰富、立体,因此复杂,需要多花些时间去深入细品,才能发现如同一篇好的散文,贵在“形散而神不散”。全书围绕两条主线,一条是金融客户生命周期管理,另外一条是数据挖掘项目和模型的生命周期管理,这两条主线串接起了一个一个独立、完整的实战场景。这样的组织方法使读者学习各篇完整成章时,能按图索骥,实践参考;两条主线也使得知识点跳跃较大,给人点到即止的感觉。因此建议结合其他书籍同步研读,效果会更好。比如,客户关系管理方面的,V.库马尔的《赢得盈利客户》;数据挖掘领域的,本书作者的另一部著作《大数据与机器学习:实践方法与行业案例》。
金融数据的价值密度之高,堪称数据中的黄金。以银行为代表的金融机构对数据的深入挖掘分析与应用,起步不可谓不早,投入不可谓不大,成果不可谓不多,但是在这波风口中,由于内因、外因和低调(网红经济时代,低调可真是“致命”的优点),却常常被怼到了市场边缘,连市面上关于大数据与数据挖掘方面的实战类专业书籍,也大多出自互联网同仁之手。其实银行及各家金融机构藏龙卧虎,不乏像三位作者这样能够洞察业务,兼具丰富实操经验和扎实理论功底的高手。衷心期待陈春宝博士能继续坚持下去,并带动更多金融机构的同仁们积极行动进来,出版更多优秀的,特别是实战类的书籍,共同为大数据时代增添一抹属于金融数据科学家们的别样风采。
陆小勇
浦发银行信息科技部副总经理,信息服务中心主任
Preface 前 言
古之欲明德于天下者,先治其国;欲治其国者,先齐其家;欲齐其家者,先修其身;欲修其身者,先正其心;欲正其心者,先诚其意;欲诚其意者,先致其知;致知在格物。
——《礼记》
知之真切笃实处即是行,行之明觉精察处即是知。
——王阳明
大数据势不可挡。然而,对于多数公司来说,数据分析和建模能力尚未完全发展起来,虽主观意识上认同了大数据的潜在价值,也开始采集、储备数据,却不知如何才能让数据充分融入业务、帮助业务部门达成业务指标。
大数据是一种全新的业务和产品创新思维,是海量数据存储和计算的基础架构,但小数据的分析运用才是多数公司和业务领域必须关注和掌握的核心能力。本书将聚焦于实践应用,介绍数据分析、建模的方法和在业务领域的实际应用,原理和基础理论知识不是重点,因此数学公式极少,除非它比文字更能表达内容。总体上,本书不会详细罗列最热门的机器学习算法、数据挖掘方法以及人工智能,而是基于金融企业当前的实际需要,精选最具代表性的业务领域以及被广泛验证实用高效的分析建模技术,这些技术是数据分析人员必须掌握的技能。本书同时也是为掌握统计学知识和基本数据分析方法的业务专家所写,帮助他们实践、应用数据建模手段,提升对业务的引导和驾驭能力。
本书的目标读者是高级数据分析师、咨询顾问、企业内部的业务专家、高校学者和研究生,以及立志于夯实数据建模基本功,并希望不断提升的数据挖掘与数据建模人员。
内容提要
知者过之,愚者不及也;贤者过之,不肖者不及也。
——《中庸》
在学校和生活中,工作的最重要的动力是工作中的乐趣,是工作获得结果时的乐趣以及对这个结果的社会价值的认识。
——阿尔伯特·爱因斯坦
本书是一本介绍金融企业数据建模的专著。在内容上,书中以信贷(信用卡)客户的生命周期管理为主线,选取了5个在客户获取、提升、成熟和衰退环节的最经典的金融企业案例,来详细介绍最具价值与实用性的数据建模过程,每个案例既自成体系又前后呼应。
第1章介绍了数据挖掘和建模在信贷(信用卡)客户生命周期管理中的应用场景。
第2章结合信用卡客户反欺诈案例,介绍了常用的三类反欺诈手段以及欺诈评分模型的构建过程,模型采用机器学习集成算法的典范——随机森林,并给出SAS代码(各类书中绝无仅有),对回归类、决策树类、神经网络类三大类机器学习算法做了比对。
第3章结合信用卡客户精准营销案例,介绍了营销响应模型的构建、评估与应用,完整阐述从数据准备、清洗、变量粗筛选、变量压缩与转换、建模、模型评估、部署、监测与更新等模型构建过程中所涉及的操作方法。
第4章通过信用卡客户细分案例,介绍了完整的聚类过程,除快速、系统、两步聚类算法外,还详细介绍了实际分析过程中必不可少的数据预处理过程,并对聚类模型做了最完整的阐释。
第5章通过贷款违约预测案例,为零建模基础的读者提供了一个最简化的行为评分模型的构建过程,帮助零基础读者快速上手,同时简单介绍了金融企业的三大风险模型(评分卡)。
第6章结合信用卡客户流失预警与挽留案例,介绍客户价值(数值)预测与流失倾向(事件)预测两类问题的建模过程及组合应用,不拘泥于方法本身,彰显了以企业实际运用为导向的写作思路,让案例更具实用参考价值。
了解完五个案例之后,你会发现这些方法和模型在大部分业务场景中似曾相识,金融企业的数据挖掘与建模将变得易如反掌。
全书由陈春宝统稿,其中,第1、2、5、6章由陈春宝撰写,第3章由徐筱刚撰写,第4章由田建中撰写。
源代码下载
若你对书中源代码感兴趣,可与作者联系,邮箱:64346 SAS金融数据挖掘与建模:系统方法与案例解析 下载 mobi epub pdf txt 电子书 格式
SAS金融数据挖掘与建模:系统方法与案例解析 下载 mobi pdf epub txt 电子书 格式 2024
SAS金融数据挖掘与建模:系统方法与案例解析 下载 mobi epub pdf 电子书非常不错 值得拥有
评分可以,不错
评分新手慎入,随书数据和代码也没有,还要自己联系作者,作者邮箱也不一定回复
评分很好,不错;还好,值得参考
评分印刷精美物流快点个赞
评分不错的书籍,给同事代买的,物流也很快。
评分正品书,质量好,下次还买
评分特别好特别好特别好特别好特别好!!!
评分一般般一般般吧,有点贵,太贵了
SAS金融数据挖掘与建模:系统方法与案例解析 mobi epub pdf txt 电子书 格式下载 2024