发表于2024-11-28
本书重点探讨数据挖掘技术如何与临床医学深度融合,如何运用现代的数据挖掘理念、模式识别与机器学习的基本方法解决临床科研中的应用问题,包含大量案例与实证。
本书以数据挖掘与模式识别的七大原理在临床医学中的运用案例为切入点,系统而全面地介绍了医学数据挖掘的基本方法与原理,对数据分析的常用算法进行了通俗易懂的讲解。本书*大的特色是采用了案例分析与实证的方法,每一个原理、算法都在案例讲解中生动地体现出来。更重要的是,本书对临床医学的数据挖掘与模式识别技术进行了开创性、系统性的讨论,用案例展现了数据挖掘技术如何与临床医学相结合,为广大的医生、医学数据挖掘爱好者提供了很实用的技术示范、理念导入、系统思考。本书所有概念的讲解基本结构为原理讲解与案例实操的二元结构,兼顾初学者与专业人士的需要。本书重点探讨了数据挖掘技术如何与临床医学深度融合,如何运用现代的数据挖掘理念、模式识别与机器学习的基本方法解决临床科研中的应用问题,为广大的科研型临床医生提供助力,为广大的数据分析人员找到行业应用的范例,为广大初学者提供努力学习的方向,更重要的是在这个大数据时代,我们可以亲自见证数据技术是如何改变并深刻影响着临床医学的科研与教学。
邵学杰先生,是我国医学大数据概念提出的实践者与先行者,2011年邵学杰先生与国家卫生计生委医政医管局医疗质量监测中心HQMS合作首度提出建设“中国医疗云”的设想。不仅如此,邵学杰先生还是我国医学图像人工智能识别的先行者,于2012年建立**家民营人工智能与深度学习研究机构,在医学图像的人工智能与机器深度学习方面有丰富的实操经验。邵学杰先生还是医学数据挖掘的先行者,他领衔的研究团队在研究胰腺癌与二型糖尿病的关联规则,基线静息心率与心肌缺血事件的关联性,低位保肛手术的随访大数据研究中取得重要进展。
第1章 数据分析与数据挖掘的力量 1
1.1 葡萄牙医生解决世界新生儿出生缺陷的故事 2
1.2 医学数据挖掘的主要定义 5
1.2.1 数据挖掘的定义 5
1.2.2 医学数据挖掘的故事 5
1.3 医学数据模式识别的七大原理与案例讲解 6
1.3.1 什么是模式识别 6
1.3.2 7个小故事 7
1.4 临床医学领域的机器学习与人工智能 12
1.5 神经元网络的基本原理 13
第2章 临床医学的数据挖掘 20
2.1 房颤与肾功能关联现象的故事 21
2.2 支持向量机的算法原理与应用 30
2.2.1 一个故事的开场白 30
2.2.2 支持向量机的主要特点 31
2.2.3 支持向量机的应用案例 39
2.3 疾病规律与统计学革命 43
2.3.1 肝胆外科的统计学故事 43
2.3.2 双盲实验的诞生 44
2.3.3 几则很有趣的医学统计学故事 47
2.4 老年肺癌研究 50
2.4.1 数据的抓取与来源 50
2.4.2 癌症与老龄化的相关性分析 51
2.4.3 老年人肺癌手术适用性评估关键词频率 53
2.4.4 老年肺肿瘤的数据分析 54
2.4.5 英国肺癌患者38年来死亡率研究 59
2.4.6 老龄肺癌死亡率数据的三维分析 59
2.5 临床医学与数据挖掘的边缘学科 62
2.5.1 几个实例 62
2.5.2 医学统计学与医学数据挖掘的区别 69
2.5.3 有关数据挖掘是边缘学科的几个实例 72
2.5.4 一个医学数据挖掘的案例 74
第3章 临床医学与数据技术的深度融合 90
3.1 二型糖尿病与胰腺癌的故事 91
3.2 Cox回归的基本原理与应用 94
3.2.1 Cox回归的基本原理 94
3.2.2 晚期肺癌伴脑转移患者的预后多因素Cox回归 95
3.2.3 本案例的几点启示 100
3.3 医学数据分析中的故事 101
3.4 聚类的临床医学意义 103
3.4.1 聚类算法的基本定义 103
3.4.2 临床医学数据挖掘中聚类的意义 104
3.4.3 案例 112
3.5 贝叶斯算法的应用案例 113
3.5.1 一个流传甚广的故事 113
3.5.2 一个贝叶斯算法的医学案例 114
第4章 临床医学的模式识别 126
4.1 模式识别是什么 127
4.1.1 定义 127
4.1.2 临床医学模式识别的故事 127
4.2 基线静息心率的故事 130
4.3 决策树算法 132
4.4 最大期望(EM)算法 135
4.5 算法的规律与临床医学的本质 140
4.5.1 算法的本质是什么 140
4.5.2 数据挖掘中医学的本质 141
第5章 医学数据挖掘的常用工具 146
5.1 SAS挖掘软件运用案例 147
5.2 Weka软件介绍 150
5.3 Matlab案例 152
5.4 R语言案例 162
5.5 临床医生如何用好挖掘工具 164
第6章 专业级医学SCI论文中的统计工具 169
6.1 医学数据中的T值与P值故事 170
6.2 K线图的故事 172
6.3 国际顶级期刊上的数据技术 174
6.4 SCI荟萃分析中的统计学工具 180
6.4.1 研究对象及入选标准 181
6.4.2 统计学处理 181
医学数据挖掘的故事
医学数据挖掘一般是指从大量的医学数据中通过算法搜索来认识隐藏于其中疾病新规律的过程。
今天这里要讲述一个关于肠道菌群与心血管疾病关联性的故事。在微生物学诞生后不久,人们就发现,在动物的消化道中存在有不少微生物。例如在牛、羊、兔等食草动物的胃或盲肠中,就存在大量以细菌为主的微生物群体。由于食草动物摄入的植食性饲料中,纤维素、半纤维素等多糖难以依靠动物体自身分泌的酶液消化,而微生物群体中包含的纤维素消化菌、半纤维素消化菌等可以较好地将多糖转化为低聚糖和寡糖,从而促进对这些营养物质的吸收。
随着医学的发展,人们也注意到,在人类的肠道,尤其是结肠(也就是平常所说的大肠)中,也存在着大量微生物。这些以细菌为主的微生物种类极多,数量极大。肠道菌群并非是生来就有的,它们实际上是“外来户”。在母体子宫内,胎儿所处的是一个几乎无菌的环境,因此胎儿肠道内也是无菌的。当胎儿出生之后的几天内,细菌通过分娩时阴道物质摄入、哺乳时的口腔摄入以及空气吸入等途径进入新生儿体内,并在肠道内定植,形成新生儿最初的肠道菌群。随着婴儿的成长,肠道菌群的种类结构逐渐趋于稳定,最终形成成熟的肠道菌群。这些微小的生物群体就这样不知不觉地定居到人体之内,悄无声息地与主人相随一生。
近期的多项研究表明,肠道菌群和人体的代谢疾病具有重要关系。肠道菌群失衡可能是造成肥胖、糖尿病等多种代谢异常的重要原因之一。造成代谢异常的主要原因,是失衡的肠道菌群产生的脂多糖等内毒素进入人体,被免疫细胞识别后产生多种炎症因子,使得机体进入低度炎症状态,从而产生代谢异常。例如,若长期进食高脂、高糖食物,可造成肠道菌群中条件致病菌比例增加,而共生菌比例下降,从而使得食物中摄取的能量更容易转化为脂肪累积于皮下,造成肥胖。此外,低度炎症还能促使机体对胰岛素响应程度下降,造成胰岛素抵抗,进而发展为糖尿病。
这些医学观察的结论完全得益于数据挖掘技术的进步,医生们从医治经验中发现患有肠道疾病的人往往也同时患有心血管疾病。一开始医生们并没有注意到这个现象,当越来越多的病例记录了同一现象时,医生们开始怀疑两者之间的关联性。但是怀疑代替不了科学结论,需要定量化的数据支持,越来越多的病例数据汇总后经过关联规则算法最终找到了大量的支持病例,最终现代医学解开了这个秘密。肠道菌群与中风,原本风马牛不相及的两个病种终于确立了因果关系。
有意思的是,最新的医学数据挖掘表明,肠道菌群的数量分布居然与抑郁症有关联,医学科学家正在试图解开这个秘密。
这个故事生动地表达了医学数据挖掘的魅力与能量。利用大量的临床医学数据发现新的医学疾病规律正是数据挖掘在医学,特别是临床医学领域的巨大意义。
……
序
Big Data(大数据)在这几年突然火红于日常生活的各项领域中,连临床医疗也不例外,其实早期就存在许多通过数据来佐证或者分析预测结果的例子,但是当时在大多数的情况之下,统计运算不够快速成为了资料分析的一大限制,因此大多数资料是被临床研究工作者们放在一边而从未思考该如何运用的。伴随着信息科技的进步以及发达,能为我们所分析的数据将呈现爆炸性的成长,因此人们能从数据中学习的知识会更加丰富。和其他科学领域相比,需要透过大量临床试验的医学领域算是进步较缓慢的学科。管仲曾说过:“不明于数欲举大事,如舟之无楫而欲行于大海也。”意思是说在不清楚相关数据的情况下想做大事,无疑是没有桨的船想航行于汪洋大海中一样。也就是说,在医疗大数据的时代下,“dry lab”的医疗数据研究将会是协助医学领域快速进步的一大重要关键。本书通过大量临床医学的实例,由浅入深地介绍各项数据分析以及数据挖掘的方法和工具,将大量的临床医学数据化繁为简。相信无论是在校的学生或是临床研究者,本书都将会是学习或科研路上不可或缺的好伙伴。
谢邦昌
台北医学大学管理学院及大数据研究中心 院长/主任
中华市场研究协会理事长
中华资料采矿协会荣誉理事长
前 言
在医学大数据时代,数据技术带来了临床医学科研的革命性进步。本书通过对医疗数据挖掘的基本理论的阐述,将现代统计学与数据挖掘技术有机结合,讲述了大量的医学数据挖掘的案例,提供了大量的医学数据挖掘的实操方法。医学数据模式识别的七大原理与案例讲解是本书具有独创性的对医学数据技术的全面概括与总结,七大原理的首次提出也是医学数据挖掘技术上升到系统理论的重要实践与创新。无论是预测性建模、解释性建模、知识性建模与描述性建模,抑或是序列模式建模、依赖关系建模、异常模式建模,模式识别的类型规律跃然纸上,为专业人士或初学者厘清了数据挖掘与模式识别的基本类型特征。
不仅如此,本书选取的大量的医学数据挖掘案例为本书的实用性增加了学以致用的特色,凡认真阅读本书的读者都会从理论与实操两个层面全面、系统、实用地了解医学数据挖掘的原理与方法。本书以胰腺癌与二型糖尿病的关联规则、乳腺癌图片智能识别的挖掘算法、心电信号大数据的人工智能识别、低位前切保肛术的荟萃分析、贝叶斯网络预测高血压患者心血管风险、基线静息心率评估心血管事件、老年肺癌研究的荟萃分析等实用数据技术为切入点,使初学者能够掌握医学数据挖掘的基本理论与方法,因此是一本很好的入门级教科书。
对于资深的临床医生、医学博士、论文写作者而言,本书也是一本很好的案例参考书。特别是对于医学科研课题而言,本书提供了强大的实际操作技术培训与案例讲解,从顶级的国际期刊《自然》、《细胞》、《柳叶刀》等杂志选取经典的数据分析案例,用生动的方法让读者可以学到医学论文中数据、图表、算法的实际使用方法;因而对于专业人员而言,本书又是一本很好的资深级别的专业用书。
我们相信,无论您是初学者还是资深的专业人士,本书都将为您提供极大的可读性、趣味性和科学性。
医疗革命:医学数据挖掘的理论与实践 下载 mobi pdf epub txt 电子书 格式 2024
医疗革命:医学数据挖掘的理论与实践 下载 mobi epub pdf 电子书不错又快又好的京东,一直买的,信赖。
评分简单易懂,入门级的好书
评分不错,这类书不多
评分非常好的书,必须赞,搞活动买的,我很满意,嗯,继续继续
评分非常好的书,必须赞,搞活动买的,我很满意,嗯,继续继续
评分本书值得信赖,还没有看,先屯起来
评分怎么学?怎么学?怎么学?怎么学?怎么学?怎么学?
评分书不错,希望能好好看完。
评分数据科学专业指导书,理论联系实际
医疗革命:医学数据挖掘的理论与实践 mobi epub pdf txt 电子书 格式下载 2024