身边的信息学是垂直的信息类学科咨询和服务平台,致力于洞悉最前沿的教育动态与技术热点,共享最优质的教学资源与书籍信息。
今天为您推荐一本精品图书--大数据分析实用教程——基于Python实现(9),本书配套资源丰富(电子课件、教学大纲、源程序,教学视频),欢迎申请样书(链接见下方)
1内容介绍本书对大数据分析的原理与Python程序实现进行了系统的介绍,每种算法都采用sklearn和Matplotlib分别进行程序实现及数据可视化。本书共8章,内容包括大数据分析概述、Python数据分析与可视化基础、关联规则与推荐算法、聚类算法及其应用、分类算法及其应用、回归与逻辑回归、人工神经网络、支持向量机等。
本书在理论上突出可读性,在实践上强调可操作性,实践案例丰富,实用性强。随书提供微课视频(正文对应处扫码可观看)、教学课件、习题答案、教学大纲等教学资源。
本书可作为高等院校相关专业大数据分析或大数据概论等课程的教材。也可供从事大数据分析、机器学习的人员作为参考书。
2图书目录出版说明
前言
第1章大数据分析概述1
1.1大数据概述1
1.1.1大数据的定义和特征1
1.1.2大数据处理的过程2
1.1.3大数据的职业岗位4
1.2云计算—大数据的处理架构4
1.2.1云计算的定义和特点4
1.2.2云计算的体系结构6
1.2.3云计算的分类7
1.2.4虚拟化技术9
1.3Hadoop大数据处理平台11
1.3.1Hadoop的发展历史及版本11
1.3.2HDFS的组成13
1.3.3HDFS读取和写入文件15
1.3.4MapReduce并行编程框架16
1.3.5YARN资源管理器19
1.3.6Hadoop生态系统及其安装22
1.4NoSQL数据库24
1.5大数据分析技术26
1.5.1大数据分析的方法26
1.5.2大数据分析的种类27
1.5.3大数据分析的层次28
1.5.4大数据分析的工具29
1.5.5大数据分析面临的挑战29
1.5.6大数据分析的数据类型30
习题与实验31
第2章Python数据分析与可视化基础34
2.1Python程序入门34
2.1.1一些简单的Python程序34
2.1.2序列数据结构36
2.1.3序列处理函数37
2.1.4函数和类38
2.2Python数据分析工具41
2.2.1Anaconda的使用41
2.2.2Spyder集成开发环境42
2.2.3numpy库42
2.3数据可视化—基于Matplotlib库45
2.3.1绘制曲线图46
2.3.2绘制散点图等其他图形50
2.4SciPy库54
2.5sklearn库56
2.5.1机器学习的概念和方法56
2.5.2样本及样本的划分58
2.5.3导入或创建数据集62
2.5.4数据预处理65
2.5.5数据的降维68
2.5.6调用机器学习模型70
习题与实验71
第3章关联规则与推荐算法73
3.1关联规则挖掘73
3.1.1基本概念73
3.1.2Apriori算法75
3.1.3Apriori算法的程序实现79
3.1.4FP-Growth算法80
3.2推荐系统及算法83
3.2.1协同过滤推荐算法84
3.2.2协同过滤推荐算法应用实例86
3.2.3推荐算法的MapReduce实现89
3.2.4协同过滤算法的sklearn实现91
习题与实验94
第4章聚类算法及其应用96
4.1聚类的原理与实现96
4.1.1聚类的概念和类型96
4.1.2如何度量距离96
4.1.3聚类的基本步骤99
4.2层次聚类算法
4.2.1层次聚类法举例
4.2.2层次聚类法sklearn实现
4.3K-means聚类算法
4.3.1K-means聚类算法原理和实例
4.3.2K-means聚类算法的sklearn
实现
4.4K-medoids聚类算法
4.4.1K-medoids聚类算法原理和实例
4.4.2K-medoids聚类算法的sklearn
实现
4.5DBSCAN聚类算法
4.5.1DBSCAN聚类算法原理和实例
4.5.2DBSCAN聚类算法的sklearn
实现
习题与实验
第5章分类算法及其应用
5.1分类的基本原理
5.1.1分类与聚类的区别
5.1.2分类的步骤
5.1.3分类模型预测结果的评估
5.1.4sklearn库的常用分类算法
5.2K-近邻分类算法
5.2.1K-近邻分类算法原理和实例
5.2.2sklearn中分类模型的编程步骤
5.2.3K-近邻分类算法的sklearn实现
5.2.4绘制分类边界图
5.2.5确定最优的k值
5.3朴素贝叶斯分类算法
5.3.1朴素贝叶斯原理与实例
5.3.2朴素贝叶斯分类的常见问题
5.3.3朴素贝叶斯分类算法的sklearn
实现
5.4决策树分类算法
5.4.1信息论基础
5.4.2ID3算法
5.4.3C4.5算法
5.4.4CART算法
5.4.5决策树分类算法的sklearn程序
实现
5.5随机森林分类算法
5.5.1集成学习理论
5.5.2随机森林分类的理论与实例
5.5.3随机森林分类算法的sklearn
实现
习题与实验
第6章回归与逻辑回归
6.1线性回归
6.1.1相关与回归
6.1.2线性回归分析
6.1.3线性回归方程参数的求法
6.1.4线性回归模型的sklearn实现
6.2逻辑回归
6.2.1线性分类模型的原理
6.2.2逻辑回归模型及实例
6.2.3逻辑回归模型的sklearn实现
习题与实验
第7章人工神经网络
7.1神经元与感知机
7.1.1人工神经元与逻辑回归模型
7.1.2感知机模型
7.1.3感知机模型的Python实现
7.1.4多层感知机模型
7.2人工神经网络的核心要素
7.2.1神经元的激活函数
7.2.2损失函数
7.2.3网络结构
7.2.4反向传播
7.2.5人工神经网络的sklearn实现
7.3深度学习与深度神经网络
7.3.1深度学习的概念和原理
7.3.2TensorFlow概述
7.3.3卷积神经网络
习题与实验
第8章支持向量机
8.1支持向量机的理论基础
8.1.1支持向量的超平面
8.1.2支持向量机间隔及损失函数
8.1.3非线性支持向量机与核函数
8.1.4支持向量机分类的步骤
8.2支持向量机的sklearn实现
8.2.1绘制决策边界
8.2.2绘制支持向量机的分类界面
8.2.3支持向量机参数对性能的影响
习题与实验
参考文献
3编辑推荐★详解大数据分析的基本概念、原理及Python数据分析基础知识。
★通过sklearn、Matplotlib,结合大量实例系统讲解大数据分析方法。
4配套资源1.电子课件
2.教学大纲
3.源程序
4.配套视频
5图书详情扫描下方