Python数据分析与挖掘实战在线阅读
会员

Python数据分析与挖掘实战

翟世臣 张良均主编
开会员,本书免费读 >

计算机网络数据库13.6万字

更新时间:2025-02-08 17:44:42 最新章节:课后习题

立即阅读
加书架
下载
听书

书籍简介

本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预测、电视产品个性化推荐,以及基于TipDM大数据挖掘建模平台实现金融服务机构资金流量预测。本书大部分章节包含实训和课后习题,通过练习和操作实践,可帮助读者巩固所学的内容。本书可作为“1+X”证书制度试点工作中的大数据应用开发(Python)职业技能等级(高级)证书的教学和培训用书,也可作为高校数据科学或人工智能相关专业的教材,还可作为数据挖掘爱好者的自学用书。
品牌:人邮图书
上架时间:2022-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

翟世臣 张良均主编
主页

最新上架

  • 会员
    《数据分析师手记:数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发,使用问答的形式对数据分析中的72个核心知识点进行讲解,构建了数据分析的知识框架,带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图,针对具体的方法、技术进行延伸学习。
    刘林 李朝成 饼干哥哥计算机16.8万字
  • 会员
    本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现
    王凤刚计算机7.1万字
  • 会员
    本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,
    赵明渊 唐明伟主编计算机12万字
  • 会员
    高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证
    (美)普拉桑特·苏特卡尔计算机11.7万字
  • 会员
    这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影
    李渝方计算机12.7万字
  • 会员
    本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训
    李雁翎编著计算机6.9万字
  • 会员
    本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
    黄佳计算机12万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的
    苏海波 刘译璟 易显维 苏萌计算机21.6万字

同类书籍最近更新

  • 会员
    本书主要面向架构师,或者是有具体大数据问题需要解决的工程师;也适合从零开始搭建大数据结构,或者需要将现有的非大数据的需求修改成大数据方案的读者。你将从书中学到以下方面的知识:◎数据存储◎计算资源◎计算模型◎大数据应用◎数据治理◎大数据与人工智能
    陆晟 刘振川 汪关盛等编著数据库12.1万字
  • 会员
    本书以区块链科普内容为主,同时兼顾专业级别的实战技能。科普级别的内容旨在以妙趣横生的手法向公众普及区块链知识,包括公共账本的概念及记账机制、数据块的“指纹”与“指针”、解答谜题证明工作量、区块树被剪枝成树干(链)、公有链的社会条件、分蛋糕的“军备竞赛”、货币发行、账户与钱包、矿池与交易所、以太坊的机器人造“币”(Token)、联盟链的“减”与“加”,等等。专业级别的内容旨在为区块链技术从业者提供必
    漆英 冯浩铭数据库21.1万字
  • 会员
    本书是以最新《全国计算机等级考试二级Access数据库程序设计考试大纲》为基本要求,结合“Access数据库程序设计”课程教学经验编写而成的。在编写过程中,注重降低理论难度,增强实践环节,采用以案例带动理论教学的写作模式,用一个“教学管理”数据库的创建和使用案例贯穿全书,最后通过前面所学的内容介绍了一个“学生信息管理系统”综合案例的创建过程。本书适合作为高等学校非计算机专业“数据库技术及应用”课程
    邵敏敏 董保莲 张楠数据库12.4万字
  • 会员
    全书共分为浅谈大数据、探寻云计算世界、人工智能、探寻物联网世界、身边的移动互联网五个模块,每个模块内容分为概述性介绍、基础原理讲解及深入技术分析与应用三个层次。本书紧跟现代化信息技术,涉及的知识面广、内容深入,部分知识有一定的难度,对于学生理解和掌握现代信息技术具有很高的理论和应用价值。学习和掌握本书五个模块的知识后,有利于学习和掌握其技术门类,还有利于了解和学习相关的现代信息技术,快速上手、解决
    游新娥数据库19.8万字
  • 会员
    作者针对高维稀疏数据挖掘问题,从数据预处理的角度,研究对象—属性空间的划分问题,其目的是把所研究的数据挖掘空间分解为若干规模较小的对象:属性空间,从而降低实际数据挖掘的难度。本书针对高维稀疏数据挖掘问题,以降低数据挖掘规模,建立了体系完整的数据预处理理论和方法,具有很强的理论意义和实际应用前景。
    祝琴数据库6.4万字
  • 会员
    《MATLAB基础及其应用教程》基于MATLAB7.1版,详细介绍了MATLAB的基础知识、数值计算、符号运算、图形处理、程序设计、SIMULINK仿真等内容,为配合教学,各章编写了教学提示、教学要求和爿题,书后附有上机实验指导。
    周开利 邓春晖数据库12.4万字