
会员
大数据分析处理(慕课版)
教材教辅研究生/本科/专科教材10.1万字
更新时间:2024-04-23 17:44:15 最新章节:项目实践
书籍简介
本书采用理论知识与任务案例相结合的形式,以PyCharm为主要开发工具,系统地阐述了大数据分析处理工作流程中的重要步骤,介绍了大数据分析过程中常用的几种第三方库。本书共13个单元,第1单元介绍了大数据分析处理的概念;第2、3单元介绍了大数据分析中科学计算与统计分析的相关知识;第4-7单元介绍了使用Pandas实现数据预处理的方法;第8单元介绍了使用Scikit-learn实现简单的机器学习的方法;第9单元介绍了使用Matplotlib、Seaborn绘制图表的方法;第10-13单元分别介绍了4个大数据分析处理的综合案例。单元1-9中,每个单元都包含了相关知识部分和任务实现部分,任务实现部分一般包含多个任务的具体实现过程,每个任务后面都有课堂实践,通过完成实践操作,读者可以进一步巩固所学知识。本书既可作为高等院校大数据技术专业的教材,也可作为大数据爱好者的自学书籍。
品牌:人邮图书
上架时间:2024-02-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
郭永洪 贺萌主编
最新上架
- 会员随着计算机技术的持续突破,人工智能生成内容(AIGC)应运而生,显示出其在内容创作领域的巨大潜力。本书深入浅出地探讨了AIGC的理论基础、实践应用与发展前瞻,是技术与创新并重的专业指南。本书主要内容包括AIGC概述、AIGC工具与应用,重点介绍了写作类、图表类、演示文稿类、图像类、音乐类及视频类AIGC工具的实操技巧,旨在为读者提供一条清晰的学习与应用路径。本书内容前沿,案例翔实,不仅适合作为高等教材教辅9.4万字
- 会员本书使用分学科、多指标综合评价,以及定量评价与定性评价相结合的研究方法,从我国正在出版的中文期刊中评选出1987种核心期刊,具有较高的学术水平和使用价值。教材教辅63.3万字
- 会员本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验教材教辅8万字
- 会员本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。本书具有实用性和可操作性强、语言教材教辅6.2万字
- 会员本书根据计算机科学与技术专业对离散数学的教学要求,参考国内外众多优秀的离散数学教材,并结合教学组老师多年的教学实践编写而成。本书对离散数学的核心知识单元进行了系统的理论阐述,对离散数学的分析证明方法进行了严谨的介绍,并通过丰富的应用实例介绍了离散系统建模,旨在帮助读者在掌握理论基础的同时,理解如何利用这些理论知识来分析和解决问题。作为《离散数学及其应用》的第1版,本书将函数的相关内容列为独立章节,教材教辅19万字
- 会员Spark?SQL是Spark用于处理结构化数据的一个模块。本书共8章内容,由浅入深地讲解Spark?SQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。通过本书的学习,读者能够掌握Spark?SQL核心技术。本书每章安排了习题和总结,以便使读者能更好地学习和更牢固地掌握Spark?SQL编程方法。此外,本书还提供了PPT教学课件、源代码等配套资源,供使用本书的读教材教辅7.1万字