🔢 第 14 章 数据分析案例
本书正文的最后一章,我们来看一些真实世界的数据集。对于每个数据集,我们会用之前介绍的方法,从原始数据中提取有意义的内容...
💫 第 13 章 Python建模库介绍
本书中,我已经介绍了Python数据分析的编程基础。因为数据分析师和科学家总是在数据规整和准备上花费大量时间,这本书的重点在...
💼 第 12 章 pandas高级应用
前面的章节关注于不同类型的数据规整流程和NumPy、pandas与其它库的特点。随着时间的发展,pandas发展出了更多适合高级用户的功...
🕓 第 11 章 时间序列
时间序列(time series)数据是一种重要的结构化数据形式,应用于多个领域,包括金融学、经济学、生态学、神经科学、物理学等。
👑 第 10 章 数据聚合与分组运算
对数据集进行分组并对各组应用一个函数(无论是聚合还是转换),通常是数据分析工作中的重要环节。在将数据集加载、融合、准备...
📈 第 9 章 绘图和可视化
信息可视化(也叫绘图)是数据分析中最重要的工作之一。它可能是探索过程的一部分,例如,帮助我们找出异常值、必要的数据转换...
🚧 第 8 章 pandas 数据规整:聚合、合并和重塑
在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析。本章关注可以聚合、合并、重塑数据的方法。
🛸 第 7 章 数据清洗和准备
在数据分析和建模的过程中,相当多的时间要用在数据准备上:加载、清理、转换以及重塑。这些工作会占到分析师时间的80%或更多...
🚚 第 6 章 数据加载、存储与文件格式
访问数据是使用本书所介绍的这些工具的第一步。我会着重介绍pandas的数据输入与输出,虽然别的库中也有不少以此为目的的工具。 ...
🥃 第 5 章 pandas 入门
pandas是本书后续内容的首选库。它含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。
4.1-Numpy练习题100题
🔊 题目来自黄海广博士整理的 [Github - numpy - 100](https://github.com/rougier/numpy-100),未翻译的题目就是平常基本很...
🍩 第 4 章 Numpy 基础:数组和矢量计算
NumPy(Numerical Python的简称)是Python数值计算最重要的基础包。大多数提供科学计算的包都是用NumPy 的数组作为构建基础。
🍭 第 3 章 Python 语法基础 + 数据结构 + 函数 + 文件
🚨 因为这本书是专注于 Python 数据处理的,对于一些 Python 的数据结构和库的特性难免不足。因此,本章和第 3 章的 Python ...
🧀 第 2 章 IPython 和 Jupyter Notebook
Python是解释性语言。Python解释器同一时间只能运行一个程序的一条语句。
😁 第 1 章 准备工作
本书讲的是利用Python进行数据控制、处理、整理、分析等方面的具体细节和基本要点。
11-正则表达式
字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址,...
10-进程和线程
要让Python程序实现多进程(multiprocessing),我们先了解操作系统的相关知识。
9-IO编程
IO在计算机中指Input/Output,也就是输入和输出。由于程序和运行时数据是在内存中驻留,由CPU这个超快的计算核心来执行,涉及到...
8-错误、调试和测试
Python内置了一套异常处理机制,来帮助我们进行错误处理。
7-面向对象高级编程
数据封装、继承和多态只是面向对象程序设计中最基础的3个概念。在Python中,面向对象还有很多高级特性,允许我们写出非常强大的...
站点地图 在线访客: 今日访问量: 昨日访问量: 总访问量:
扫码支付后自动跳转查看