
Transform
本书的第二部分是深入研究数据可视化。 在本书的这一部分中,您将了解您在数据框架内遇到的最重要类型的变量类型,并学习可以使用的工具与它们使用。

您可以根据需要阅读这些章节;它们的设计基本上是独一无二的,以便可以逐步阅读它们。
12 Logical vectors 教您逻辑向量。 这些是最简单的矢量类型,但非常强大。 您将学习如何通过数字比较,如何将它们与布尔代数相结合,如何在摘要中使用它们以及如何将它们用于条件转换。
13 Numbers 深入探讨数值向量的处理工具,这些工具是数据科学的动力源泉。 你将进一步学习计数方法,以及一系列重要的转换与汇总函数。
14 Strings 将赋予你处理文本的工具:拆分字符串、精细切割、再重新拼接。 本章重点介绍 stringr 包,同时也会学习更多 tidyr 包中专用于字符串数据提取的函数。
15 Regular expressions 将带你认识这个强大的字符串处理工具。 从面对混乱字符时的茫然,到能读写复杂字符串模式,本章将完成你的蜕变。
16 Factors 介绍因子: R 语言存储分类数据的数据类型。 当变量具有固定取值范围时,或需要非字母顺序的字符串排列时,因子便是你的利器。
17 Dates and times 提供处理日期和时间的关键工具。 虽然日期时间越学越显复杂,但借助 lubridate 包,你将掌握应对常见挑战的方法。
18 Missing values 深度探讨缺失值问题。 虽然之前零散提及过,但现在是系统讨论的时候了,帮助你理解显式与隐式缺失值的区别,以及转换方式和意义。
19 Joins 作为本部分的收官之作,将教你合并多个数据框的工具。 学习连接操作会让你深入理解键的概念,并思考如何唯一标识数据集中的每一行。