Import

在这一部分中,你将学习如何将更广泛的数据导入R,以及如何将其转换为适合分析的格式。 有时只需调用相应数据导入包中的函数即可完成。 但在更复杂的情况下,可能需要同时进行数据清洗和转换,才能得到你更希望使用的规整矩形数据。

Our data science model with import highlighted in blue.
Figure 1: 数据导入是数据科学过程的开始;没有数据,你就无法进行数据科学!

在本部分中,你将学习如何访问通过以下几种方式存储的数据:

有两个重要的 tidyverse 包我们在此不做讨论:haven 和 xml2。 如果你正在处理来自 SPSS、Stata 和 SAS 文件的数据,请查阅 haven 包,https://haven.tidyverse.org。 如果你正在处理 XML 数据,请查阅 xml2 包,https://xml2.r-lib.org。 除此之外,你可能需要自行研究来确定需要使用的包;谷歌会是你的好帮手😃。