README.Rmd

---
output: 
  github_document
---
```{r setup, include=FALSE}
library(datos)
library(ggplot2)
library(dplyr)
library(purrr)
library(stringr)
knitr::opts_chunk$set(echo = TRUE)
```

# datos <img src="man/figures/logo.png" align="right" width = "120px"/>

[![CRAN status](https://www.r-pkg.org/badges/version/datos)](https://cran.r-project.org/package=datos)
[![R-CMD-check](https://github.com/cienciadedatos/datos/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/datos/actions)


Este paquete provee la traducción al español de conjuntos de datos en inglés originalmente disponibles en otros paquetes de R. Los datos traducidos son los que se utilizan en los ejemplos del libro [R para Ciencia de Datos](https://cienciadedatos.github.io/r4ds/), la versión en español de [R for Data Science](https://r4ds.had.co.nz/) de Hadley Wickham & Garrett Grolemund. El paquete `datos` puede utilizarse junto con el libro o de manera independiente como fuente de datos de práctica en español. 

## Instalación

El paquete `datos` puede instalarse directamente desde CRAN:

```{r, eval = FALSE}
install.packages("datos")
```

La versión en desarrollo está disponible en GitHub y puede instalarse utilizando `remotes`:

```{r, eval = FALSE}
# install.packages("remotes")
remotes::install_github("cienciadedatos/datos")
```


## Traducciones

Las traducciones disponibles dentro de `datos` son las siguientes:

```{r, echo = FALSE}

specs <- list.files("inst/specs")
all <- map(file.path("inst", "specs", specs), yaml::read_yaml)
sources <- map_chr(all, ~.x$df$source)
pkgs <- tibble(
  Nombre = map_chr(all, ~.x$df$name),
  Titulo = map_chr(all, ~.x$help$title),
  Paquete = map_chr(strsplit(sources, "::"), ~.x[[1]]),
  Dataset = map_chr(strsplit(sources, "::"), ~.x[[2]])
)

pkgs <- tibble(
  Nombre = map_chr(all, ~.x$df$name),
  Titulo = map_chr(all, ~.x$help$title),
  Paquete = map_chr(strsplit(sources, "::"), ~.x[[1]]),
  Dataset = map_chr(strsplit(sources, "::"), ~.x[[2]])
)

pkgs %>%
  arrange(Paquete, Dataset) %>%
  knitr::kable()
```

Los datos para practicar la manipulación de cadenas (_strings_) son `oraciones`, `palabras` y `frutas`. 

## Uso

El paquete `datos` se carga igual que todos los paquetes de R: 

```{r}
library(datos)
library(ggplot2)
library(dplyr)
```

Las variables que contienen los datos van a estar disponibles inmediatamente para su uso, pero los datos no se traducirán hasta que la variable sea "llamada" explícitamente en el código que se escriba. En este ejemplo, el _dataset_ `diamantes`, que proviene de `ggplot2::diamonds`, se carga en la memoria de R en el momento en que lo llamamos por primera vez en español:

```{r}
glimpse(diamantes)
```

Los datos traducidos quedarán cargados durante toda la sesión de R:

```{r, eval = FALSE}
diamantes %>%
  filter(corte == "Bueno") %>%
  ggplot() +
  geom_boxplot(aes(claridad, precio, fill = claridad)) +
  theme(legend.position = "none") +
  labs(title = "Diamantes", subtitle = "Precio y claridad")
```

<img src="man/figures/diamantes.png">