Quiz de final de capítulo
¡Vimos muchas cosas en este capítulo! No te preocupes si no te quedaron claros todos los detalles; los siguientes capítulos te ayudarán a entender cómo funcionan las cosas internamente.
Antes de seguir, probemos lo que aprendiste en este capítulo:
1. ¿Desde qué ubicaciones te permite cargar datasets la función load_dataset() en 🤗 Datasets?
2. Supón que cargas una de las tareas de GLUE así:
from datasets import load_dataset
dataset = load_dataset("glue", "mrpc", split="train")
¿Cuál de los siguientes comandos a a producir una muestra aleatoria de 50 elementos de dataset
?
3. Supón que tienes un dataset sobre mascotas llamado pets_dataset , que tiene una columna name que contiene el nombre de cada mascota. ¿Cuál de los siguientes acercamientos te permitiría filtrar el dataset para todas las mascotas cuyos nombres comienzan con la letra “L”?
4. ¿Qué es la proyección en memoria ( memory mapping )?
5. ¿Cuáles son los principales beneficios de la proyección en memoria?
6. ¿Por qué no funciona el siguiente código?
from datasets import load_dataset
dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]