Power Query: desapilar datos en una columna
A medida que continuamos con esta serie de Power Query , hemos llegado a un formato de datos común y frustrante; datos apilados en una columna. En esta publicación, investigaremos un método básico para desapilar datos.
Si bien el ejemplo que vemos a continuación probablemente fue creado por una persona que no sabía cómo estructurar los datos correctamente, este formato se puede encontrar igualmente en datos exportados o copiados de un sistema de TI (aunque los datos exportados o copiados tienden a ser una sola columna, lo cual es un poco más fácil de manejar).
La siguiente captura de pantalla muestra que la dirección tiene datos apilados en una columna.
Como puedes imaginar, manipular datos en este diseño es excepcionalmente difícil. Para que sea utilizable, cada fila de la dirección debe ser una columna separada. Power Query viene al rescate una vez más.
Descargue el archivo de ejemplo: únase al programa Insiders gratuito y obtenga acceso al archivo de ejemplo utilizado para esta publicación.
Nombre de archivo: 0174 Columna de datos de desapilado.xlsx
Tener acceso
Desapilar una columna de datos
Abra la hoja de trabajo del Ejemplo 1 del archivo descargado. Los datos se parecen a la captura de pantalla que vimos arriba.
Los datos ya están en formato de tabla, al que he llamado Clientes. Para importar los datos a Power Query, seleccione cualquier celda de la tabla y haga clic en Datos: desde tabla/rango en la cinta.
La ventana de Power Query se abrirá y mostrará los datos, que se verán como la pantalla que se muestra a continuación:
Ordenar la importación
Ahora sigamos los pasos para colocar las líneas de dirección separadas en columnas. Primero, eliminemos las filas en blanco filtrando la columna Dirección para eliminar los valores nulos.
Haga clic en la columna Cliente, luego haga clic en Transformar – Rellenar (desplegable) – Abajo desde la cinta. Esto garantizará que cada fila tenga el nombre del cliente; no debe haber ningún valor nulo en la columna Cliente.
Agregar una columna de índice y módulo
Durante las próximas transformaciones, las cosas empiezan a parecer un poco extrañas. Una vez que hayas completado todos los pasos, tendrá sentido, pero hasta entonces tendrás que confiar en mí.
Hay 3 filas para cada dirección de cliente. Nuestras próximas transformaciones incluirán una columna de números que muestre los números 0, 1 y 2 repetidamente. 0 representará la primera fila de la dirección, 1 la segunda fila de la dirección y 2 la última línea de la dirección.
Haga clic en Agregar columna – Columna de índice
Se ha agregado una columna de índice, comenzando en cero.
Seleccione esta nueva columna de índice y luego haga clic en Agregar columna – Estándar – Módulo .
Ingrese 3 en la ventana Módulo , ya que hay 3 filas en cada dirección. Haga clic en Aceptar .
Si ha seguido todos los pasos anteriores, la ventana de vista previa debería verse como la siguiente captura de pantalla:
Seleccione la columna Módulo que creamos. Haga clic en Transformar – Columna dinámica . En la ventana Columna dinámica, seleccione la columna Dirección , expanda las opciones avanzadas y seleccione No agregar , luego haga clic en Aceptar .
Echa un vistazo a la ventana de vista previa, probablemente pienses que hemos roto todo, pero todo es parte del proceso. Estamos a punto de poner esto nuevamente en orden.
Seleccione las columnas con los encabezados 1 y 2, luego aplique la transformación Transformar – Rellenar hacia abajo .
Seleccione la columna 0 y filtre para eliminar los valores nulos. La ventana de vista previa ahora mostrará los datos en el siguiente formato:
Magia ¿eh? Pasamos de pensar que todo estaba roto, a un conjunto de datos bonito y ordenado en sólo unas pocas transformaciones básicas.
Una de las habilidades críticas de Power Query es la capacidad de realizar muchas transformaciones pequeñas que eventualmente se suman y dan a los datos el formato correcto. A menudo, algo que puede parecer una pequeña transformación, como desapilar datos, puede requerir muchos pasos más pequeños.
Terminando
Sólo quedan unas simples transformaciones para ponerlo todo en orden:
- Elimine la columna Índice (seleccione la columna y haga clic en Inicio – Eliminar columnas )
- Cambie el nombre de las columnas 0, 1 y 2 (haga doble clic en el encabezado de cada columna y proporcione un nombre significativo).
Eso es todo. Los datos ya están listos. Haga clic en Cerrar y cargar para enviar los datos a Excel.
¿Qué nos enseña esto?
En esta publicación, hemos visto cómo desapilar una columna de datos. Pero lo más importante es que hemos visto que resultados que podrían parecer básicos pueden ser bastante complejos. Comprender transformaciones simples y cómo combinarlas es algo que requiere tiempo y reflexión para aprender.
Existen otros métodos para desapilar datos, aunque requieren menos pasos, son más complejos de entender para un principiante, por lo que están más allá del alcance de esta serie para principiantes.
Deja una respuesta