Importe datos PDF a Excel con Power Query

Índice
  1. Video
  2. Objetivo
  3. Pasos
    1. Paso 1: Conéctese a PDF
    2. Paso 2: seleccione la tabla deseada
    3. Paso 3: cargar en Excel
  4. Conclusión

Históricamente, hemos podido obtener datos PDF en Excel utilizando copiar y pegar estándar o algunas herramientas de terceros. Ahora tenemos otra opción. Podemos usar Power Query para recuperar valores de archivos PDF. Esta publicación explica los conceptos básicos.

Video

Objetivo

Tenemos un archivo PDF, quizás se vea así:

Nos gustaría encontrar una forma de extraer la tabla de comisiones en Excel, así:

Podemos lograr esto usando Power Query.

Nota: dependiendo de cuándo esté leyendo esto y qué versión de Excel esté utilizando, es posible que tenga o no la opción Desde PDF. Al momento de escribir este artículo, esta fuente de datos está disponible en O365. Si su versión de Excel no admite esto, es posible que pueda lograrlo con Power BI.

Pasos

Seguiremos estos pasos juntos.

  1. Conectar a PDF
  2. Seleccione la tabla deseada
  3. Cargar en Excel

Paso 1: Conéctese a PDF

Primero, usamos el comando Datos Obtener datos Desde archivo Desde PDF . Luego buscamos el archivo PDF deseado y hacemos clic en Importar. Esto abrirá el cuadro de diálogo Navegador.

Nota: este comando se encuentra dentro del grupo de comandos Obtener y transformar. Dependiendo de su versión de Excel, es posible que no tenga este comando. Al momento de escribir este artículo, esta fuente de datos está disponible en O365. Si su versión de Excel no admite esto, es posible que pueda lograrlo con Power BI.

Paso 2: seleccione la tabla deseada

En el cuadro de diálogo Navegador, podemos ver una lista de elementos reconocidos por Power Query que podemos importar.

Podemos ver Tablas y Páginas, y cuando seleccionamos una podemos ver una vista previa:

Cuando inspeccionamos el archivo PDF, notamos que los valores de las comisiones de ventas no se almacenaron en una “tabla” formal… sino que se crearon con pestañas. En otras palabras, Power Query pudo detectar las pestañas y traducirlas al tipo de datos de tabla tabular que queremos.

Cuando inspeccionamos la Tabla002, vemos esto:

Cuando miramos el PDF, notamos que esta sección tampoco estaba almacenada en una “tabla” verdadera… era una lista con viñetas. Entonces, Power Query tradujo esta lista con viñetas en una tabla importable.

También podemos ver la página completa, así:

Además, si los datos tabulares que desea importar abarcan varias páginas PDF, puede marcar la casilla Seleccionar varios elementos . Seleccione todos los elementos que desee y, una vez en Power Query, puede agregar varias tablas en una sola tabla para enviarlas a Excel.

Paso 3: cargar en Excel

Como queremos recuperar la tabla de comisiones, la seleccionamos:

Dado que nuestros datos están limpios y listos para funcionar, usamos el comando Cargar Cargar en y enviamos los resultados a una tabla de Excel y aplicamos el formato deseado:

Si necesitáramos limpiar los datos, por ejemplo, eliminando filas y columnas adicionales, desvinculando, agregando columnas calculadas, etc., entonces podríamos hacer clic en el botón Transformar datos. Luego, desde el Editor de Power Query, podríamos aplicar cualquier transformación deseada antes de enviar los datos a Excel.

Conclusión

Si tiene otras alternativas para importar datos PDF a Excel, o formas de mejorar esta publicación, compártala publicando un comentario a continuación.

Si desea practicar, no dude en descargar el archivo de práctica en PDF a continuación.

  • Archivo de práctica: Acuerdo.pdf

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir

Este sitio web utiliza cookies para mejorar la experiencia del usuario y garantizar un funcionamiento eficiente. Al utilizar nuestro sitio web, aceptas todas las cookies de acuerdo con nuestra política de cookies. Leer mas...