Convertir nóminas PDF a Excel para asesorías

Guía para convertir nóminas españolas en PDF a Excel, con campos de devengos, deducciones, bases, IRPF y trazabilidad para asesorías.

Published
Updated
Reading Time
15 min
Topics:
Financial DocumentsPayrollSpainExcelNóminasAsesoría laboral

Para convertir nóminas PDF a Excel en España, la estructura más útil no es una copia del diseño del recibo, sino una tabla normalizada: una fila por trabajador y periodo, con columnas separadas para identificadores, periodo de liquidación, devengos, deducciones, bases de cotización, retención de IRPF, líquido a percibir y aportación empresarial. Cada fila debería conservar también el archivo, la página o el ID documental de origen, porque una hoja de nóminas sin trazabilidad pierde valor en cuanto entra en revisión de asesoría, auditoría o inspección.

Ese punto distingue este trabajo de una plantilla de nómina. Una plantilla sirve para crear un recibo; aquí el problema es el contrario. La empresa, la asesoría o el auditor ya tiene los recibos emitidos, normalmente en PDF, y necesita convertirlos en datos comparables. Si se vuelcan los textos del PDF en celdas con la misma forma visual del documento, la hoja puede parecer completa, pero no permite responder preguntas básicas: cuánto se devengó por trabajador, qué parte corresponde a complementos, qué base de cotización se informó, qué IRPF se retuvo o qué coste empresarial aparece en cada nómina.

La unidad de trabajo debe ser el trabajador-periodo. En una asesoría, eso permite filtrar por cliente, mes, NIF, NAF, centro de trabajo o concepto salarial. En auditoría, permite muestrear una fila y volver al PDF original. En RRHH, permite acumular periodos para preparar análisis retributivos. En una entidad que justifica subvenciones, permite separar coste laboral por proyecto sin reconstruir manualmente cada recibo.

Cuando el volumen crece, esta decisión de diseño pesa más que la herramienta de conversión. Un lote de cincuenta nóminas puede revisarse manualmente; un histórico de dos años con cientos o miles de PDFs necesita una estructura que aguante duplicados, meses parciales, cambios de contrato y etiquetas distintas entre programas de nómina. El objetivo no es solo extraer datos de nóminas PDF a Excel, sino extraerlos con una forma que después pueda auditarse.

Una tabla mínima para empezar debería incluir empresa, trabajador, periodo, totales, bases, retenciones, aportación empresarial y origen documental. Después se pueden añadir columnas de detalle para conceptos salariales, percepciones no salariales, anticipos, embargos, pagas extras prorrateadas o centros de coste. Pero si falta la fila correcta desde el inicio, cualquier análisis posterior se apoyará en una hoja que mezcla documentos, conceptos y periodos.

Campos obligatorios y útiles del recibo de salarios español

Una nómina española no es un recibo de pago genérico. Es un recibo individual de salarios con bloques laborales, fiscales y de Seguridad Social que conviene respetar al pasarlo a Excel. La Orden ESS/2098/2014 aprobó un nuevo modelo de recibo individual de salarios y exige que el justificante informe la cotización total a la Seguridad Social, separando la aportación de la empresa y la del trabajador, según el modelo oficial de recibo individual de salarios publicado en el BOE.

La primera familia de columnas debe identificar a la empresa. En la práctica suelen aparecer razón social, NIF o CIF, domicilio, código de cuenta de cotización y, a veces, centro de trabajo o cuenta de cotización específica. Para una asesoría laboral, el CCC es especialmente útil cuando un mismo cliente tiene varios centros, regímenes o cuentas. Para auditoría, el identificador de empresa evita que un lote multiempresa termine unido solo por el nombre comercial del cliente.

La segunda familia identifica al trabajador. Nombre y apellidos son necesarios, pero no deberían ser la clave principal de la hoja. Los nombres cambian de formato, pierden tildes, alternan el orden de apellidos o llegan abreviados. Conviene extraer NIF o NIE, NAF, número interno de empleado si aparece, grupo profesional, categoría, puesto, tipo o código de contrato, antigüedad y fechas de alta o baja cuando el recibo las muestre. Esos campos permiten unir meses sin depender de una cadena de texto frágil.

El periodo de liquidación debe quedar en columnas propias: mes, año, fecha de inicio, fecha de fin y días liquidados si el recibo los incluye. Esta separación evita errores al comparar nóminas mensuales, semanales, pagas extras, atrasos o liquidaciones parciales. También permite detectar filas que no representan un mes completo y que no deberían compararse sin ajuste con una nómina ordinaria.

Además de los campos visibles del recibo, una extracción útil necesita columnas de control que no siempre están impresas en la nómina: nombre del archivo PDF, número de página, ID del documento, cliente, lote de carga, fecha de extracción y, si procede, centro de coste o proyecto. Esas columnas no describen el salario, pero sostienen la trazabilidad. Cuando alguien cuestione una cifra, la hoja debe señalar de qué PDF salió, no obligar a buscar manualmente entre carpetas.

Devengos, deducciones, bases e IRPF no deben mezclarse en una sola columna

El error más común al extraer una nómina a Excel es tratar todo importe visible como si perteneciera a la misma categoría. Una nómina española separa devengos, deducciones, bases, retenciones y aportación empresarial porque cada bloque responde a una pregunta distinta. Si esas cifras se mezclan en una sola columna de “importe”, la hoja sirve para archivar, pero no para revisar costes, explicar diferencias o preparar un análisis salarial.

Los devengos deberían conservar su estructura. Como mínimo, conviene separar salario base, complementos salariales, horas extra, pagas extraordinarias, prorrata de pagas extras, atrasos y percepciones no salariales cuando aparezcan. Esta separación evita confundir salario recurrente con conceptos variables o indemnizatorios. También permite comparar trabajadores de una misma categoría sin que una paga extra prorrateada parezca un bonus adicional si ya se está considerando en el total anual.

Las deducciones necesitan otro bloque. Cuota obrera a la Seguridad Social, retención de IRPF, anticipos, embargos, productos en especie o ajustes deben quedar separados de los devengos. El total de deducciones no es una reducción del salario base, sino el conjunto de importes que explican la diferencia entre total devengado y líquido a percibir. Para controles rápidos, la hoja debería permitir comprobar que total devengado menos total deducciones coincide con el líquido informado en el PDF.

Las bases de cotización tampoco son sinónimo de salario bruto. La base por contingencias comunes, la base de contingencias profesionales, las bases sujetas a horas extra y otros importes de cotización pueden coincidir parcialmente con los devengos, pero no tienen la misma función. Si una auditoría salarial o una revisión de coste usa una base como si fuera remuneración total, el análisis puede quedar distorsionado. Por eso las bases deben extraerse como campos propios, no como sustituto del total devengado.

La retención de IRPF merece una columna para el tipo aplicado y otra para el importe retenido cuando el recibo lo detalle. En un histórico, esas columnas ayudan a detectar cambios de situación, regularizaciones o diferencias entre periodos. No obstante, la hoja no debería recalcular automáticamente el tratamiento fiscal sin revisión profesional, especialmente cuando intervienen situaciones personales, cambios contractuales o regímenes territoriales específicos.

El bloque de aportación de la empresa a la Seguridad Social cierra el mapa de coste. Ese importe no es una deducción del trabajador y no debe restarse del líquido. Para una asesoría o un controller, sirve para aproximar el coste empresa por trabajador y periodo cuando el recibo lo informa. En Excel debe vivir junto al resto de columnas de coste, no dentro del bloque de deducciones del empleado.

Diseña el libro de Excel para revisión, no solo para almacenamiento

El libro de Excel debería tener una tabla principal estable. Cada fila representa un trabajador y un periodo; las columnas se agrupan por identificación, periodo, devengos, deducciones, bases, retenciones, aportación empresarial y trazabilidad. Esta forma permite filtrar por cliente, sumar por mes, detectar cambios de coste y entregar una muestra a auditoría sin reconstruir el origen de cada importe.

Una estructura práctica empieza con columnas de contexto: cliente, empresa, CCC, trabajador, NIF o NIE, NAF, grupo profesional, centro, contrato, periodo, días liquidados, archivo de origen y página. Después vienen las columnas económicas: salario base, complementos, prorrata de pagas extras, otros devengos salariales, percepciones no salariales, total devengado, cuotas del trabajador, IRPF, otras deducciones, total deducciones, líquido, bases de cotización y aportación empresarial.

Cuando las nóminas tienen muchos conceptos variables, conviene añadir una segunda tabla en formato largo. En esa tabla, cada fila es un concepto de nómina: trabajador, periodo, tipo de concepto, etiqueta original del PDF, etiqueta normalizada e importe. Este formato es más útil para analizar complementos, dietas, atrasos, pluses de convenio o conceptos que cambian de nombre entre programas. La tabla principal conserva los totales y la tabla de conceptos permite investigar el detalle.

Las columnas calculadas deben ayudar a revisar, no a inventar datos. Una columna puede comprobar si total devengado menos total deducciones coincide con el líquido. Otra puede marcar meses parciales si los días liquidados son inferiores al periodo esperado. Otra puede calcular un coste empresa operativo cuando el PDF informa la aportación empresarial. Pero los campos calculados deben distinguirse de los campos extraídos, porque en una revisión profesional importa saber qué venía del documento y qué se derivó en la hoja.

La normalización de etiquetas es inevitable cuando los PDFs proceden de A3 NOM, Sage, Meta4, SAP SuccessFactors, Silae, Personio, Factorial u otros sistemas. El mismo concepto puede aparecer con abreviaturas distintas, en otro orden o con una traducción parcial. La solución no es borrar la etiqueta original, sino conservarla y añadir una etiqueta normalizada. Así se puede auditar el dato original y, al mismo tiempo, agrupar conceptos para análisis.

Esta lógica se parece a otros libros financieros usados en España: una hoja útil no solo guarda importes, también conserva claves, fechas, origen y categoría. Por eso un libro registro de facturas recibidas en Excel y un libro de nóminas bien extraído comparten una misma disciplina: cada dato debe poder filtrarse, sumarse y justificarse.

Cómo pasar de PDFs sueltos a extracción masiva para asesoría

Si la empresa tiene acceso al software de nóminas, la exportación directa suele ser el primer camino. Un fichero nativo del programa puede traer códigos internos, históricos y campos que no siempre aparecen en el PDF. El problema es que muchos trabajos no empiezan ahí: una asesoría recibe nóminas cerradas de un cliente, una auditoría recibe un data room, una entidad recupera archivo histórico, una due diligence laboral trabaja con PDFs entregados por el vendedor o un proyecto subvencionado necesita justificar costes con justificantes ya emitidos.

En esos casos, el flujo debe ordenarse antes de extraer. Primero, agrupar los PDFs por cliente, empresa y periodo. Segundo, definir el esquema de columnas que se necesita, evitando un “extrae todo” que produce ruido. Tercero, pedir una fila por trabajador-periodo y conservar archivo, página o ID de origen. Cuarto, revisar totales y campos críticos antes de usar la hoja. Esta preparación reduce el trabajo manual posterior y hace que el lote sea defendible ante un tercero.

Un prompt en español puede ser muy directo: extrae una fila por trabajador y periodo; separa NIF o NIE, NAF, empresa, CCC, grupo profesional, periodo, salario base, complementos, prorrata de pagas extras, otros devengos, deducciones, bases de cotización, tipo e importe de IRPF, líquido a percibir, aportación de la empresa y archivo de origen. Si el objetivo es analizar conceptos, añade una tabla de detalle con etiqueta original, etiqueta normalizada, tipo de concepto e importe.

Invoice Data Extraction encaja en este punto como una herramienta para extraer datos de nóminas y otros documentos financieros: permite subir documentos, describir en lenguaje natural qué campos se quieren extraer y descargar resultados estructurados en Excel, CSV o JSON. Para una asesoría, eso significa que el esquema de salida puede definirse con instrucciones en español en lugar de configurar una plantilla rígida desde cero. Para un auditor, significa que la extracción puede preservar columnas de origen y facilitar una revisión por muestra.

La herramienta no debe tratarse como calculadora de nóminas, asesor laboral ni certificador de cumplimiento. Su papel es convertir documentos en datos estructurados para que un profesional revise, concilie y use la información. Esa distinción importa: el PDF contiene importes y etiquetas; el criterio sobre convenio, tributación, cotización o registro retributivo sigue perteneciendo al profesional.

Cuando el PDF es escaneado o viene con texto de mala calidad, la calidad del reconocimiento condiciona el resultado. Un flujo de OCR para documentos de nómina debe comprobar especialmente identificadores, importes con decimales, signos negativos, columnas partidas y pies de página donde a veces aparece la aportación empresarial. En nóminas, un error de lectura pequeño puede cambiar una retención, una base o un total, así que la extracción masiva siempre debe terminar en controles.

Controles de calidad antes de usar la hoja de nóminas

Una hoja de nóminas extraída de PDFs puede parecer correcta y aun así fallar en los detalles que importan. El primer control es la unicidad: una combinación de trabajador y periodo no debería aparecer duplicada salvo que exista una paga extra, atraso, liquidación o documento complementario que lo explique. Para este control, NIF, NIE, NAF o ID interno son claves más fiables que el nombre completo, porque los nombres sufren variaciones de acentos, abreviaturas y orden de apellidos.

El segundo control es aritmético. Por cada fila ordinaria, total devengado menos total deducciones debería coincidir con el líquido a percibir que aparece en el PDF. Cuando no coincide, puede haber una deducción no capturada, un signo mal interpretado, una línea partida o un concepto ubicado en una zona del recibo que la extracción no leyó bien. La hoja debería marcar esas diferencias para revisión, no ocultarlas en un total corregido manualmente.

El tercer control es de completitud. Bases de cotización, retención de IRPF y aportación empresarial deben estar presentes cuando el recibo las informa. Si falta la aportación de la empresa, cualquier análisis de coste empresa quedará incompleto. Si falta el tipo o el importe de IRPF, una revisión de retenciones tendrá huecos. Si las bases se confunden con devengos, el Excel empezará a responder preguntas laborales con campos que no fueron diseñados para eso.

También conviene marcar situaciones que rompen la comparación mensual: altas y bajas durante el periodo, reducción de jornada, incapacidad temporal, atrasos, embargos, anticipos, pagas extras prorrateadas, pagas extras separadas y cambios de contrato. En una auditoría salarial, mezclar un mes parcial con un mes completo puede crear una diferencia aparente que no es una brecha real. En un archivo histórico, un complemento renombrado entre programas puede parecer un concepto nuevo aunque represente la misma remuneración.

La revisión fiscal exige prudencia. El IRPF de nómina depende de circunstancias personales, retribución prevista, regularizaciones y, en País Vasco y Navarra, sistemas forales. Una hoja única puede ayudar a detectar saltos o importes atípicos, pero no debería aplicar una validación fiscal universal sin contexto. La extracción convierte el PDF en datos; la interpretación de esos datos sigue necesitando criterio profesional.

Por último, cada control debe poder volver al documento. Si una celda queda marcada como dudosa, la fila debe indicar el PDF, la página y, si el proceso lo permite, el lote o ID de extracción. Sin esa ruta de vuelta, la revisión se convierte en una búsqueda manual. Con ella, la hoja puede funcionar como índice de trabajo para asesoría, auditoría o RRHH.

Qué puede hacer una asesoría con el Excel una vez validado

El valor de convertir nóminas españolas a Excel aparece cuando la hoja deja de ser un archivo intermedio y pasa a alimentar trabajos concretos. En el cierre mensual, los importes de nómina pueden compararse con RLC y RNT extraídos del Sistema RED a Excel y pagos bancarios para detectar diferencias entre coste laboral declarado, cotización y transferencia; este paso a paso de conciliación mensual entre nóminas, RLC y transferencia bancaria detalla los tests de cuadre y el asiento contable PGC asociado. En un archivo histórico, las filas por trabajador-periodo permiten reconstruir evolución salarial, cambios de jornada, complementos y periodos de alta o baja sin abrir cientos de PDFs.

Para registro retributivo y análisis de brecha salarial, la hoja validada aporta una base ordenada de remuneraciones, grupos profesionales, periodos y conceptos. El análisis posterior necesitará criterios de clasificación, género, puestos equivalentes y tratamiento jurídico adecuado, pero la extracción resuelve una parte pesada del trabajo: convertir recibos dispersos en un dataset que se puede agrupar y comprobar. La misma estructura sirve para auditoría salarial, porque permite seleccionar muestras, revisar conceptos y volver al justificante original.

En subvenciones y proyectos financiados, la utilidad es más operativa. Si una entidad necesita justificar coste laboral por proyecto, las nóminas extraídas pueden combinarse con porcentajes de dedicación, centros de coste o partes de trabajo. La columna de aportación empresarial ayuda a no quedarse solo con el líquido o el salario bruto cuando el financiador exige coste total. La trazabilidad al PDF permite responder a una revisión sin rehacer el cálculo desde documentos sueltos.

En due diligence laboral, el Excel permite normalizar costes de una empresa objetivo: salario base, complementos, pagas extras, variables, retenciones, bases y coste empresa por trabajador. Esa visión ayuda a detectar cambios bruscos, conceptos no recurrentes, dependencia de complementos, meses anómalos o diferencias entre categorías. De nuevo, el dato extraído no sustituye el análisis laboral, pero evita que el equipo empiece desde una carpeta de PDFs sin estructura.

La misma tabla puede servir a varios usos si conserva cinco elementos: identificador estable del trabajador, periodo, desglose económico, campos de Seguridad Social e IRPF, y origen documental. Sin esos elementos, el Excel será una conversión superficial. Con ellos, se convierte en una base revisable para asesoría laboral, auditoría, RRHH, subvenciones e inspección de trabajo.

Extract invoice data to Excel with natural language prompts

Upload your invoices, describe what you need in plain language, and download clean, structured spreadsheets. No templates, no complex configuration.

Exceptional accuracy on financial documents
1–8 seconds per page with parallel processing
50 free pages every month — no subscription
Any document layout, language, or scan quality
Native Excel types — numbers, dates, currencies
Files encrypted and auto-deleted within 24 hours
Continue Reading