Estado Global de Validación Documental
| Tarea | Descripción | Documento actual | Estado | Progreso |
|---|---|---|---|---|
| OCR | Extraer texto de PDF, imágenes y escaneos, generación de vectores. | contrato_2025.pdf | No iniciado | 0% |
| NER | Identificar entidades (nombres, fechas, montos) | informe_riesgos.docx | No iniciado | 0% |
| Clasificación | Categorizar documento por tipo y categoría | factura_abril.xlsx | No iniciado | 0% |
| Metadatos | Extraer y normalizar propiedades (autor, fecha) | plan_proyecto.pptx | No iniciado | 0% |
| Anomalías | Detectar valores atípicos y campos faltantes | base_datos.csv | No iniciado | 0% |
| Dedupe | Eliminar duplicados en registros extraídos | registro_clientes.json | No iniciado | 0% |
| Esquema | Validar estructura acorde al modelo de datos | esquema_base.xml | No iniciado | 0% |
| Calidad | Ejecutar reglas de negocio y métricas de calidad | resumen_financiero.pdf | No iniciado | 0% |
Enviará cliente/proyecto seleccionados a n8n.
Reconocimiento Óptico de Caracteres (OCR)
Extrae texto de imágenes y PDF escaneados.
Extracción de Entidades Nombradas (NER)
Detecta nombres, fechas, ubicaciones, etc.Listo para ejecutar.
Clasificación de Documentos
Agrupa por temática o tipo.
Extracción de Metadatos
Recupera atributos clave.
Detección de Anomalías
Identifica valores atípicos.
Eliminación de Duplicados
Filtra entradas repetidas.
Inferencia de Esquemas
Descubre estructura y tipos de campo.
Validación de Calidad
Chequea formatos y rangos.
Reglas de Validación Dinámicas
Crea y aplica reglas sin escribir JSON.
Ejecución Programada y On-Demand
Agendamiento inteligente y chequeos urgentes.
Monitoreo del Proceso
Visualiza estado y logs de la validación.- Estado del Proceso En Espera
- Última Ejecución -
- Errores Detectados 0
Opciones avanzadas de reindexación
Forzar re-extracción
Re-descarga y re-extrae texto aunque exista en BD.
Revectorizar
Regenera embeddings tras la extracción.
Solo faltantes
Procesa únicamente documentos sin texto/embeddings.
Monitoreo y Alertas Proactivas
Dashboard en Tiempo Real
Métricas clave de calidad de datos.75%
% Datos Validados
750 de 1,000
25%
Inconsistencias por Categoría
250 de 1,000
Errores Detectados
123
Gráfica de Tendencia (Hoy / Esta Semana / Este Mes)
Alertas Proactivas
Notificaciones automáticas cuando se disparen umbrales críticos.Corrección Asistida
Errores Detectados y Flujo de Corrección
Sugerencias automáticas y flujo de aprobación para correcciones.| ID | Gravedad | Tipo | Descripción del Error | Sugerencia ML | Asignado a | Estado | Acciones |
|---|---|---|---|---|---|---|---|
| INC001 | Alta | Contratos | Campo 'RFC' nulo en contrato #12345. | Autofill: ABC123456XYZ | Admin | Pendiente | |
| INC002 | Media | Clientes | Formato de email incorrecto para 'juan.perez'. | Normalizar: juan.perez@example.com | Data Team | En Proceso |
Reporting y Seguimiento de KPIs
Informes Ejecutivos
Genera y exporta reportes con métricas clave.
Indicadores de Calidad y Balanced Scorecard
Métricas de calidad que alimentan el Balanced Scorecard.- Tasa de Validación Diaria: 92%
- Tasa de Validación Semanal: 88%
- Top 5 Errores: RFC Nulo, Email Inválido, Fecha Fuera de Rango, Campo Duplicado, ID Faltante.
- Tiempo Promedio de Corrección: 2.5 horas.
- Impacto en BSC: Indicador de "Calidad de Datos" en verde.
[Gráfica: Evolución de KPIs de Calidad]
Integración Con Otros Módulos Pakal
Vinculación con Gestión de Riesgos
Todo error de dato genera automáticamente un riesgo con cuantificación inicial.| Inconsistencia | Riesgo Asociado | Cuantificación Inicial |
|---|---|---|
| RFC Nulo | Multa Regulatoria | $15,000 USD |
| Dirección Incorrecta | Pérdida de Cliente | $5,000 USD |
| Fecha Caducidad Inválida | Incumplimiento Contrato | $20,000 USD |
Sincronización con el Módulo de Dictamen
Los hallazgos graves se etiquetan para su inclusión en el dictamen pericial o jurídico.| Hallazgo Grave | Módulo Vinculado | Estado de Dictamen |
|---|---|---|
| Incumplimiento RFC | Dictamen Jurídico | Pendiente de Revisión |
| Datos Financieros Inconsistentes | Dictamen Pericial | En Proceso |
| Violación de Privacidad | Dictamen Jurídico | Urgente |
Inteligencia Predictiva y Sugerencias
Modelos de ML
Predice cuáles registros tienen mayor probabilidad de errores basándose en patrones previos.- Registros de Clientes: 15 con alta probabilidad de error (basado en cambios frecuentes).
- Contratos Próximos a Vencer: 5 con riesgo de inconsistencia en fechas.
- Alertas Tempranas: Se han evitado 30 errores potenciales este mes.
[Gráfica: Probabilidad de Error por Registro/Campo]
Sugerencias Automáticas
Propone valores o correcciones derivadas de datos ya validados.Sugerencias Activas:
-
Campo: Dirección
Registro: Cliente ID 54321
Sugerencia: "Calle Falsa 123, Colonia Centro, Ciudad de México, 06000" (autocomplete de direcciones). -
Campo: Fecha de Nacimiento
Registro: Usuario ID 98765
Sugerencia: "1985-05-15" (formatos estándar de fechas).
Auditoría y Trazabilidad Completa
Historial Centralizado
Registro detallado de modificaciones realizadas en el sistema.| Usuario/Proceso | Timestamp | Tipo de Modificación | Campo Modificado | Valor Anterior | Valor Nuevo |
|---|---|---|---|---|---|
| Admin | 2024-12-27 10:30:00 | Corrección Manual | RFC | NULL | ABC123456XYZ |
| Sistema Automatizado | 2024-12-26 03:00:00 | Validación Periódica | - | - | Errores detectados: 5 |
| Usuario 1 | 2024-12-26 14:00:00 | Edición en Línea | juan.perez@example | juan.perez@example.com |
Certificados de Integridad (Hashes y Checksums)
Genera sellos digitales para garantizar la inalterabilidad de los datos post-validación.Aquí puedes generar y ver los certificados de integridad para conjuntos de datos validados. Cada certificado incluye un hash criptográfico que asegura que los datos no han sido modificados desde la última validación exitosa.
Últimos Certificados:
-
Certificado #20241227-001:
Datos de Contratos (Hash:
a1b2c3d4e5f6...) -
Certificado #20241226-002:
Datos de Clientes (Hash:
f7e8d9c0b1a2...)