Saltar a contenido

Evaluacion de Impacto de Inteligencia Artificial (EIAI)

Sistema: Sherlock-docs v1.0 Entidad: Centro de Servicios Judiciales de Bello, Antioquia — Rama Judicial Fecha: 2026-03-06 Elaborado por: Equipo de desarrollo Sherlock-docs Marco normativo: Guia MinTIC/PNUD Uso Responsable de IA en Entidades Publicas, CONPES 3975 (2019), Acuerdo PCSJA24-12243


1. Descripcion del Sistema y Contexto Institucional

1.1 Proposito

Sherlock-docs es un sistema de gestion documental que asiste a los funcionarios del Centro de Servicios Judiciales (CSJ) de Bello en el registro de acciones de tutela, habeas corpus e incidentes de desacato. El sistema:

  • Digitaliza documentos fisicos mediante OCR (reconocimiento optico de caracteres)
  • Extrae entidades clave (accionante, accionado, radicado, cedula, correo) mediante NLP
  • Detecta documentos duplicados mediante similitud textual
  • Facilita la validacion humana de toda la informacion extraida

1.2 Contexto operativo

El CSJ de Bello recibe aproximadamente 100 documentos diarios. El proceso anterior era 100% manual: un funcionario leia cada documento, identificaba las partes, radicado y datos del proceso, y los registraba en una hoja de calculo. Este proceso tomaba 15-20 minutos por documento.

1.3 Objetivo del uso de IA

Reducir el tiempo de registro de 15-20 minutos a 2-3 minutos por documento, manteniendo la precision mediante validacion humana obligatoria. La IA no toma decisiones judiciales ni administrativas — solo extrae datos para facilitar el registro.


2. Datos Personales Tratados

2.1 Tipos de datos

Dato Categoria (Ley 1581) Fuente Proposito
Nombres (accionante/accionado) Dato personal Documento judicial Registro del proceso
Cedula (CC/CE/NIT) Dato personal Documento judicial Identificacion unica
Correo electronico Dato personal Documento judicial Notificaciones
Direccion Dato personal Documento judicial Notificaciones
Contenido de la tutela Dato sensible* Documento judicial Deteccion de duplicados

*El contenido puede incluir informacion de salud, situacion economica u otros datos sensibles del ciudadano.

2.2 Volumen estimado

  • ~100 documentos/dia, ~2,500/mes
  • Cada documento contiene datos de 2-4 personas (accionante, accionado, testigos)
  • Poblacion indirectamente impactada: ~5,000-10,000 ciudadanos/mes

2.3 Almacenamiento

  • Base de datos SQLite en servidor local de la entidad
  • Sin transferencia a terceros: 100% local, sin APIs externas, sin cloud
  • Respaldos segun politica de la entidad

3. Componentes de IA — Detalle Tecnico

3.1 OCR (Reconocimiento Optico de Caracteres)

Aspecto Detalle
Motores Tesseract 5.x (LSTM) + PaddleOCR v2.x (CNN+LSTM+Attention)
Routing Automatico segun calidad del documento (Strategy pattern)
Confianza promedio 90-93%
Riesgo Texto mal extraido en documentos degradados
Mitigacion Validacion humana + visualizacion del texto extraido

3.2 NER (Extraccion de Entidades)

Aspecto Detalle
Modelo principal SpaCy es_core_news_lg v3.8 (CNN, 560 MB)
Arquitectura Ensemble de 5 extractores (1 neural + 4 deterministicos)
F1 global 85.3% (radicado/cedula/correo 100%, demandante 74%)
Riesgo Extraccion incorrecta de nombres de personas
Mitigacion Validacion humana obligatoria antes de guardar

3.3 Deteccion de Duplicados

Aspecto Detalle
Tecnicas SHA-256 (exacto) + MinHash (fuzzy) + TF-IDF (textual) + Entity Matching
Precision Gate SHA-256 = 100%, ensemble configurable
Riesgo Falso positivo (documento valido marcado como duplicado)
Mitigacion El operador decide — el sistema solo sugiere

4. Riesgos Identificados y Mitigaciones

4.1 Matriz de riesgos

# Riesgo Probabilidad Impacto Mitigacion Estado
R1 Entidad mal extraida (nombre incorrecto) Media Alto Validacion humana obligatoria Implementado
R2 Texto OCR ilegible Baja Medio Dual-engine routing + fallback Implementado
R3 Duplicado no detectado Baja Medio 4 niveles de deteccion complementarios Implementado
R4 Falso positivo en duplicados Baja Bajo Operador decide, sistema sugiere Implementado
R5 Acceso no autorizado a datos Media Alto Autenticacion basica (en implementacion) Pendiente (GOB-05)
R6 Sesgo del modelo NER en nombres Baja Medio Ensemble con extractores deterministicos Implementado
R7 Fuga de datos por transferencia Muy baja Critico Arquitectura 100% local Por diseno

4.2 Riesgos aceptados

  • R5: Autenticacion pendiente. El sistema opera en red interna de la entidad con acceso restringido a nivel de red. Se implementara login basico (GOB-05).
  • NER F1 74% en demandante: Aceptable porque la validacion humana obliga a verificar cada campo.

5. Poblacion Impactada

5.1 Usuarios directos

  • Funcionarios del CSJ: 5-10 operadores que procesan documentos diariamente
  • Impacto: Reduccion de carga operativa, mejora en eficiencia

5.2 Poblacion indirectamente afectada

  • Ciudadanos: Accionantes y accionados cuyas tutelas son procesadas
  • Los ciudadanos no interactuan con el sistema
  • Sus datos personales son tratados conforme a la finalidad judicial
  • Impacto potencial negativo: error en registro (mitigado por validacion humana)

6. Beneficios Cuantificados

Metrica Sin Sherlock-docs Con Sherlock-docs Mejora
Tiempo por documento 15-20 min 2-3 min 85-87%
Deteccion de duplicados Manual/visual Automatica 4 niveles Significativa
Errores de transcripcion ~5-10% <3% (post-validacion) 40-70%
Documentos/hora/operador 3-4 15-20 400-500%

7. Mecanismos de Supervision Humana

7.1 Validacion obligatoria (PCSJA24-12243 Art.9)

  • La pagina ValidatePage obliga al funcionario a revisar cada campo extraido por IA
  • El sistema muestra la confianza OCR y permite ver el texto original
  • Los campos no se guardan en BD hasta que el operador confirma
  • Se registran correcciones con valor original vs corregido

7.2 No autonomia de la IA

  • El sistema nunca toma decisiones judiciales ni administrativas
  • No modifica, rechaza ni aprueba documentos automaticamente
  • No genera texto ni contenido — solo extrae informacion existente

7.3 Trazabilidad

  • Historial de correcciones por documento
  • Logs de procesamiento con tiempos y metricas
  • Estadisticas de uso diario accesibles en la GUI

8. Plan de Monitoreo

8.1 Metricas de rendimiento

Metrica Frecuencia Responsable Umbral de alerta
Confianza OCR promedio Semanal Coordinador CSJ < 80%
Tasa de correcciones por campo Mensual Coordinador CSJ > 50% en un campo
Documentos procesados/dia Diario (automatico) Sistema Anomalia estadistica
Tiempo promedio procesamiento Semanal Desarrollador > 2 min consistente

8.2 Revision periodica

  • Trimestral: Revisar F1 NER contra documentos reales (benchmark)
  • Semestral: Evaluar actualizacion de modelos SpaCy
  • Anual: Revision integral de esta evaluacion de impacto

9. Aprobaciones

Rol Nombre Firma Fecha
Desarrollador _____ _ _
Coordinador CSJ Bello _____ _ _
Area Juridica CSJ _____ _ _

Nota: Este documento debe ser completado con los datos de la entidad y aprobado por el area juridica del CSJ antes de la operacion formal del sistema.


Referencia: Guia MinTIC/PNUD para el Uso Responsable de IA en Entidades Publicas Version: 1.0 — 2026-03-06