Evaluacion de Impacto de Inteligencia Artificial (EIAI)¶

Sistema: Sherlock-docs v1.0 Entidad: Centro de Servicios Judiciales de Bello, Antioquia — Rama Judicial Fecha: 2026-03-06 Elaborado por: Equipo de desarrollo Sherlock-docs Marco normativo: Guia MinTIC/PNUD Uso Responsable de IA en Entidades Publicas, CONPES 3975 (2019), Acuerdo PCSJA24-12243

1. Descripcion del Sistema y Contexto Institucional¶

1.1 Proposito¶

Sherlock-docs es un sistema de gestion documental que asiste a los funcionarios del Centro de Servicios Judiciales (CSJ) de Bello en el registro de acciones de tutela, habeas corpus e incidentes de desacato. El sistema:

Digitaliza documentos fisicos mediante OCR (reconocimiento optico de caracteres)
Extrae entidades clave (accionante, accionado, radicado, cedula, correo) mediante NLP
Detecta documentos duplicados mediante similitud textual
Facilita la validacion humana de toda la informacion extraida

1.2 Contexto operativo¶

El CSJ de Bello recibe aproximadamente 100 documentos diarios. El proceso anterior era 100% manual: un funcionario leia cada documento, identificaba las partes, radicado y datos del proceso, y los registraba en una hoja de calculo. Este proceso tomaba 15-20 minutos por documento.

1.3 Objetivo del uso de IA¶

Reducir el tiempo de registro de 15-20 minutos a 2-3 minutos por documento, manteniendo la precision mediante validacion humana obligatoria. La IA no toma decisiones judiciales ni administrativas — solo extrae datos para facilitar el registro.

2. Datos Personales Tratados¶

2.1 Tipos de datos¶

Dato	Categoria (Ley 1581)	Fuente	Proposito
Nombres (accionante/accionado)	Dato personal	Documento judicial	Registro del proceso
Cedula (CC/CE/NIT)	Dato personal	Documento judicial	Identificacion unica
Correo electronico	Dato personal	Documento judicial	Notificaciones
Direccion	Dato personal	Documento judicial	Notificaciones
Contenido de la tutela	Dato sensible*	Documento judicial	Deteccion de duplicados

*El contenido puede incluir informacion de salud, situacion economica u otros datos sensibles del ciudadano.

2.2 Volumen estimado¶

~100 documentos/dia, ~2,500/mes
Cada documento contiene datos de 2-4 personas (accionante, accionado, testigos)
Poblacion indirectamente impactada: ~5,000-10,000 ciudadanos/mes

2.3 Almacenamiento¶

Base de datos SQLite en servidor local de la entidad
Sin transferencia a terceros: 100% local, sin APIs externas, sin cloud
Respaldos segun politica de la entidad

3. Componentes de IA — Detalle Tecnico¶

3.1 OCR (Reconocimiento Optico de Caracteres)¶

Aspecto	Detalle
Motores	Tesseract 5.x (LSTM) + PaddleOCR v2.x (CNN+LSTM+Attention)
Routing	Automatico segun calidad del documento (Strategy pattern)
Confianza promedio	90-93%
Riesgo	Texto mal extraido en documentos degradados
Mitigacion	Validacion humana + visualizacion del texto extraido

3.2 NER (Extraccion de Entidades)¶

Aspecto	Detalle
Modelo principal	SpaCy `es_core_news_lg` v3.8 (CNN, 560 MB)
Arquitectura	Ensemble de 5 extractores (1 neural + 4 deterministicos)
F1 global	85.3% (radicado/cedula/correo 100%, demandante 74%)
Riesgo	Extraccion incorrecta de nombres de personas
Mitigacion	Validacion humana obligatoria antes de guardar

3.3 Deteccion de Duplicados¶

Aspecto	Detalle
Tecnicas	SHA-256 (exacto) + MinHash (fuzzy) + TF-IDF (textual) + Entity Matching
Precision	Gate SHA-256 = 100%, ensemble configurable
Riesgo	Falso positivo (documento valido marcado como duplicado)
Mitigacion	El operador decide — el sistema solo sugiere

4. Riesgos Identificados y Mitigaciones¶

4.1 Matriz de riesgos¶

#	Riesgo	Probabilidad	Impacto	Mitigacion	Estado
R1	Entidad mal extraida (nombre incorrecto)	Media	Alto	Validacion humana obligatoria	Implementado
R2	Texto OCR ilegible	Baja	Medio	Dual-engine routing + fallback	Implementado
R3	Duplicado no detectado	Baja	Medio	4 niveles de deteccion complementarios	Implementado
R4	Falso positivo en duplicados	Baja	Bajo	Operador decide, sistema sugiere	Implementado
R5	Acceso no autorizado a datos	Media	Alto	Autenticacion basica (en implementacion)	Pendiente (GOB-05)
R6	Sesgo del modelo NER en nombres	Baja	Medio	Ensemble con extractores deterministicos	Implementado
R7	Fuga de datos por transferencia	Muy baja	Critico	Arquitectura 100% local	Por diseno

4.2 Riesgos aceptados¶

R5: Autenticacion pendiente. El sistema opera en red interna de la entidad con acceso restringido a nivel de red. Se implementara login basico (GOB-05).
NER F1 74% en demandante: Aceptable porque la validacion humana obliga a verificar cada campo.

5. Poblacion Impactada¶

5.1 Usuarios directos¶

Funcionarios del CSJ: 5-10 operadores que procesan documentos diariamente
Impacto: Reduccion de carga operativa, mejora en eficiencia

5.2 Poblacion indirectamente afectada¶

Ciudadanos: Accionantes y accionados cuyas tutelas son procesadas
Los ciudadanos no interactuan con el sistema
Sus datos personales son tratados conforme a la finalidad judicial
Impacto potencial negativo: error en registro (mitigado por validacion humana)

6. Beneficios Cuantificados¶

Metrica	Sin Sherlock-docs	Con Sherlock-docs	Mejora
Tiempo por documento	15-20 min	2-3 min	85-87%
Deteccion de duplicados	Manual/visual	Automatica 4 niveles	Significativa
Errores de transcripcion	~5-10%	<3% (post-validacion)	40-70%
Documentos/hora/operador	3-4	15-20	400-500%

7. Mecanismos de Supervision Humana¶

7.1 Validacion obligatoria (PCSJA24-12243 Art.9)¶

La pagina ValidatePage obliga al funcionario a revisar cada campo extraido por IA
El sistema muestra la confianza OCR y permite ver el texto original
Los campos no se guardan en BD hasta que el operador confirma
Se registran correcciones con valor original vs corregido

7.2 No autonomia de la IA¶

El sistema nunca toma decisiones judiciales ni administrativas
No modifica, rechaza ni aprueba documentos automaticamente
No genera texto ni contenido — solo extrae informacion existente

7.3 Trazabilidad¶

Historial de correcciones por documento
Logs de procesamiento con tiempos y metricas
Estadisticas de uso diario accesibles en la GUI

8. Plan de Monitoreo¶

8.1 Metricas de rendimiento¶

Metrica	Frecuencia	Responsable	Umbral de alerta
Confianza OCR promedio	Semanal	Coordinador CSJ	< 80%
Tasa de correcciones por campo	Mensual	Coordinador CSJ	> 50% en un campo
Documentos procesados/dia	Diario (automatico)	Sistema	Anomalia estadistica
Tiempo promedio procesamiento	Semanal	Desarrollador	> 2 min consistente

8.2 Revision periodica¶

Trimestral: Revisar F1 NER contra documentos reales (benchmark)
Semestral: Evaluar actualizacion de modelos SpaCy
Anual: Revision integral de esta evaluacion de impacto

9. Aprobaciones¶

Rol	Nombre	Firma	Fecha
Desarrollador	_____	_	_
Coordinador CSJ Bello	_____	_	_
Area Juridica CSJ	_____	_	_

Nota: Este documento debe ser completado con los datos de la entidad y aprobado por el area juridica del CSJ antes de la operacion formal del sistema.

Referencia: Guia MinTIC/PNUD para el Uso Responsable de IA en Entidades Publicas Version: 1.0 — 2026-03-06