Evaluacion de Impacto de Inteligencia Artificial (EIAI)
Sistema: Sherlock-docs v1.0
Entidad: Centro de Servicios Judiciales de Bello, Antioquia — Rama Judicial
Fecha: 2026-03-06
Elaborado por: Equipo de desarrollo Sherlock-docs
Marco normativo: Guia MinTIC/PNUD Uso Responsable de IA en Entidades Publicas, CONPES 3975 (2019), Acuerdo PCSJA24-12243
1. Descripcion del Sistema y Contexto Institucional
1.1 Proposito
Sherlock-docs es un sistema de gestion documental que asiste a los funcionarios del Centro de Servicios Judiciales (CSJ) de Bello en el registro de acciones de tutela, habeas corpus e incidentes de desacato. El sistema:
- Digitaliza documentos fisicos mediante OCR (reconocimiento optico de caracteres)
- Extrae entidades clave (accionante, accionado, radicado, cedula, correo) mediante NLP
- Detecta documentos duplicados mediante similitud textual
- Facilita la validacion humana de toda la informacion extraida
1.2 Contexto operativo
El CSJ de Bello recibe aproximadamente 100 documentos diarios. El proceso anterior era 100% manual: un funcionario leia cada documento, identificaba las partes, radicado y datos del proceso, y los registraba en una hoja de calculo. Este proceso tomaba 15-20 minutos por documento.
1.3 Objetivo del uso de IA
Reducir el tiempo de registro de 15-20 minutos a 2-3 minutos por documento, manteniendo la precision mediante validacion humana obligatoria. La IA no toma decisiones judiciales ni administrativas — solo extrae datos para facilitar el registro.
2. Datos Personales Tratados
2.1 Tipos de datos
| Dato |
Categoria (Ley 1581) |
Fuente |
Proposito |
| Nombres (accionante/accionado) |
Dato personal |
Documento judicial |
Registro del proceso |
| Cedula (CC/CE/NIT) |
Dato personal |
Documento judicial |
Identificacion unica |
| Correo electronico |
Dato personal |
Documento judicial |
Notificaciones |
| Direccion |
Dato personal |
Documento judicial |
Notificaciones |
| Contenido de la tutela |
Dato sensible* |
Documento judicial |
Deteccion de duplicados |
*El contenido puede incluir informacion de salud, situacion economica u otros datos sensibles del ciudadano.
2.2 Volumen estimado
- ~100 documentos/dia, ~2,500/mes
- Cada documento contiene datos de 2-4 personas (accionante, accionado, testigos)
- Poblacion indirectamente impactada: ~5,000-10,000 ciudadanos/mes
2.3 Almacenamiento
- Base de datos SQLite en servidor local de la entidad
- Sin transferencia a terceros: 100% local, sin APIs externas, sin cloud
- Respaldos segun politica de la entidad
3. Componentes de IA — Detalle Tecnico
3.1 OCR (Reconocimiento Optico de Caracteres)
| Aspecto |
Detalle |
| Motores |
Tesseract 5.x (LSTM) + PaddleOCR v2.x (CNN+LSTM+Attention) |
| Routing |
Automatico segun calidad del documento (Strategy pattern) |
| Confianza promedio |
90-93% |
| Riesgo |
Texto mal extraido en documentos degradados |
| Mitigacion |
Validacion humana + visualizacion del texto extraido |
| Aspecto |
Detalle |
| Modelo principal |
SpaCy es_core_news_lg v3.8 (CNN, 560 MB) |
| Arquitectura |
Ensemble de 5 extractores (1 neural + 4 deterministicos) |
| F1 global |
85.3% (radicado/cedula/correo 100%, demandante 74%) |
| Riesgo |
Extraccion incorrecta de nombres de personas |
| Mitigacion |
Validacion humana obligatoria antes de guardar |
3.3 Deteccion de Duplicados
| Aspecto |
Detalle |
| Tecnicas |
SHA-256 (exacto) + MinHash (fuzzy) + TF-IDF (textual) + Entity Matching |
| Precision |
Gate SHA-256 = 100%, ensemble configurable |
| Riesgo |
Falso positivo (documento valido marcado como duplicado) |
| Mitigacion |
El operador decide — el sistema solo sugiere |
4. Riesgos Identificados y Mitigaciones
4.1 Matriz de riesgos
| # |
Riesgo |
Probabilidad |
Impacto |
Mitigacion |
Estado |
| R1 |
Entidad mal extraida (nombre incorrecto) |
Media |
Alto |
Validacion humana obligatoria |
Implementado |
| R2 |
Texto OCR ilegible |
Baja |
Medio |
Dual-engine routing + fallback |
Implementado |
| R3 |
Duplicado no detectado |
Baja |
Medio |
4 niveles de deteccion complementarios |
Implementado |
| R4 |
Falso positivo en duplicados |
Baja |
Bajo |
Operador decide, sistema sugiere |
Implementado |
| R5 |
Acceso no autorizado a datos |
Media |
Alto |
Autenticacion basica (en implementacion) |
Pendiente (GOB-05) |
| R6 |
Sesgo del modelo NER en nombres |
Baja |
Medio |
Ensemble con extractores deterministicos |
Implementado |
| R7 |
Fuga de datos por transferencia |
Muy baja |
Critico |
Arquitectura 100% local |
Por diseno |
4.2 Riesgos aceptados
- R5: Autenticacion pendiente. El sistema opera en red interna de la entidad con acceso restringido a nivel de red. Se implementara login basico (GOB-05).
- NER F1 74% en demandante: Aceptable porque la validacion humana obliga a verificar cada campo.
5. Poblacion Impactada
5.1 Usuarios directos
- Funcionarios del CSJ: 5-10 operadores que procesan documentos diariamente
- Impacto: Reduccion de carga operativa, mejora en eficiencia
5.2 Poblacion indirectamente afectada
- Ciudadanos: Accionantes y accionados cuyas tutelas son procesadas
- Los ciudadanos no interactuan con el sistema
- Sus datos personales son tratados conforme a la finalidad judicial
- Impacto potencial negativo: error en registro (mitigado por validacion humana)
6. Beneficios Cuantificados
| Metrica |
Sin Sherlock-docs |
Con Sherlock-docs |
Mejora |
| Tiempo por documento |
15-20 min |
2-3 min |
85-87% |
| Deteccion de duplicados |
Manual/visual |
Automatica 4 niveles |
Significativa |
| Errores de transcripcion |
~5-10% |
<3% (post-validacion) |
40-70% |
| Documentos/hora/operador |
3-4 |
15-20 |
400-500% |
7. Mecanismos de Supervision Humana
7.1 Validacion obligatoria (PCSJA24-12243 Art.9)
- La pagina ValidatePage obliga al funcionario a revisar cada campo extraido por IA
- El sistema muestra la confianza OCR y permite ver el texto original
- Los campos no se guardan en BD hasta que el operador confirma
- Se registran correcciones con valor original vs corregido
7.2 No autonomia de la IA
- El sistema nunca toma decisiones judiciales ni administrativas
- No modifica, rechaza ni aprueba documentos automaticamente
- No genera texto ni contenido — solo extrae informacion existente
7.3 Trazabilidad
- Historial de correcciones por documento
- Logs de procesamiento con tiempos y metricas
- Estadisticas de uso diario accesibles en la GUI
8. Plan de Monitoreo
8.1 Metricas de rendimiento
| Metrica |
Frecuencia |
Responsable |
Umbral de alerta |
| Confianza OCR promedio |
Semanal |
Coordinador CSJ |
< 80% |
| Tasa de correcciones por campo |
Mensual |
Coordinador CSJ |
> 50% en un campo |
| Documentos procesados/dia |
Diario (automatico) |
Sistema |
Anomalia estadistica |
| Tiempo promedio procesamiento |
Semanal |
Desarrollador |
> 2 min consistente |
8.2 Revision periodica
- Trimestral: Revisar F1 NER contra documentos reales (benchmark)
- Semestral: Evaluar actualizacion de modelos SpaCy
- Anual: Revision integral de esta evaluacion de impacto
9. Aprobaciones
| Rol |
Nombre |
Firma |
Fecha |
| Desarrollador |
_____ |
_ |
_ |
| Coordinador CSJ Bello |
_____ |
_ |
_ |
| Area Juridica CSJ |
_____ |
_ |
_ |
Nota: Este documento debe ser completado con los datos de la entidad y aprobado por el area juridica del CSJ antes de la operacion formal del sistema.
Referencia: Guia MinTIC/PNUD para el Uso Responsable de IA en Entidades Publicas
Version: 1.0 — 2026-03-06