Tenemos 800 expedientes sin revisar. Cómo los analizamos en 48 horas con IA
Caso real de extracción masiva de información en documentos judiciales colombianos usando inteligencia artificial. Sin analistas manuales. Resultados en Excel en 48 horas.
Un analista bien entrenado puede revisar un expediente judicial en 45 minutos si sabe exactamente qué buscar. Con 800 expedientes, eso son 600 horas de trabajo — quince semanas de un analista a tiempo completo. Y eso asumiendo que no comete errores, no se cansa y siempre encuentra los mismos campos de la misma forma en documentos que no tienen formato estándar.
Este es el problema real que enfrentan decenas de entidades públicas, despachos jurídicos y organizaciones de derechos humanos en Colombia. En este artículo explicamos cómo ScribeVoz Labs resuelve ese problema y qué resultados obtuvimos en un caso real.
El problema: documentos con datos atrapados
Los expedientes judiciales, las actas de inspección, los informes de campo y las declaraciones contienen datos estructurados — nombres, fechas, montos, decisiones, lugares — pero están escritos en lenguaje natural, sin formularios ni formatos uniformes.
Alguien dice "cuatro hombres y una mujer portando armas de fuego" y el dato que necesitas es "5 integrantes". Alguien más escribe "en la vereda El Jardín, municipio de Tierralta" y necesitas extraer "departamento: Córdoba, municipio: Tierralta". Ese nivel de interpretación es imposible con expresiones regulares y muy costoso con analistas humanos.
La solución: extracción estructurada con IA
El sistema de Labs Extractor recibe los documentos — PDFs, Word, imágenes escaneadas, correos — y para cada uno responde las preguntas que tú defines. "¿Cuál es el departamento donde ocurrieron los hechos?", "¿Cuántos integrantes tenía el grupo?", "¿Hubo amenazas?", "¿Qué actividad se menciona?".
Para cada pregunta el sistema devuelve el valor extraído, la cita textual exacta de donde proviene, la ubicación en el documento (página o párrafo) y un nivel de confianza. Si el dato no existe en el documento lo dice claramente — nunca inventa.
Cuando el texto dice algo ambiguo como "aproximadamente veinte personas", el sistema lo registra como "~20" y lo marca como inferido para que puedas diferenciarlo de los datos explícitos en tu análisis posterior.
El resultado: qué entrega Labs Extractor
La salida es un Excel con una fila por documento y una columna por variable definida. Junto a cada dato extraído hay tres columnas adicionales: la cita textual del documento, la ubicación exacta (página 3, párrafo 2) y el nivel de confianza (alto, medio, bajo). Esto permite auditar cualquier dato en segundos sin volver a abrir el documento original.
800 expedientes con 10 variables cada uno toman entre 6 y 8 horas de procesamiento dependiendo de la extensión de los documentos. El analista humano no lee 800 expedientes — revisa el Excel, verifica los casos de confianza baja y toma decisiones sobre datos estructurados en lugar de texto libre.
Para qué tipo de organización tiene sentido
Entidades de control: contralorías, procuradurías y personerías que procesan informes, actas y declaraciones de forma masiva.
Despachos jurídicos con alto volumen de casos: firmas que manejan decenas o cientos de expedientes simultáneos y necesitan identificar patrones rápidamente.
Organizaciones de derechos humanos: que trabajan con testimonios, versiones libres y documentos del conflicto y necesitan sistematizar la información para análisis e informes.
Periodismo de investigación: que trabaja con bases de datos de contratos, resoluciones o declaraciones y necesita extraer datos específicos de cientos de documentos.
Si tu equipo dedica más de 20 horas semanales a leer documentos para extraer datos, Labs Extractor tiene sentido económico desde la primera semana.
Cómo empezar
El proceso comienza con una reunión de 30 minutos donde defines qué variables necesitas extraer y nos muestras una muestra de tus documentos. Procesamos un piloto de 20 a 50 documentos para que veas los resultados antes de comprometerte con el proyecto completo.
No necesitas cambiar ningún sistema existente. Los documentos nos los puedes mandar por correo, por Google Drive o por cualquier medio que ya uses. El resultado te llega en Excel — sin instalaciones, sin cuentas nuevas, sin curva de aprendizaje.
¿Listo para probarlo?
Sin cuenta. Sin suscripción. Ve el precio exacto antes de pagar.
Analizar mis documentos