Transformando documentos en conocimiento con IA

alt

Por Leonardo García Arroyo

2024-03-22

Un viaje por Oracle Document Understanding

 

En este espacio, nos sumergiremos en la tecnología que está revolucionando la forma en que las empresas gestionan y aprovechan la información contenida en sus documentos no estructurados. Desde la automatización de procesos hasta la mejora de la calidad de los datos, descubriremos cómo con Oracle Document Understanding puedes mejor la calidad y extracción de datos de un documento.

 

¿Qué es Oracle Document Understanding?

Es un servicio impulsado por la inteligencia artificial que posibilita a los programadores obtener texto, tablas y otros datos importantes de documentos utilizando API y herramientas de interfaz de línea de comandos (CLI). Mediante Document Understanding, puedes automatizar las laboriosas tareas de procesamiento empresarial mediante modelos de inteligencia artificial predefinidos, y también adaptar la extracción de documentos para ajustarse a las necesidades particulares de tu sector industrial.

 

Visión General del Servicio

Document Understanding representa un servicio sin necesidad de servidor y de múltiples inquilinos, al que se puede acceder a través de la consola, las API de REST, el SDK o la CLI. Permite cargar documentos para identificar y clasificar texto y elementos dentro de ellos. Con este servicio, es posible procesar archivos de forma individual o en lotes utilizando el punto final de API ProcessorJob. Además, se proporciona soporte para los modelos pre-entrenados siguientes:

  • Reconocimiento óptico de caracteres (OCR):

Puede detectar y reconocer texto en un documento.

  • Extracción de texto:

Proporciona el nivel de palabra y el texto de nivel de línea, así como las coordenadas del cuadro delimitador donde se encuentra el texto.

  • Extracción de clave-valor:

Extrae una lista predefinida de información de par clave-valor de recibos, facturas, pasaportes e ID de controlador.

  • Extracción de tablas:

Extrae contenido en formato tabular, manteniendo las relaciones de fila y columna de las celdas.

  • Clasificación de documentos:

Document Understanding clasifica los documentos en diferentes tipos en función de la apariencia visual, las funciones de alto nivel y las palabras clave extraídas. Por ejemplo, tipos de documento como factura, recibo y currículum.

  • PDF de reconocimiento óptico de caracteres (OCR):

Genera un archivo PDF con capacidad de búsqueda en Object Storage.

 

En conclusión, Oracle Document Understanding representa un paso adelante en la evolución de la gestión de documentos y la inteligencia artificial en el mundo empresarial. Desde la automatización de procesos hasta la mejora de la calidad de los datos, esta tecnología está ayudando a las empresas a desbloquear el potencial oculto de sus documentos y a impulsar la transformación digital en todas las áreas de su negocio.