Boletín BIREME nº 103

Resúmenes by IA para mejorar la descripción bibliográfica

La integración de la Inteligencia Artificial (IA) en los productos y servicios de BIREME/OPS/OMS es un paso estratégico para agilizar y hacer más eficiente la gestión y la difusión de la información en salud. Con el uso de técnicas de IA, es posible optimizar el proceso de indexación automática, mejorar la recuperación de información en las interfaces de búsqueda de BIREME, y realizar análisis de datos para la toma de decisiones, entre otros beneficios.

En el área de Fronteras Digitales, BIREME ya cuenta con iniciativas sostenibles que utilizan herramientas de Inteligencia Artificial para mejorar los procesos de gestión y difusión de la información. Entre estas iniciativas, destacan Super Resúmenes, que sintetiza el contenido de los resúmenes de artículos científicos, y DeCS Finder IA, que ayuda en el proceso de indexación bibliográfica utilizando el vocabulario controlado DeCS/MeSH. Además, se está desarrollando un proceso de indexación totalmente automático, algo único en la región. Este nuevo producto, Resúmenes by IA, tiene como objetivo la generación de resúmenes a partir del texto completo para mejorar la descripción bibliográfica. Una característica destacada de este nuevo producto es el beneficio directo en la calidad de la indexación automática y toda la cadena de la descripción bibliográfica.

La descripción de un documento debe ser lo más completa posible, ya que de ella depende la calidad de la indexación y la precisión en la recuperación de la información. En los procesos de organización y catalogación, especialmente en entornos digitales, cada detalle marca la diferencia: desde el título hasta los metadatos que describen el contenido, el contexto y el objetivo del documento. Una descripción detallada permite a los usuarios encontrar más fácilmente lo que buscan y garantiza la integridad y accesibilidad de la colección de información.

Para la indexación mediante un tesauro, cuanta más información relevante se incluya, mejor será el resultado. Además de los metadatos básicos, es fundamental que el documento cuente con un resumen o abstract completo, capaz de ofrecer más datos para el proceso de indexación, la comprensión del documento descrito y su contextualización. Esta riqueza de información contribuye a una búsqueda más precisa y a una síntesis más fiel del contenido. Por esta razón, BIREME, en el contexto de las Fronteras Digitales y el desarrollo con herramientas de IA, inició un proyecto orientado a la generación automática de resúmenes a partir del texto completo, en tres idiomas.

Sin embargo, hay varios retos que afrontar en esta iniciativa, especialmente en lo que respecta al tratamiento de los textos completos. Uno de los puntos más críticos es la conversión de documentos en formato PDF a texto, un paso esencial para que el contenido sea legible y procesable por los sistemas de inteligencia artificial. Esta transformación es necesaria para que los algoritmos puedan identificar, comprender y resumir adecuadamente la información presente en el documento. Superar este reto técnico es fundamental para garantizar la calidad de los resúmenes generados y, en consecuencia, mejorar todo el proceso de indexación y descripción bibliográfica automatizada.

 

Figura 1. Flujo de generación de resúmenes a partir del texto completo.

En la Figura 1 se muestra el flujo de generación de resúmenes mediante IA, que comienza con la conversión de documentos PDF a texto sin formato, seguida de la detección del idioma original y, si es necesario, la traducción al inglés. Este proceso de traducción inicial al inglés es necesario porque los modelos están optimizados para este idioma. A continuación, un modelo de lenguaje especializado identifica el tipo de texto (artículo, libro, directriz etc.) y, a partir de ahí, se dirige al modelo especializado (fine-tuned) para cada tipo de texto. Por último, el texto resumido se traduce de nuevo al idioma original, lo que da como resultado un resumen final estandarizado, multilingüe y adaptado al tipo de documento.

La incorporación de la inteligencia artificial en los procesos de BIREME representa un hito importante en la modernización de la gestión de la información en salud. El uso de tecnologías como la generación automática de resúmenes, la indexación asistida y la traducción multilingüe amplían significativamente la eficiencia, la precisión y el alcance de los contenidos informativos. A pesar de los retos técnicos, estas iniciativas demuestran un avance constante hacia la mejora continua de la calidad de los productos y servicios desarrollados por BIREME. Estas acciones refuerzan el compromiso del Centro de utilizar la innovación tecnológica para fortalecer el acceso, la organización y la difusión de la información y el conocimiento científico en salud en toda la Región.

 

Leave a Reply

Your email address will not be published. Required fields are marked *