Ir al contenido

Ville Somppi, de M-Files , sobre inteligencia artificial, trabajo del conocimiento y datos estructurados frente a datos no estructurados.

Blog-Ville-Somppi-Thumbnail-banner-1200x628

Inteligencia artificial (IA) está transformando el trabajo del conocimiento cada día a medida que cada nueva innovación evoluciona cada vez más rápido. Nos sentamos con Ville Somppi, Vicepresidente de Soluciones Industriales en M-Files, para charlar sobre estos cambios, lo que significan para el futuro de los trabajadores del conocimiento y si (o cómo) la IA ayudará a las organizaciones a salvar la brecha entre datos estructurados y no estructurados.

Inteligencia artificial y futuro del trabajo

Algunos líderes empresariales predicen que la IA va a eliminar el trabajo por completo. Qué impacto cree que tendrá la IA en el futuro del trabajo?

En realidad, la IA potenciará el ingenio y la creatividad humanos. Los ordenadores hacen lo que se les pide. Si sabes la pregunta correcta, una IA sabrá la respuesta. En el caso de la IA generativa, el resultado está probablemente a medio camino o incluso al 90 por ciento, suponiendo que se tenga una idea de lo que hay que producir. La IA capacitará a los trabajadores fomentando un nuevo potencial para la automatización del trabajo del conocimiento.

La IA no sabrá qué crear al azar: debe haber una persona, un actor inteligente, que le pida que haga algo y luego valide que el contenido producido es el solicitado. La parte lenta de cualquier trabajo creativo, en la que realmente tienes que producir activos basados en tu idea original, se acelerará, pero la IA no sustituirá la necesidad de que los trabajadores del conocimiento materialicen una visión y utilicen su creatividad para dar vida a esa visión.

El camino hacia la automatización del trabajo del conocimiento

Cuando se hablaba de optimizar el rendimiento laboral, generalmente se hacía referencia a la gestión de archivos y procesos que nos llevaban a la siguiente fase de automatización. Esta evolución, ¿es consecuencia de la mejora del ancho de banda y la velocidad de procesamiento, y ha sido siempre el sueño o se trata de un cambio?

Este siempre ha sido el sueño, pero ha sido un proceso muy lento. La historia de la informática abarca sólo 50 ó 60 años. Los primeros ordenadores apenas podían almacenar datos. Con el tiempo, las interfaces gráficas llegaron a los mercados y encontramos formas de visualizar la información en una pantalla, no sólo impresa en papel. La interfaz gráfica de usuario significaba que no hacía falta ser un científico para entender lo que hace un ordenador, pero tareas importantes como la gestión de documentos y la gestión de flujos de trabajo seguían siendo totalmente manuales.

La visión siempre ha sido la automatización del trabajo del conocimiento y la innovación para facilitar cualquier trabajo, para mejorar la productividad. Pedir a un ordenador que cree algo sólo requiere lenguaje hablado o escrito. Hace décadas, los ordenadores podían hacer cálculos o simulaciones realmente geniales y potentes para ayudar a diseñar algo tan complejo como una misión espacial a otra galaxia. Mañana podrás decir: "Oye, ChatGPT, ¿puedes diseñarme una nave espacial basándote en este ejemplo?". En lugar de pasar miles de horas utilizando un ratón y un teclado para dibujar el plano en 3D, llegar a un borrador de diseño factible para perfeccionarlo es mucho más rápido. No tienes que explicarlo todo literalmente: ésa es la revolución.

Datos estructurados frente a datos no estructurados

Muchos de nuestros sistemas actuales, desde la gestión de archivos hasta los procesos empresariales, se basan en datos estructurados. sobre datos estructurados como archivos de Word o PowerPoint. Pero los tweets son legalmente descubribles en los tribunales y eso cuenta como datos no estructurados. En lo que respecta a la gestión del conocimiento, ¿existe realmente una diferencia entre datos estructurados y no estructurados o se ha difuminado por completo?

Tradicionalmente, los ordenadores necesitan una estructura para entender los datos. Digamos que el nombre de su empresa es sólo texto. Un sistema estructurado, como una herramienta de gestión de las relaciones con los clientes (CRM), puede leer un número de identificación correspondiente al nombre de su empresa, y entonces sólo se preocupa por el número de identificación, y siempre sabrá qué número de identificación representa a su empresa. Con datos no estructurados escritos por humanos, sin ningún significado explícitamente definido, un ordenador no los entenderá: son sólo texto.

Con grandes modelos lingüísticos, la estructura es menos importante porque los ordenadores pueden procesar los datos no estructurados de forma más eficiente para extraer el significado y cualquier punto de datos interesante. Digamos que un contrato es válido en 2024. Si extraemos ese periodo de tiempo como datos estructurados, el ordenador sabe cuándo se aplica el contrato. Con la IA generativa y su motor de inferencia, puedes preguntar qué significa un determinado elemento de un activo no estructurado, y la IA lo entiende porque puede leer e interpretar contenido no estructurado.

Hay una diferencia entre datos estructurados y no estructurados. Unos están pensados para ser leídos y comprendidos por los ordenadores y los otros fluyen libremente: a los ordenadores les ha costado entenderlos hasta ahora. Hoy en día es menos importante tener todo como datos estructurados, pero los datos estructurados siguen siendo la forma en que los ordenadores se comunican entre sí. En realidad no se puede calcular la frase "las doce y cuarto", porque un ordenador por defecto sólo ve texto. Un gran modelo de lenguaje puede convertir esa expresión humana en datos estructurados comprensibles para el ordenador, lo que permite realizar cálculos normales.

La importancia de la intención informativa

¿Por qué los datos estructurados son más fáciles de utilizar para los ordenadores y cómo procesa M-Files los datos no estructurados?

Con los datos estructurados, no sólo se tiene el valor de los datos, sino también el significado, el tipo y la intención informativa. Por ejemplo, un tipo es el nombre de una empresa. Todo sistema que utilice ese punto de datos sabe que esa designación se refiere al nombre de la empresa, así como al tipo de dato. Los datos estructurados pueden ayudar a un sistema a diferenciar entre un campo de texto y un campo numérico. Y en un campo numérico, ¿qué significa el número? ¿Es una cantidad de dinero o un código postal? Con los datos estructurados, los sistemas informáticos saben a qué te refieres con cualquier dato.

Si sube un contrato a M-Filesno es más que un documento. No está estructurado, está creado por humanos, pero podemos extraer puntos de datos interesantes, como metadatos estructurados. Como M-Files puede etiquetar documentos con metadatos como la validez del contrato, podemos transformar partes de esos datos no estructurados en datos estructurados, de modo que los ordenadores puedan procesarlos para aplicar reglas de negocio y potenciar todos los tipos de automatización del trabajo del conocimiento.

La IA generativa cuesta capital

¿Influye el formato de los datos en el coste de la IA generativa? Los datos no estructurados, ¿son más caros de procesar y los nuevos modelos lingüísticos han cambiado esta situación?

Utilizar la IA generativa puede resultar caro porque el ordenador tiene que procesar mucho para entender el contenido, filtrar cualquier caos organizativo existente o encontrar un periodo contractual válido determinado, a diferencia de alguien que simplemente lee esa información de los metadatos. Si haces eso un millón de veces, probablemente pagarás 50.000 dólares a la empresa que proporcione el servicio de IA generativa porque su IA está haciendo un trabajo muy duro.

Pero se puede hacer siempre a partir de un campo de datos estructurado y a bajo coste porque es trivial. Los grandes modelos lingüísticos no son más que gigantescas fórmulas matemáticas alimentadas por redes neuronales profundas. Introduces un valor de entrada y sale el de salida. Pero el coste de realizar esa operación matemática es mucho comparado con hacer cosas normales que podíamos hacer hace 50 años.

El elemento del coste del pensamiento es muy importante. No podemos sustituir toda la informática antigua y utilizar la inteligencia artificial y la IA generativa para todo, porque es mil millones de veces más caro.

Tengo aquí un smartphone con más potencia de cálculo y más control sobre la tecnología de la información que todos los superordenadores de los años noventa. Los grandes modelos lingüísticos y las IA generativas que entienden el lenguaje son posibles porque tenemos mucha más potencia de cálculo que en el pasado, lo que no significa que sean baratos, sino posibles. Cualquier empresa que aplique estas tecnologías tiene que hacer un análisis coste-beneficio. ¿Cuándo debemos utilizar estas nuevas y caras tecnologías frente a otras más baratas, mecánicas y tradicionales?

Últimos artículos

Examinar temas

Recursos

Buscar

Ir arriba