Ville Somppi de M-Files habla sobre la inteligencia artificial, el trabajo del conocimiento y los datos estructurados versus los no estructurados
La inteligencia artificial (IA) transforma diariamente el trabajo del conocimiento a medida que la innovación evoluciona cada vez más rápido. Nos sentamos a conversar con Ville Somppi, vicepresidente de soluciones por sector de actividad en M-Files, sobre estos cambios, lo que significan para el futuro de los trabajadores del conocimiento y si (o cómo) la IA ayudará a las organizaciones a cerrar la brecha entre los datos estructurados y los no estructurados.
La inteligencia artificial y el futuro del trabajo
Algunos líderes empresariales predicen que la IA eliminará definitivamente al trabajo. ¿Qué impacto crees que tendrá la IA sobre el futuro del trabajo?
La IA, lo que hará realmente es fomentar el ingenio y la creatividad humana. Las computadoras hacen lo que uno les pide, así que si uno hace la pregunta adecuada, la IA sabrá la respuesta. En el caso de la IA generativa, el resultado ya está a medio camino o incluso a un 90% de acierto, suponiendo que uno ya tiene una idea clara de qué se quiere producir. La IA empoderará a los trabajadores al estimular un nuevo potencial para la automatización del trabajo del conocimiento.
La IA no va a saber qué crear por sí misma, solo por el acto de crear. Debe haber una persona, alguien con inteligencia, que le pida que haga algo y que luego valide que el contenido producido sea conforme a lo solicitado. La parte lenta en cualquier trabajo creativo, donde uno realmente tiene que producir activos a partir de su idea original, se acelerará, pero la IA no reemplazará la necesidad de contar con trabajadores del conocimiento que conciban esa visión y utilicen su creatividad para convertirla en realidad.
El camino hacia la automatización del trabajo del conocimiento
Antes, cuando las personas hablaban de optimización del desempeño del trabajo, generalmente se referían a la gestión de archivos y la gestión de procesos, los cuales nos conducen a la siguiente etapa de la automatización. ¿Es esta evolución el resultado de mejores anchos de banda o velocidades de procesamiento? ¿Y fue éste siempre el objetivo o se trata de un cambio de trayectoria?
Este siempre ha sido el objetivo pero ha sido un proceso muy lento. La historia de la TI abarca solo unos 50 o 60 años. Las primeras computadoras eran apenas capaces de almacenar datos. Con el tiempo, las interfaces gráficas llegaron al mercado y encontramos formas de visualizar la información en una pantalla y no solo impresa en papel. La interfaz gráfica de usuario significó que no había que saber de ciencia para entender lo que hace la computadora, pero tareas importantes como la gestión de documentos y la gestión del flujo de trabajo, seguían siendo totalmente manuales.
La visión ha sido siempre la automatización del trabajo del conocimiento y la innovación para facilitar cualquier trabajo y así mejorar la productividad. Pedir a una computadora que cree algo, solo requiere lenguaje hablado o escrito. Desde hace décadas, las computadoras ya podían hacer cálculos o simulaciones realmente impresionantes y potentes para ayudar a diseñar algo tan complejo como una misión a otra galaxia. El día de mañana, cualquier persona podrá decir: “Hey, ChatGPT, ¿puedes diseñarme una nave espacial basándote en este ejemplo?”. En lugar de pasar miles de horas usando un ratón y teclado para dibujar un modelo tridimensional, ahora resulta mucho más rápido llegar a un diseño preliminar y luego perfeccionarlo. Uno no necesita explicarlo todo de forma literal y eso es lo revolucionario.
Datos estructurados versus no estructurados
Muchos de nuestros sistemas hoy en día, desde la gestión de archivos hasta los procesos de negocio, se basan en datos estructurados como archivos de Word o PowerPoint. Sin embargo, los tuits son utilizados como evidencia en tribunales y estos son datos no estructurados. Cuando se trata del trabajo del conocimiento, ¿hay realmente una diferencia entre los datos estructurados y no estructurados? ¿O esa diferencia ya se ha difuminado por completo?
Tradicionalmente, las computadoras necesitan estructura para entender los datos [INTERNAL LINK: “Structured and Unstructured Data”]. Supongamos que el nombre de su empresa se compone solo de texto. Un sistema estructurado, como una herramienta de gestión de relación con el cliente (CRM por sus siglas en inglés) puede leer un número de identificación que corresponde al nombre de su empresa y a partir de ahí solo le interesará ese número y siempre sabrá qué número de identificación representa a su empresa. Cuando se trate de datos no estructurados escritos por personas y sin ningún significado definido explícitamente, la computadora no los entenderá ya que solo los verá como texto.
Con los grandes modelos de lenguaje, la estructura es menos importante porque las computadoras pueden procesar datos no estructurados con mayor eficiencia para extraer el significado y los puntos de datos interesantes. Digamos que un contrato es válido en 2024. Si extraemos ese período de tiempo como un dato estructurado, la computadora sabe cuándo el contrato tiene validez. Con la IA generativa y su motor de inferencia, uno puede preguntar qué significa un elemento específico de un activo no estructurado y la IA va a entender debido a su capacidad de leer e interpretar contenido no estructurado.
Hay una diferencia entre los datos estructurados y los no estructurados: los primeros están destinados a ser leídos y comprendidos por las computadoras y los segundos a fluir libremente. Esta diferencia hasta ahora, ha sido difícil de entender para las computadoras. En la actualidad, es menos importante tener todo en la forma de datos estructurados, aunque estos datos siguen siendo la forma en la que las computadoras se comunican entre sí. La computadora no puede calcular realmente la frase “un cuarto de hora después del mediodía” porque por default solo ve texto. Un gran modelo de lenguaje puede convertir esa expresión humana en un dato estructurado comprensible para la computadora, lo que permite que se produzcan cálculos normales.
La importancia de la intención informativa
¿Por qué los datos estructurados son más fáciles de utilizar para las computadoras y cómo M-Files procesa datos no estructurados?
Con los datos estructurados, no solo se tiene el valor de los datos, sino también el significado, el tipo y la intención informativa. Por ejemplo, un tipo es el nombre de una empresa. Todo sistema que utilice ese punto de datos sabe que esa designación se refiere al nombre de la empresa, así como al tipo de dato. Los datos estructurados pueden ayudar a un sistema a diferenciar entre un campo de texto y un campo numérico. Y en un campo numérico, ¿qué significa el número? ¿Es una cantidad de dinero o un código postal? Con los datos estructurados, los sistemas computacionales saben a lo que uno se refiere con cualquier tipo de información determinada.
Si subimos un contrato a M-Files, es solo un documento el cual no es estructurado, es creado por personas. Sin embargo, podemos extraer de él puntos de datos interesantes tales como metadatos estructurados. Debido a que M-Files puede etiquetar documentos con metadatos, como la validez de un contrato, podemos transformar algunas partes de esos datos no estructurados en datos estructurados. Así, las computadoras pueden procesarlos para aplicar las reglas de negocio y potenciar todos los sabores de la automatización del trabajo del conocimiento.
La IA generativa requiere inversión de capital
¿Influye el formato de los datos en el costo de utilizar la IA generativa? ¿Es más caro procesar datos no estructurados? ¿Son los nuevos modelos de lenguaje responsables de este cambio?
El uso de la IA generativa puede ser costoso porque la computadora tiene que hacer mucho procesamiento para entender el contenido, filtrar cuidadosamente cualquier caos organizacional existente o encontrar el período de validez de un contrato determinado, en lugar de que alguien simplemente lea esa información en los metadatos. Si uno hace eso un millón de veces, probablemente habría que pagar 50,000 dólares a la empresa que brinde el servicio de IA generativa porque es su IA la que realiza el trabajo difícil.
Sin embargo, uno puede hacerlo indefinidamente a partir de un campo de dato estructurado, a un bajo costo porque se trata de algo trivial. Los grandes modelos de lenguaje son simplemente fórmulas matemáticas gigantescas impulsadas por redes neuronales profundas. Uno ingresa un valor de entrada y obtiene como resultado el valor de salida, pero el costo de realizar esa operación matemática es mucho comparado con el de hacer solo las cosas que podíamos lograr hace cincuenta años.
El elemento pensamiento-costo es muy importante. No podemos simplemente reemplazar toda la tecnología de información antigua y utilizar inteligencia artificial e IA generativa para todo porque es mil millones de veces más caro.
Tengo un smartphone aquí con más poder de cálculo y más control sobre la tecnología de la información que los que tenían las supercomputadoras en la década de los noventas. Los grandes modelos de lenguaje y las IA generativas que entienden el lenguaje son posibles porque tenemos mucho más poder de cálculo que en el pasado. Eso no hace que sea más barato, solamente posible. Cualquier empresa que aplique estas tecnologías tiene que hacer un análisis de costo-beneficio. ¿Cuándo deberíamos emplear estas tecnologías nuevas, modernas y caras, en lugar de las tecnologías de información más baratas, mecánicas y tradicionales?