Hopp til innhold

Ville Somppi av M-Files om kunstig intelligens, kunnskapsarbeid og strukturerte vs. ustrukturerte data

Blog-Ville-Somppi-Thumbnail-banner-1200x628

Kunstig intelligens (AI) transformerer kunnskapsarbeid hver dag etter hvert som hver ny innovasjon utvikler seg raskere og raskere. Vi satte oss ned med Ville Somppi, Visepresident for industriløsninger kl M-Files , for å chatte om disse endringene, hva de betyr for fremtiden til kunnskapsarbeidere, og om (eller hvordan) AI vil hjelpe organisasjoner med å bygge bro mellom strukturerte og ustrukturerte data.

Kunstig intelligens og fremtidens arbeid

Noen bedriftsledere spår at AI kommer til å eliminere arbeidet helt. Hvilken innvirkning ser du at AI har på fremtidens arbeid?

AI vil faktisk styrke menneskelig oppfinnsomhet og kreativitet . Datamaskiner gjør det du ber dem om. Hvis du vet det riktige spørsmålet, vil en AI vite svaret. Når det gjelder generativ AI, er produksjonen sannsynligvis halvveis eller til og med 90 prosent der, forutsatt at du har en ide om hva du skal produsere. AI vil styrke arbeidstakere ved å fremme nytt potensial for automatisering av kunnskapsarbeid.

AI vil ikke tilfeldig vite hva den skal lage – det må være en person, en intelligent skuespiller, som ber den om å gjøre noe og deretter validere at innholdet som produseres er som forespurt. Den langsomme delen i ethvert kreativt arbeid, hvor du faktisk må produsere eiendeler basert på den opprinnelige ideen din, vil øke hastigheten, men AI vil ikke erstatte behovet for kunnskapsarbeidere for å realisere en visjon og bruke kreativiteten sin til å bringe den visjonen ut i livet.

Reisen mot kunnskapsarbeidsautomatisering

Når folk snakket om å optimalisere arbeidsytelsen, handlet det generelt om filhåndtering og prosesshåndtering som tar oss inn i neste fase av automatisering. Er denne utviklingen et resultat av bedre båndbredde og prosesseringshastigheter, og var dette alltid drømmen eller er dette et skifte?

Dette har alltid vært drømmen, men det har vært en veldig langsom prosess. IT-historien dekker bare 50 eller 60 år. De første datamaskinene klarte knapt å lagre data. Etter hvert kom grafiske grensesnitt inn i markedene, og vi fant måter å visualisere informasjon på en skjerm – ikke bare trykt på papir. Det grafiske brukergrensesnittet betydde at du ikke trengte å være vitenskapsmann for å forstå hva en datamaskin gjør, men viktige oppgaver som dokumenthåndtering og arbeidsflytadministrasjon var fortsatt helt manuelle.

Visjonen har alltid vært automatisering av kunnskapsarbeid og innovasjon for å gjøre ethvert arbeid enklere – for å forbedre produktiviteten. Å be en datamaskin om å lage noe krever kun muntlig eller skriftlig språk. For flere tiår siden kunne datamaskiner gjøre veldig kule, kraftige beregninger eller simuleringer for å hjelpe til med å designe noe så komplekst som et romoppdrag til en annen galakse. I morgen vil du kunne si: "Hei, ChatGPT, kan du designe et romfartøy for meg basert på dette eksemplet?" I stedet for å bruke tusenvis av timer på å bruke en mus og et tastatur for å tegne 3D-planen, er det mye raskere å få til en brukbar utkastdesign for å foredle. Du trenger ikke å forklare alt bokstavelig – det er revolusjonen.

Strukturerte vs. ustrukturerte data

Så mange av systemene våre i dag – fra filbehandling til forretningsprosesser – handler om strukturerte data som Word- eller PowerPoint-filer. Men tweets er juridisk synlige i retten, og det regnes som ustrukturert. Når det gjelder kunnskapsarbeid, er det virkelig forskjell på strukturert og ustrukturert data eller har det bare blitt helt uskarpt?

Tradisjonelt trenger datamaskiner struktur for å forstå data. La oss si at navnet på bedriften din bare er tekst. Et strukturert system som en kundebehandling ( CRM )-verktøyet kan lese et ID-nummer som tilsvarer firmanavnet ditt, og da bryr det seg kun om ID-en, og vil alltid vite hvilket ID-nummer som representerer din bedrift. Med ustrukturerte data skrevet av mennesker, uten noen eksplisitt definert mening, vil ikke en datamaskin forstå det – det er bare en tekst.

Med store språkmodeller er struktur mindre viktig fordi datamaskiner kan behandle ustrukturerte data mer effektivt for å trekke ut mening og eventuelle interessante datapunkter. Si at en kontrakt er gyldig i 2024. Hvis vi trekker ut den tidsperioden som strukturerte data, vet datamaskinen når kontrakten gjelder. Med generativ AI og dens inferensmotor kan du spørre hva et gitt element i en ustrukturert ressurs betyr, og AI forstår fordi den kan lese og tolke ustrukturert innhold.

Det er forskjell på strukturerte og ustrukturerte data. Den ene er ment å bli lest og forstått av datamaskiner, og den andre er frittflytende - datamaskiner har hatt vanskelig for å forstå den til nå. Det er mindre viktig i dag å ha alt som strukturert data, men strukturert data er fortsatt hvordan datamaskiner snakker med hverandre. Du kan egentlig ikke beregne uttrykket "kvart over middag", fordi en datamaskin som standard bare ser tekst. En stor språkmodell kan konvertere det menneskelige uttrykket til datamaskinforståelige strukturerte data, slik at normale beregninger kan skje.

Viktigheten av informasjonsintensjon

Hvorfor er strukturerte data enklere å bruke for datamaskiner, og hvordan M-Files behandle ustrukturerte data?

Med strukturerte data har du ikke bare verdien av dataene, du har også betydningen, typen og informasjonsintensjonen. En type er for eksempel navnet på et selskap. Hvert system som bruker det datapunktet vet at betegnelsen refererer til navnet på selskapet, så vel som typen data. Strukturerte data kan hjelpe et system med å skille mellom et tekstfelt og et tallfelt. Og i et tallfelt, hva betyr tallet? Er det et pengebeløp eller et postnummer? Med strukturerte data vet datasystemer hva du mener med en gitt informasjon.

Hvis du laster opp en kontrakt til M-Files , er det bare et dokument. Det er ustrukturert, det er menneskeskapt, men vi kan trekke ut interessante datapunkter som strukturerte metadata. Fordi M-Files kan merke dokumenter med metadata som kontraktsgyldighet, kan vi transformere deler av de ustrukturerte dataene til strukturerte data slik at datamaskiner kan behandle dem for å anvende forretningsregler og styrke alle varianter av automatisering av kunnskapsarbeid.

Generativ kunstig intelligens koster kapital

Påvirker dataformat kostnadene for å bruke generativ AI? Er ustrukturerte data dyrere å behandle, og har nye språkmodeller endret dette?

Å bruke generativ AI kan være dyrt fordi datamaskinen må gjøre mye prosessering for å forstå innholdet, for å sile gjennom et eksisterende organisatorisk kaos eller finne en gitt gyldig kontraktperiode i motsetning til at noen bare leser den informasjonen fra metadataene. Hvis du gjør det en million ganger, vil du sannsynligvis betale $50 000 til det selskapet som leverer den generative AI-tjenesten fordi deres AI gjør så mye hardt arbeid.

Men du kan gjøre det for alltid fra et strukturert datafelt og til lave kostnader fordi det er trivielt. Store språkmodeller er bare gigantiske matematiske formler drevet av dype nevrale nettverk. Du legger inn en inngangsverdi, og utgangsverdien kommer ut. Men kostnadene ved å utføre den matematiske operasjonen er mye sammenlignet med å bare gjøre vanlige ting vi kunne gjøre for 50 år siden.

Tankekostnadselementet er superviktig. Vi kan ikke bare erstatte all den gamle IT-en og bruke kunstig intelligens og generativ AI til alt fordi det er omtrent en milliard ganger dyrere.

Jeg har en smarttelefon her med mer datakraft og mer kontroll over informasjonsteknologi enn alle superdatamaskinene hadde på 1990-tallet. Store språkmodeller og generative AI-er som forstår språk er mulig fordi vi har så mye mer datakraft sammenlignet med fortiden – det gjør det ikke billig, bare mulig. Ethvert selskap som bruker disse teknologiene må gjøre en kostnad-nytte-analyse. Når bør vi bruke disse kule, nye, dyre teknologiene, i motsetning til billigere, mer mekaniske og tradisjonelle IT-teknologier?

Siste artikler

Bla gjennom emner

Søk

Bla til toppen