Hopp til innhold

Kunstig intelligens, kunnskapsarbeid og strukturerte kontra ustrukturerte data, slik Ville Somppi fra M-Files ser det.

Kunstig intelligens, kunnskapsarbeid og strukturerte kontra ustrukturerte data, slik Ville Somppi fra M-Files ser det.


Kunstig intelligens (KI) transformerer kunnskapsarbeidet hver dag, i takt med at ny innovasjon utvikler seg raskere og raskere. Vi satte oss ned med Ville Somppi, Vice President for bransjeløsninger hos M-Files, for å snakke om disse endringene, hva de betyr for fremtiden til kunnskapsarbeidere, og om (eller hvordan) KI vil hjelpe organisasjoner og selskaper med å bygge bro over gapet mellom strukturerte og ustrukturerte data.

Kunstig intelligens og fremtidens arbeid

Noen forretningsledere forutser at KI kommer til å eliminere arbeid helt og holdent. Hvilken innvirkning ser du at KI vil ha på fremtidens arbeid?

KI vil faktisk styrke menneskelig oppfinnsomhet og kreativitet. Datamaskiner gjør det du ber dem om. Hvis du vet det rette spørsmålet, vil KI vite svaret. Når det gjelder generativ KI, er resultatet trolig allerede halvveis eller til og med 90 prosent ferdig, gitt at du har en idé om hva du vil produsere. KI vil styrke ansatte ved å fremme nye muligheter for automatisering av kunnskapsarbeid.

KI vil ikke tilfeldigvis vite hva som skal skapes – det må være en person, en intelligent aktør, som ber KI om å gjøre noe, og som deretter validerer at innholdet som produseres er slik det ble forespurt om. Den langsomme delen i ethvert kreativt arbeid, der du faktisk må produsere ting basert på den opprinnelige ideen, vil akselerere, men KI vil ikke erstatte behovet for kunnskapsarbeidere for å realisere en visjon og være kreative for å bringe denne visjonen til live.

Reisen mot automatisering av kunnskapsarbeid

Når man har snakket om å optimalisere arbeidsytelsen, har det generelt sett handlet om filbehandling og prosessbehandling som tar oss til neste fase av automatisering. Er denne utviklingen et resultat av bedre båndbredde og prosesseringshastigheter, og har dette alltid vært drømmen eller er dette et skifte?

Dette har alltid vært drømmen, men det har vært en veldig langsom prosess. Bare 50 eller 60 år har gått siden IT-historien begynte. De første datamaskinene kunne knapt lagre data. Senere kom grafiske grensesnitt på markedet, og vi fant måter å visualisere informasjon på en skjerm – ikke bare skrevet ut på papir. Det grafiske brukergrensesnittet betydde at man ikke måtte være forsker for å forstå hva en datamaskin gjør, men viktige oppgaver som dokumentbehandling og arbeidsflytbehandling var fortsatt helt manuelle.

Visjonen har alltid vært automatisering av kunnskapsarbeidet og innovasjon for å gjøre ethvert arbeid enklere – for å forbedre produktiviteten. Å be en datamaskin om å skape noe, krever bare et muntlig eller skriftlig språk. For noen tiår siden kunne datamaskiner gjøre virkelig kule, kraftige beregninger eller simuleringer for å hjelpe til med å designe noe så komplekst som en romferd til en annen galakse. I morgen vil du kunne si: «Hei, ChatGPT, kan du designe et romfartøy for meg basert på dette eksemplet?» I stedet for å bruke tusenvis av timer med mus og tastatur for å tegne 3D-skissen, går det mye raskere å komme til en arbeidsdyktig utkastdesign som deretter kan forbedres. Du trenger ikke bokstavelig talt forklare alt – det er dette som er revolusjonen.

Strukturerte kontra ustrukturerte data

For mange av systemene våre i dag – fra filbehandling til forretningsprosess – handler alt om strukturerte data som Word- eller PowerPoint-filer. Men tweets kan kreves framlagt i retten og regnes som ustrukturerte data. Når det gjelder kunnskapsarbeid, er det virkelig en forskjell mellom strukturerte og ustrukturerte data, eller har linjene blitt helt utvisket?

Tradisjonelt sett trenger datamaskiner struktur for å forstå data La oss si at navnet på virksomheten din bare er tekst. Et strukturert system som et kundehåndteringssystem (CRM) kan lese et ID-nummer som svarer til navnet på virksomheten, og da bryr det seg bare om ID-en, og vil alltid vite hvilket ID-nummer som representerer virksomheten. Med ustrukturerte data skrevet av mennesker, uten noen eksplisitt definert betydning, vil en datamaskin ikke forstå det – det er bare en tekst.

Takket være store språklige modeller kan datamaskiner nå håndtere ustrukturerte data med høyere effektivitet, og dermed trekke ut både mening og viktige informasjonspunkter. Si at en kontrakt er gyldig i 2024. Hvis vi ekstraherer den tidsperioden som strukturerte data, vet datamaskinen når kontrakten gjelder. Med generativ KI og dens evne til å trekke slutninger, kan du spørre om betydningen av et element i ustrukturerte data, og KI-en vil forstå dette ved å lese og tolke innholdet.

Det er en forskjell mellom strukturerte og ustrukturerte data. Én type data er beregnet på maskinlesing og forståelse, mens den andre er mer ustrukturert – datamaskiner har hatt problemer med å forstå denne typen data inntil nylig. Det er mindre viktig i dag å ha alt som strukturerte data, men strukturerte data er fortsatt hvordan datamaskiner kommuniserer med hverandre. Du kan ikke egentlig beregne uttrykket «kvart over tolv», fordi en datamaskin som standard ser bare tekst. En stor språkmodell kan konvertere den menneskelige uttrykket til datamaskinforståelig, strukturerte data, slik at normale beregninger kan gjennomføres.

Viktigheten av hensikten bak informasjonen

Hvorfor er strukturerte data enklere for datamaskiner å bruke, og hvordan behandler M-Files ustrukturerte data?

Med strukturerte data har du ikke bare verdien av dataene, du har også betydningen, typen og hensikten bak informasjonen. For eksempel, er en type navnet på en virksomhet. Alle systemer som benytter denne opplysningen, forstår at betegnelsen refererer til virksomhetens navn og datatypen. Strukturerte data kan hjelpe et system med å skille mellom et tekstfelt og et nummerfelt. Og i et nummerfelt, hva betyr tallet? Er det en pengebeløp eller et postnummer? Med strukturerte data vet datamaskinsystemer hva du mener med all informasjon.

Hvis du laster opp en kontrakt til M-Files, er det bare et dokument. Det er ustrukturert, det er menneskeskapt, men vi kan trekke ut interessante datapunkter som strukturerte metadata. Ved å bruke M-Files til å merke dokumenter med metadata som kontraktens varighet, kan vi konvertere deler av de ustrukturerte dataene til strukturerte data, slik at datamaskiner kan behandle dem, anvende forretningsregler og fremme alle former for automatisering av kunnskapsarbeid.

Generativ KI medfører økonomiske kostnader

Påvirker dataformatet kostnaden ved å bruke generativ KI? Er ustrukturerte data dyrere å behandle, og har nye språkmodeller endret dette?

Bruk av generativ KI kan være dyrt fordi datamaskiner må bearbeide store mengder data for å forstå innholdet, sortere gjennom organisatorisk rot og finne en spesifikk gyldig kontraktsperiode, noe som er langt mer krevende enn at noen leser informasjonen direkte fra metadataene. Hvis du gjør dette en million ganger, vil du sannsynligvis betale $ 50 000 til hvilken som helst virksomhet som tilbyr denne generative KI-tjenesten, fordi KI-en deres må utføre mye arbeid.

Men du kan gjøre det i det uendelige fra et strukturert datafelt til en lav kostnad fordi det er enkelt. Store språkmodeller er bare gigantiske matematiske formler drevet av dype nevrale nettverk. Du legger inn en inndataverdi, og får utdataverdien levert. Men kostnaden ved å utføre den matematiske operasjonen er høy sammenlignet med å bare gjøre normale ting vi kunne gjøre for 50 år siden.

Tankeprosesser medfører betydelige kostnader, og dette elementet er avgjørende. Vi kan ikke bare erstatte all gammel IT og bruke kunstig intelligens og generativ KI til alt, fordi dette er omtrent en milliard ganger dyrere.

Jeg har en smarttelefon her med mer databehandlingskraft og mer kontroll over informasjonsteknologien enn alle superdatamaskinene hadde på 1990-tallet. Store språkmodeller og generative KI-er som forstår språk er mulige fordi vi nå har så mye mer databehandlingskraft sammenlignet med tidligere. Dette gjør det ikke billig, bare mulig. Virksomheter som benytter seg av denne teknologien må foreta en grundig evaluering av lønnsomheten. Når bør vi satse på disse spennende, nye og kostbare teknologiene, fremfor de rimeligere, mer mekaniske og tradisjonelle IT-løsningene?

 

 

Related Articles

Search

Browse Topics

Scroll til toppen