Kan AI och automatisering av kunskapsarbete underlätta?
Ville Somppi från M-Files om artificiell intelligens, kunskapsarbete och strukturerade kontra ostrukturerade data
Den snabba utvecklingen inom artificiell intelligens (AI) och innovation förändrar i grunden vårt sätt att arbeta. Vi träffade Ville Somppi, Vice President Industry Solutions på M-Files, för att prata om kunskapsarbete, de snabba förändringarna, vad de innebär för framtidens arbetsplatser och om (eller hur) AI kan hjälpa organisationer att överbrygga klyftan mellan strukturerade och ostrukturerade data.
Artificiell intelligens och framtidens arbete
Vissa företagsledare förutspår att AI kommer att eliminera arbete helt och hållet. Vilken inverkan tror du att AI kommer att ha på framtidens arbete?
AI kommer framförallt att stärka människans uppfinningsrikedom och kreativitet. Datorer gör det du ber dem om. Om du ställer rätt fråga kommer en AI att veta svaret. När det gäller generativ AI är resultatet förmodligen halvvägs eller till och med klart till nittio procent. Men det förutsätter att du har en idé om vad som ska produceras. AI kommer därför att stärka medarbetarna genom att skapa nya möjligheter att automatisera kunskapsarbete.
AI kommer inte att veta vad den ska skapa. Det måste finnas en person, en intelligent aktör, som ber den att göra något och sedan ser till att innehållet som produceras är relevant. Den långsamma delen i allt kreativt arbete, där du producerar något som baseras på din ursprungliga idé, kommer att gå snabbare. Däremot kommer inte AI att ersätta behovet av medarbetare som har en vision och använder sin kreativitet för att förverkliga den visionen.
Vägen till att automatisera kunskapsarbete
När man talat om att optimera arbete har det i allmänhet handlat om filhantering och processhantering som tar oss in i nästa fas av automatisering. Är den här utvecklingen ett resultat av bättre bandbredd och processhastigheter, och har det här alltid varit drömmen eller är det här ett skifte?
Det har alltid varit drömmen, men det har varit en mycket långsam process. IT:s historia omfattar bara 50 eller 60 år. De första datorerna kunde knappt lagra data. Så småningom kom grafiska gränssnitt in på marknaden och vi hittade sätt att visualisera information på en skärm – inte bara tryckt på papper. Det grafiska användargränssnittet innebar att man inte behövde vara vetenskapsman för att förstå vad en dator gör, men viktiga uppgifter som dokumenthantering och hantering av arbetsflöden förblev fortfarande helt manuella.
Visionen har alltid varit att automatisera kunskapsarbete och innovation för att göra allt arbete enklare – och producera snabbare. Att be en dator att skapa något kräver bara talat eller skrivet språk. För flera decennier sedan kunde datorer göra riktigt häftiga, kraftfulla beräkningar eller simuleringar för att hjälpa till att utforma något så komplext som ett uppdrag till Mars. I morgon kommer du att kunna säga: "Hej, ChatGPT, kan du designa en Marslandare åt mig baserat på det här exemplet?" I stället för att tillbringa tusentals timmar med mus och tangentbord för ta fram 3D-ritningar går det mycket snabbare att designa ett användbart utkast som kan förfinas. Du behöver inte förklara allt bokstavligt. Och det är revolutionen.
Strukturerade jämfört med ostrukturerade data
Så många av våra system i dag – från filhantering till affärsprocesser – innehåller strukturerade data som Word- eller PowerPoint-filer. Men tweets räknas som ostrukturerade. När det gäller kunskapsarbete, finns det verkligen någon skillnad mellan strukturerad och ostrukturerad data eller har den bara suddats ut helt och hållet?
Traditionellt sett behöver datorer struktur för att förstå data [INTERNAL LINK: “Structured and Unstructured Data”]. Låt oss säga att namnet på ditt företag bara är text. Ett strukturerat system som ett CRM-verktyg kan läsa av ett ID-nummer som motsvarar ditt företagsnamn, och sedan bryr det sig bara om ID-numret och kommer alltid att veta vilket ID-nummer som representerar ditt företag. Ostrukturerade data som skrivits av människor, utan någon explicit definierad mening, kan en dator inte förstå – det är bara text.
Med stora språkmodeller är strukturen mindre viktig eftersom datorer kan bearbeta ostrukturerad data mer effektivt för att utvinna mening och alla intressanta datapunkter. Säg att ett avtal är giltigt under 2024. Om vi extraherar den tidsperioden som strukturerad data vet datorn när avtalet gäller. Med generativ AI och dess inferensmotor kan du fråga vad ett visst objekt i en ostrukturerad tillgång betyder, och AI förstår eftersom den kan läsa och tolka ostrukturerat innehåll.
Det finns alltså en viktig skillnad mellan strukturerade och ostrukturerade data. Den ena är avsedd att läsas och förstås av datorer och den andra är fritt flödande – något som datorer hittills har haft svårt att förstå. I dag är det inte lika viktigt att ha allt som strukturerad data, men strukturerad data är fortfarande det datorer använder för att prata med varandra. Det går inte att beräkna frasen "kvart över tolv", eftersom en dator som standard bara ser text. Men en stor språkmodell kan omvandla det mänskliga uttrycket till strukturerad data som datorn kan förstå, så att normala beräkningar kan göras.
Betydelsen av avsiktlig information
Varför är strukturerade data lättare för datorer att använda, och hur bearbetar M-Files ostrukturerade data?
Med strukturerade data får du inte bara datavärdet, du får också betydelsen, typen och informationsavsikten. En typ är t.ex. namnet på ett företag. Alla system som använder den datapunkten vet att beteckningen hänvisar till företagets namn och till typen av data. Strukturerade data kan hjälpa ett system att skilja mellan ett textfält och ett sifferfält. Och i ett sifferfält, vad betyder siffran? Avser den en summa pengar eller ett postnummer? Med strukturerade data vet datorsystemen vad du menar med en viss information.
Om du laddar upp ett kontrakt till M-Files är det bara ett dokument. Det är ostrukturerat, det är skapat av människor, men vi kan extrahera intressanta datapunkter som strukturerade metadata. Eftersom M-Files kan tagga dokument med metadata, t.ex. avtalets giltighet, kan vi omvandla delar av den ostrukturerade datan till strukturerad data så att datorer kan bearbeta den för att tillämpa affärsregler och möjliggöra olika typer av automatisering av kunskapsarbete.
Generativ AI kostar
Påverkar dataformatet kostnaden för att använda generativ AI? Är ostrukturerad data dyrare att bearbeta, och har nya språkmodeller förändrat det?
Att använda generativ AI kan vara dyrt eftersom datorn måste göra en hel del bearbetning för att förstå innehållet, för att sålla igenom befintligt organisatoriskt kaos eller hitta en given giltig avtalsperiod till skillnad från om någon helt enkelt läser den informationen från metadata. Om du gör det en miljon gånger kommer du förmodligen att betala 50 000 dollar till det företag som levererar den generativa AI-tjänsten eftersom deras AI gör så mycket hårt arbete.
Men du kan göra det för evigt från ett strukturerat datafält och till låg kostnad eftersom det är enkelt. Stora språkmodeller är bara gigantiska matematiska formler som drivs av djupa neurala nätverk. Man anger ett ingångsvärde och får ett utgångsvärde. Men kostnaden för att utföra den matematiska beräkningen är mycket hög jämfört med att bara göra normala saker som vi kunde göra för 50 år sedan.
Kostnadsaspekten är därför superviktig. Vi kan inte bara ersätta all gammal IT och använda artificiell intelligens och generativ AI för allt eftersom det är ungefär en miljard gånger dyrare.
Jag har en smartphone här med mer datorkraft och mer kontroll över informationstekniken än alla superdatorer hade på 1990-talet. Stora språkmodeller och generativa AI som förstår språk är möjliga eftersom vi har så mycket mer datorkraft jämfört med tidigare – det gör det dock inte billigt, bara möjligt. Alla företag som använder den här tekniken måste göra en kostnads- och intäktsanalys. När ska vi använda dessa nya, dyra tekniker, i stället för billigare, mer mekaniska och traditionella IT-tekniker?
Related Articles
Sorry, we couldn't find any posts. Please try a different search.