Ville Somppi, M-Files , tekoälystä, tietotyöskentelystä ja strukturoidusta vs. strukturoimattomasta datasta.
Tekoäly (AI) muuttaa tietotyötä joka päivä jokaisen uuden innovaation kehittyessä. yhä nopeammin ja nopeammin. Istuimme alas Ville Somppi, Vice President of Industry Solutions M-Files, keskustelemaan näistä muutoksista, mitä ne merkitsevät tietotyöntekijöiden tulevaisuudelle ja siitä, auttaako tekoäly organisaatioita kuromaan umpeen kuilua strukturoidun ja jäsentymättömän datan välillä (tai miten).
Tekoäly ja työn tulevaisuus
Jotkut yritysjohtajat ennustavat, että tekoäly poistaa työn kokonaan. Millaisena näet tekoälyn vaikutuksen työn tulevaisuuteen?
Tekoäly itse asiassa tukee ihmisen kekseliäisyyttä ja luovuutta. Tietokoneet tekevät sitä, mitä pyydetään. Jos tiedät oikean kysymyksen, tekoäly tietää vastauksen. Generatiivisen tekoälyn tapauksessa tulos on luultavasti puoliksi tai jopa 90-prosenttisesti valmis, jos sinulla on käsitys siitä, mitä haluat tuottaa. Tekoäly voimaannuttaa työntekijöitä edistämällä uusia mahdollisuuksia tietotyön automatisointiin.
Tekoäly ei tiedä sattumanvaraisesti, mitä luoda - on oltava ihminen, älykäs toimija, joka pyytää sitä tekemään jotakin ja sitten vahvistaa, että tuotettu sisältö on pyydetyn mukainen. Luovan työn hidas vaihe, jossa on todella tuotettava alkuperäiseen ideaan perustuvia hyödykkeitä, nopeutuu, mutta tekoäly ei korvaa tietotyöntekijöiden tarvetta toteuttaa visio ja käyttää luovuuttaan vision toteuttamiseen.
Matka kohti tietotyön automatisointia
Kun puhuttiin työsuorituksen optimoinnista, kyse oli yleensä tiedostojen hallinnasta ja prosessien hallinnasta, jotka vievät meidät automaation seuraavaan vaiheeseen. Onko tämä kehitys seurausta paremmasta kaistanleveydestä ja prosessointinopeudesta, ja oliko tämä aina unelma vai onko tämä muutos?
Tämä on aina ollut unelmani, mutta se on ollut hyvin hidas prosessi. Tietotekniikan historia kattaa vain 50 tai 60 vuotta. Ensimmäiset tietokoneet pystyivät hädin tuskin tallentamaan tietoja. Lopulta markkinoille tulivat graafiset käyttöliittymät, ja löysimme keinoja visualisoida tietoa näytöllä - ei vain paperille tulostettuna. Graafisen käyttöliittymän ansiosta ei tarvinnut olla tiedemies ymmärtääkseen, mitä tietokone tekee, mutta tärkeät tehtävät, kuten asiakirjojen hallinta ja työnkulkujen hallinta, olivat edelleen täysin manuaalisia.
Visiona on aina ollut tietotyön automatisointi ja innovointi, jolla helpotetaan kaikenlaista työtä ja parannetaan tuottavuutta. Tietokoneen pyytäminen luomaan jotakin vaatii vain puhuttua tai kirjoitettua kieltä. Vuosikymmeniä sitten tietokoneet pystyivät tekemään todella hienoja ja tehokkaita laskelmia tai simulaatioita, joiden avulla voitiin suunnitella jotain niinkin monimutkaista kuin avaruuslento toiseen galaksiin. Huomenna voit sanoa: "Hei, ChatGPT, voisitko suunnitella minulle avaruusaluksen tämän esimerkin perusteella?". Sen sijaan, että käyttäisit tuhansia tunteja hiiren ja näppäimistön avulla 3D-luonnoksen piirtämiseen, pääset paljon nopeammin käyttökelpoiseen luonnossuunnitelmaan, jota voit tarkentaa. Kaikkea ei tarvitse selittää kirjaimellisesti - se on vallankumous.
Strukturoitu vs. strukturoimaton data
Niin monet nykyisistä järjestelmistämme - tiedostojen hallinnasta liiketoimintaprosesseihin - ovat kaikki strukturoidusta datasta kuten Word- tai PowerPoint-tiedostoja. Mutta twiitit ovat oikeudellisesti löydettävissä oikeudessa, ja ne lasketaan strukturoimattomiksi tiedoiksi. Kun kyse on tietotyöskentelystä, onko strukturoidun ja strukturoimattoman datan välillä todella eroa vai onko se vain hämärtynyt täysin?
Perinteisesti tietokoneet tarvitsevat rakennetta ymmärtääkseen dataa. Oletetaan, että yrityksesi nimi on pelkkää tekstiä. Strukturoitu järjestelmä, kuten asiakassuhteiden hallintatyökalu (CRM), voi lukea yrityksesi nimeä vastaavan tunnistenumeron, jolloin se välittää vain tunnisteesta ja tietää aina, mikä tunnistenumero edustaa yritystäsi. Kun kyseessä on ihmisen kirjoittama strukturoimaton tieto, jolla ei ole selkeästi määriteltyä merkitystä, tietokone ei ymmärrä sitä - se on vain tekstiä.
Suurissa kielimalleissa rakenne ei ole niin tärkeä, koska tietokoneet voivat käsitellä jäsentymätöntä dataa tehokkaammin poimimalla siitä merkityksen ja kaikki kiinnostavat tietopisteet. Sanotaan, että sopimus on voimassa vuonna 2024. Jos otamme tuon ajanjakson rakenteisena datana, tietokone tietää, milloin sopimus on voimassa. Generatiivisen tekoälyn ja sen päättelymoottorin avulla voit kysyä, mitä jokin strukturoimattoman aineiston kohta tarkoittaa, ja tekoäly ymmärtää sen, koska se osaa lukea ja tulkita strukturoimatonta sisältöä.
Strukturoitujen ja strukturoimattomien tietojen välillä on ero. Toinen on tarkoitettu tietokoneiden luettavaksi ja ymmärrettäväksi, ja toinen on vapaasti liikkuvaa - tietokoneiden on ollut vaikea ymmärtää sitä tähän asti. Nykyään ei ole enää niin tärkeää, että kaikki on strukturoitua dataa, mutta strukturoitu data on edelleen se, miten tietokoneet keskustelevat keskenään. Lausetta "varttia yli puolenpäivän" ei voi oikeastaan laskea, koska tietokone näkee oletusarvoisesti vain tekstiä. Suuri kielimalli voi muuntaa ihmisen ilmaisun tietokoneen ymmärtämäksi jäsennellyksi dataksi, jolloin normaalit laskutoimitukset ovat mahdollisia.
Tiedollisen tarkoituksen merkitys
Miksi tietokoneiden on helpompi käyttää strukturoitua tietoa ja miten M-Files käsittelee strukturoimatonta tietoa?
Strukturoidussa datassa ei ole vain datan arvo, vaan myös merkitys, tyyppi ja tiedollinen tarkoitus. Yksi tyyppi on esimerkiksi yrityksen nimi. Jokainen järjestelmä, joka käyttää kyseistä datapistettä, tietää, että nimitys viittaa yrityksen nimeen sekä tietotyyppiin. Strukturoidut tiedot voivat auttaa järjestelmää erottamaan tekstikentän ja numerokentän toisistaan. Ja mitä numero tarkoittaa numerokentässä? Onko se rahamäärä vai postinumero? Strukturoitujen tietojen avulla tietokonejärjestelmät tietävät, mitä tarkoitat millä tahansa tietyllä tiedolla.
Jos lataat sopimuksen osoitteeseen M-Files, se on vain asiakirja. Se on jäsentymätön ja ihmisen luoma, mutta voimme poimia siitä mielenkiintoisia tietoja, kuten jäsenneltyä metatietoa. Koska M-Files voi merkitä asiakirjoihin metatietoja, kuten sopimuksen voimassaolon, voimme muuttaa osan tästä jäsentymättömästä datasta jäsennellyksi dataksi, jotta tietokoneet voivat käsitellä sitä ja soveltaa liiketoimintasääntöjä ja antaa mahdollisuuksia kaikenlaiseen tietotyön automatisointiin.
Generatiivinen tekoäly maksaa pääomaa
Vaikuttaako datan muoto generatiivisen tekoälyn käyttökustannuksiin? Onko strukturoimaton data kalliimpaa käsitellä, ja ovatko uudet kielimallit muuttaneet tätä?
Generatiivisen tekoälyn käyttö voi olla kallista, koska tietokoneen on tehtävä paljon prosessointia ymmärtääkseen sisällön, seuloakseen olemassa olevan organisatorisen kaaoksen tai löytääkseen tietyn voimassa olevan sopimuskauden, toisin kuin jos joku vain lukisi nämä tiedot metatiedoista. Jos teet tämän miljoona kertaa, maksat luultavasti 50 000 dollaria sille yritykselle, joka tarjoaa generatiivisen tekoälypalvelun, koska heidän tekoälynsä tekee niin paljon kovaa työtä.
Voit kuitenkin tehdä sen ikuisesti rakenteisen datan kentästä ja edullisesti, koska se on triviaalia. Suuret kielimallit ovat vain jättimäisiä matemaattisia kaavoja, jotka toimivat syvien neuroverkkojen avulla. Syötät syöttöarvon, ja tulostusarvo tulee ulos. Mutta tuon matemaattisen operaation suorittaminen maksaa paljon verrattuna siihen, että voisimme tehdä tavallisia asioita 50 vuotta sitten.
Ajatus-kustannus -elementti on erittäin tärkeä. Emme voi vain korvata kaikkea vanhaa tietotekniikkaa ja käyttää tekoälyä ja generatiivista tekoälyä kaikkeen, koska se on noin miljardi kertaa kalliimpaa.
Minulla on tässä älypuhelin, jolla on enemmän laskentatehoa ja enemmän tietotekniikan hallintaa kuin kaikilla supertietokoneilla oli 1990-luvulla. Suuret kielimallit ja kieltä ymmärtävät generatiiviset tekoälyt ovat mahdollisia, koska meillä on niin paljon enemmän laskentatehoa kuin ennen - se ei tee siitä halpaa, se on vain mahdollista. Kaikkien näitä teknologioita soveltavien yritysten on tehtävä kustannus-hyötyanalyysi. Milloin meidän pitäisi käyttää näitä hienoja, uusia ja kalliita teknologioita ja milloin halvempia, mekaanisempia ja perinteisempiä tietotekniikkateknologioita?