Minutiloeng: Kuidas saab AI aidata humanitaare?
Tehisintellekti tehnoloogiad panevad tööle praktiliste kasutusvõimalustega juturobotid, kuid samas võimaldavad automatiseerida ka teadustööd. ÌìÃÀÓ°ÊÓ Ãœlikooli kultuuriandmete analüüsi teadur Andres Karjus näitlikustab värskes minutiloengus, kuidas saavad tehisarud aidata humanitaare.

Praegu on humanitaarias põnevad ajad, ning seda sellepärast, et tehisintellekti rakendusi on mitmeid. Nüüdseks on ilmselt kõik tuttavaks saanud erinevate jutu- ehk tekstirobotitega nagu ChatGPT või Copilot. Need on kasulikud kirjutamisabilised, millega saab ka tekste kokku võtta või ümber sõnastada. Humanitaarteadlastele on aga palju põnevamad suured keelemudelid (ingl. large language models), mille toel needsamad praegused juturobotid jooksevad. Tegemist on masinõppe mudelitega, millega saab väikse vaevaga automatiseerida suurel skaalal igasuguseid analüütilisi ülesandeid. Varem sai ka seda teha, juhendatud (supervised) masinõppe kaudu, aga varem pidi iga variaabli, küsimuse või hüpoteesi jaoks kohandama või treenima eraldi mudeli. See omakorda vajas suures koguses inimeste poolt märgendatud treeningandmeid. Automaatselt analüüsimine või andmete klassifitseerimine suurte keelemudelitega on oluliselt lihtsam, sest neid saab lihtsalt instrueerida – anda ette juhend (mis põhineb teadlase ekspertteadmistel), analüüsitav näide, ja nii lihtsalt iteratiivselt „küsida“ iga andmeühiku ja tunnuse kohta, kuni andmehulk on läbi analüüsitud. Nagu juba mitmetes teaduslikes artiklites on tänaseks näidatud, toimib see kohati juba päris hästi.
Seega tasub mõelda, millised on sellised ülesanded, mida varem tehti kas ise või anti tudengitele ja teadusassistentidele käsitsi tegemiseks – nüüd saab neid tõenäoliselt delegeerida ka tehisintellektile. Sel puhul peab lihtsalt olema natuke ettevaatlik: arvestama võimalike mudeli kallutatustega; vaatama, kas mudel konkreetse ülesande ja keele peal hästi toimib, ning arvestama ennustustäpsuse või veaprotsendiga saadud andmehulkade edasisel statistilisel modelleerimisel. Aga kokku võttes, põhimõtteliselt on võimalik nüüd teha suurte andmehulkadega uuringuid, mida siiani on võibolla harjutud tegema väiksemal skaalal – potentsiaal on siin arvestatav ja praegune aeg väga huvitav.