Livnjak vodi firmu koja je razvila softver koji klasificira mailove: ‘Naučili smo stroj da razumije hrvatski’

Naučili su stroj da razumije hrvatski. Točnije, razvili su umjetnu inteligenciju koja prepoznaje i razumije hrvatski jezik.

Odmah su ga upregli u korisničku podršku. Naime, ovaj napredni sustav umjetne inteligencije koriste zaposlenici korisničke podrške domaćeg telekoma A1, a osmislili su ga članovi Cognitive Computing tima, bivši studenti FER-a Josip Džaja (23), Andrea Pirša (26), Borna Bejuk (25), uz podršku iskusnih kolega Igora Raucha (46), razvojnog menadžera u A1 i Andree Domić Mrkus (37) iz korisničke službe. Cognitive Computing tim, pod vodstvom Livnjaka Borisa Gotovca, direktora IT-a A1 Hrvatska, svoj će posao opisati kao onaj “startupa unutar korporacije”.

Klasificira mailove

– Prvo s čime smo se susreli kada smo krenuli razvijati sustav jest da, iako se o strojnom učenju i umjetnoj inteligenciji puno govori, mali broj kompanija razumije i primjenjuje ovu tehnologiju. Ovi mladi ljudi su odmah s fakulteta uložili dvije godine u učenje o umjetnoj inteligenciji, a u zadnjih šest mjeseci možemo reći da napokon imamo konkretnu primjenu s odličnim rezultatima – objašnjava voditelj Boris Gotovac.

Program koje razumije hrvatski trenutno “radi” u korisničkoj službi za klasifikaciju mailova. Tim A1 ga je razvijao nekoliko mjeseci, a kako nam je objasnio najmlađi član ekipe 23-godišnji Josip, temelji se na najnovijim modelima dubokog učenja (deep learning). Svaki mail od korisnika upućen A1 podršci prođe kroz taj sustav, a on na temelju konteksta zaključuje što je problem i onda to prosljeđuje u pripadajući odjel. Olakšalo je to posao agentima podrške, dodaje Andrea iz odjela za poslovne korisnike.

Boris Gotovac
Prepoznaje padeže

– Dosad su agenti morali ručno pregledati svaki mail ne bi li zaključili želi li korisnik, primjerice, prijepis računa ili ima neku tehničku poteškoću ili nešto treće. Sada sustav sve sam preuzima i svaki odjel automatski dobiva upite koji su im namijenjeni – objašnjava.

Na pitanje koliko je u tome precizan, kažu u 95 posto slučajeva. Čovjek, usporedbe radi, pravilno procijeni problem korisnika u samo 85 posto slučajeva.

Tajna leži u tome da program uči raspoznavati kontekst mailova, čime nadilazi barijeru raspoznavanja dijakritičkih znakova, padeža i složenih jezičnih konstrukcija hrvatskog jezika, kaže Andrea Pirša, glavna razvojna inženjerka tima. Učili su ga preko starih mailova.

Morao je “progutati” više od 5000 mailova s raznim korisničkim problemima kako bi “shvatio” uzorak i mogao razumjeti što korisnici traže.

– Postoji razlika u tome kada se korisnik javi s porukom “Super ste” i “Baš ste super”. Sustav umjetne inteligencije zato koristi kontekst, redoslijed riječi u rečenici, raspoznaje učestale fraze preko kojih zaključuje što je korisnik zapravo htio reći – tumači Gotovac.

Pirša se ubacuje s puno težim primjerom koji bi i čovjek teško shvatio – “Zaključao sam mobitel” i “Zaključao mi se mobitel”.

– U prvom slučaju “zaključani mobitel” može značiti da korisniku treba PIN kojim će ga otključati, a u drugom da se radi o kvaru na uređaju. Naš sustav uči na takvim primjerima da može što bolje raspoznati o kakvom problemu se radi – ispričala nam je Pirša.

Nisu ni sanjali

Inače, mlada ekipa okupljena u A1 Cognitive computing team bavi se umjetnom inteligencijom od fakultetskih dana. Borna Bejuk tako kaže da mu je tema diplomskog rada bila iz područja primjene strojnog učenja u obradi prirodnog jezika. Zbog kompleksnosti hrvatskog jezika, u odnosu na, recimo, engleski, potrebno je uložiti puno vremena u istraživanje i prilagodbu najnovijih modela strojnog učenja, dodaje.

Igor Rauch prisjetio se kako je to izgledalo prije dvadeset godina, kada je tek počeo raditi, a kada nije bilo ni e-maila.

– Na početku je korisnička podrška bila na dva broja. U to vrijeme revolucija je bila podrška koja radi od 0 do 24. Nije bilo e-maila, a o umjetnoj inteligenciji nitko nije ni sanjao – prisjetio se Rauch.

Sljedeći korak u razvoju sustava umjetne inteligencije, stoga, bit će upravo analiza glasa. Tu pak očekuje novi niz problema. Dijalekti, komunikacijski šum, loša kvaliteta zvuka. Zasad, kažu, do pričanja sa strojem na hrvatskom malo ćemo još pričekati. 

Jutarnji.hr