РАЧУНАРЕ УЧИ ГОВОРУ

Srbin dr Nikola Mrkšić, koga je čuveni magazin Forbs proglasio jednim od 30 mlađih od trideset u IT svetu na koje treba obratiti pažnju, za svoju komapniju kaže: „Bićemo bolji od Amazona i Epla”.

„Nama je cilj da od PolyAI napravimo ogromnu kompaniju koja će izaći na berzu koja će biti deo vašeg svakodnevnog života. Zovete frizera, restoran, avio kompaniju, gdegod pričate sa korisničkom podrškom mi želimo da budemo deo tog razgovora”, kaže za RTS dr Nikola Mrkšić koga je magazin Forbs proglasio jednim od 30 mlađih od trideset u IT svetu na koje treba obratiti pažnju.

Pre tridesete Nikola Mrkšić uspeo je sa partnerima da sakupi 30 miliona dolara od investitora koju veruju da će njegova kompanija naučiti kompjutere da razgovaraju sa ljudima. Koliko su uspešni u tome svedoči to što ga je magazin Forbs prepoznao kao jednog od trideset mlađih od trideset godina u IT svetu čiji napredak treba pratiti. (Na ovogodišnjoj listi je i Novosađanka Marina Ivanović).

Pre toga je doktorirao na Kembridžu na koji je otišao iz Matematičke gimnazije u Beogradu, neko vreme je radio u Eplu gde je učio Siri da komunicira („bio sam jedan u timu od hiljadu” kaže skromno).

Procenivši da može bolje i više pre četiri godine u Londonu je sa dva partnera osnovao firmu PolyAI koja se bavi vokalnom komunikacijom sa mašinama. O tome govori u video razgovoru za RTS.

Nikola, da bih snimio ovaj intervju morao sam da obavim sigurno dvadesetak radnji na ovim aparatima koje koristim. Da li je Vama zamislivo da samo izgovorim kako hoću da snimim video intervju sa Nikolom Mrkšićem i da aparati sve sami pripreme. Koliko smo daleko od toga da kompjuteru usmeno naređujemo i složene radnje?

Apsolutno je moguće i to je nešto na čemu mi radimo, na čemu velike tehnološke firme rade. Možda neće biti baš u jednoj rečenici, možda će sistem da postavi potpitanje koji program za pozivanje želite da koristite ili u koje vreme, ako niste rekli na početku. Ali taj razgovor sa kompjuterom može da bude tečan i jednostavan. I da bude mnogo lakši od svih tih integracija koje sada morate da obavite.

Čime se tačno bavi vaša kompanija PolyAI?

PolyAI je firma od pedesetak ljudi sa sedištem u Londonu i kancelarijama u SAD i Singapuru. Mi pravimo konverzacione sisteme, voice assistant, ne znam kako se to kaže na srpskom, recimo govorni automat mada to zvuči kao nešto već prevaziđeno.

To su sistemi koji se javljaju na telefon kada zovete korisničku podršku, bilo da zovete telekomunikacionu firmu ili banku ili ugostiteljski objekat i pravite rezervaciju ili se žalite na uslugu. Ili imate problem sa povezivanjem na internet i treba vam pomoć. U svakom od tih scenarija naš sistem se javi i razgovara sa vama potpuno isto kao što bi i veoma dobro obučeni operater u kol centru to radio.

Kako je to moguće kada znamo da ljudi imaju akcenat, govorne mane, ne govore svi čisto da bi kompjuter to lako razlučio?

U pravu ste. U opštem slučaju ako bi vi pričali u dijalektu ili o nečem vrlo specifičnom, to nije problem koji je potpuno rešen. Ali ako razgovarate sa sistemom koji zna otprilike šta vi pokušavate da postignete, taj sistem zna šta da očekuje. Pa ako rezervišete mesto u restoranu, sledeće što ide je datum ili broj ljudi koji dolaze ili neko pitanje oko parkinga.

Samo u Britaniji ima 67 poddijalekata engleskog jezika. Kada se to pretoči u tekst to izgleda drugačije i sistemu nije baš jasno šta se traži. Ali ako istrenirate veštačku inteligenciju koja je specijalizovana da odradi upravo taj jedan zadatak ona zna šta koja reč znači u tom kontekstu.

Mi se kao ljudi dobro razumemo zato što smo celi život učili kako da se razumemo, kako da koristimo kontekst. Tako i naši sistemi imaju pristup tom kontekstu pa su u mogućnosti da uvek izvuku pravu nameru korisnika. Čak i ako ne zapišu tačno ono što treba.

Mogu li kompjuteri da razumeju moju emociju? Istu rečenicu mogu da izgovorim i ljutito i blago. Kako to kompjuter razlikuje?

To je jedan od težih problema čak i sa akademske strane. Razlučiti kada jedna rečenica ima iste reči, da li je pozitivna ili negativna, jer različiti ljudi imaju različite temperamente i govore na različite načine.

Moguće je to detektovati, ali ono što mi sada radimo što je bitniji korak u razvoju veštačke inteligencije je da znamo kada nam ne ide preterano dobro. I ako nam ne ide preterano dobro i sistem se muči mi prebacimo korisnika na radnika u kol centru, ne želimo da trošimo njegovu dobru volju.

Ipak postoji neki živ čovek koji preuzme posao od kompjutera kada stvari ne idu kako treba?

Da, i to je ideja. Naši sistemi mogu da automatizuju 80 pa i 90 odsto saobraćaja koji ide u kol centar. Ali u deset odsto slučajeva ili kada je reč o korisnicima koji pitaju neko veoma retko pitanje ili premijum korisnicima, njih čuvate za razgovor sa nekim od vaših najboljih operatera.

Ali za repetitivne razgovore možda su korisnici mogli da odu na vebsajt i nađu odgovor na to pitanje, za to ovaj sistem može da bude rešenje. Nama je ideja da sve više i više automatizujemo da bi na kraju možda došli do sto odsto automatizacije.

Nije ideja zameniti ljude, ideja je da ti kol centri koji nikada nemaju dovoljno ljudi…interesantno je da dva odsto populacije u Britaniji ili SAD radi u kol centrima i pored svog autsorsinga koji oni rade u trećim zemljama…velika je potreba za ljudskim kapitalom u tim kol centrima koji jednostavno nije tu. Tehnologija nam je potrebna jer to ono što koristimo postaje sve komplikovanije pa potreba za korisničkom podrškom raste.

Hoćete da kažete da vi nikome ne otimate posao?

Naši najuspešniji projekti do sada bili su sa firmama u kojima nije bilo dovoljno ljudi da urade neki posao. Daću vam primer. Recimo, radimo sa ugostiteljskim firmama gde su se konobari javljali na sve pozive pre nego što su naši sistemi primenjeni. I sad, pošto ljudi zovu u vreme ručka ili večere kada su konobari zauzeti i nemaju vremena da se jave, na trideset odsto poziva niko se nije javljao. Posle primene našeg sistema ljudi zovu, sistem se javi svaki put i oko osam odsto više rezervacija se ostvari kada to radi veštačka inteligencija nego kada to radi osoblje u restoranu.

Mi nikome ne oduzimamo posao nego tim konobarima dajemo šansu da svoj posao rade mnogo opuštenije jer ne moraju svako malo da trče na telefon.

Ljudi nekada umeju da se iznerviraju kada im živ čovek odgovara mehanički…

Itekako.

Šta se dešava kada shvatim da razgovaram sa mašinom? Reaguju li ljudi negativno?

Mi na početku razgovara kažemo „ja sam digitalni agent, kako mogu da vam pomognem”. Mada to kažemo vrlo brzo da ne bismo skretali previše pažnju na to. Vrlo je zanimljivo da kada ljudi nešto kažu i vide da su dobili odgovor kao što bi ga dobili od čoveka, brzo, efikasno i bez čekanja, onda se gradi to poverenje. Ako sve ide kako treba ljudi rado vode taj razgovor.

Ima ljudi koji kažu, ah mašina, neću da pričam sa mašinom, operator, operator, operator! U tom slučaju mi ih prebacimo, nema smisla siliti ih.

Ali to je između 4 i 5 odsto ljudi. Ostali rado pričaju sa digitalnim agentom, a mi ako osetimo da razgovor ne ide kako treba i da nemamo odgovor kažemo kako nemamo odgovor na to pitanje i da ćemo ih prebaciti na nekog od ljudskih kolega.

Treba li da budemo ljubazni sa vašim mašinama, robotima ili možemo da budemo i grubi prema njima? Kako će reagovati ako sam ja besan?

Verovatno će raditi malo slabije jer uglavnom pričaju sa ljudima koji koriste blaži ton. Zanimljivo je i da što duže rečenice koristite, mašina bolje radi. Tako je tehnologija podešena, što više signala dobije od vas bolje će da vas razume.

Mnogi ljudi misle da treba pričati kratkim rečenicama. Troje ljudi. Sutra. Dva popodne. A mnogo bolje je reči „pa mislili smo da dođemo sutra u dva popodne”. Jedan prijatan razgovor je najbolji način da dođete do uspešnog kraja razgovora sa mašinom.

Ali ona nema osećanja. Ako želite da je psujete pri svakom koraku, možete to da radite.

Neće se naljutiti i reći „ja sam programirana da sa ljudima koji su grubi ne razgovaram”?

Za sada ne. U budućnosti, možda. U svakom slučaju mi bi vaše psovanje razumeli kao neprijatnost i znak da ne uživate u razgovoru i prebacili bismo vas ljudskom operateru.

Zar nije logičnije da će mašina lakše da me smiri jer kod ljudskog operatera mogu da izazovem negativnu emociju, a mašini to ne može da se desi?

To je tačno. Ali ja sam puno vremena proveo po kol centrima širom Britanije i neverovatno je koliko su to prijatni i dobri ljudi. A danonoćno ih zovu i viču na njih kao da su oni krivi za problem zbog koga se javljaju.

Kakva je reakcija tih ljudi kada im kažete, ovo što vi radite može da radi mašina koju ja pravim?

Kada operaterima koji su na višem nivou i obučavaju niže rangirane operatere kažete da postoji neki interfejs kojem možete da kažete da se promenio odgovor na neko pitanje njima to deluje kao udobniji način da rade svoj posao. Što se tiče agenata koji su novi u poslu, mislim da je svima interesantno. Očigledno je da se to neće desiti preko noći. Ali tehnologija je uvek eliminisala one najjednostavnije poslove.

Postoji rizik da ovo može negativno uticati na tržište rada, ali…

Šta je krajnji cilj vašeg rada, u šta biste da se PolyAI razvije?

Vidite, ja sam radio za Epl. Projekat Siri ima dve hiljade ljudi. Amazonov Aleksa ima 14 hiljada ljudi i dalje raste. To su komplikovani sistemi koji u odnosu na uloženi novac nisu postigli neki rezultat. Nama je cilj da napravimo sisteme koji će stvarno dodati neku vrednost. Koji će poboljšati iskustvo i onog ko zove i onog ko treba na poziv da se javi.

Cilj je da napravimo što više dobrih iskustava i da dokažemo da ova tehnologija ima budućnost. Za sada nam ide jako dobro. Imamo puno klijenata kojima smo pomogli da povećaju prihode, da smanje troškove. Cilj nam je da validiramo ovu tehnologiju.

Smeli biste da kažete da vam je cilj da budete veći od Alekse i Siri?

Da. Da. S tim da mi naš proizvod prodajemo velikim firmama, a oni prodaju konzumentima. Tako da nam oni nisu konkurencija, ne takmičimo se sa njima.

Sve te pare koje je Džef Bezos upumpao u Aleksu su za nas jako dobre zato što su podigle nivo interesovanja za ono što mi radimo, zato što su tim firmama koje kupuju našu tehnologiju rekle da ta budućnost dolazi i da su navike potrošača promenjene. Svaka druga kuća u Americi sada ima Aleksu ili Guglov houm uređaj.

Navike se menjaju. Deca odrastaju razgovarajući sa tehnologijom. Budućnost je tu iza ćoška.

Je li to dobro ili loše što neko odrasta razgovarajući s tehnologijom? Takođe, jeste li i vi razmišljali da ipak uđete u to tržište, da zagrabite nešto i od konzumentske tehnologije?

Kada pravite startap jako je važno da budete fokusirani. Mi smo B2B kompanija, prodajemo tehnologiju drugim firmama. Kada radite za konzumente onda su vam ponuda i distribucija drugačiji. Za sada ne. Veoma smo skoncentrisani da velikim firmama pomognemo u ovome, a ako budemo jako uspešni i privučemo još više kapitala i izgradimo poziciju na tržištu, videćemo.

Je li Vam opterećenje taj kapital, ako sam dobro razumeo 12 miliona dolara? Neko ima očekivanja…

Do sada smo digli blizu 30 miliona dolara finansiranja. I to od nekih vrlo ozbiljnih američkih i britanskih venture kapital firmi. To jeste jedno očekivanje i pritisak, ali je za nas bilo isključivo pozitivno. Nemate više to opterećenje da li ova firma treba da ima prihode koji rastu, šta da uzmem sebi, šta da dam zaposlenima, koliko da uložim u rast, a koliko u nešto drugo.

Kada dignete tako puno novca i uložite u taj rast, onda vam ambicija postane krajnje megalomanska i idete na to da napravite najbolju moguću i najuspešniju firmu. To je za mene do sada bilo jedno neverovatno iskustvo koje bih svakome preporučio.

Malopre nisam dobio savršen odgovor na moje pitanje, možda bih se bolje razumeo s robotom…

Možda.

Pitanje je bilo koja bi to bila vaša megalomanska ambicija, ako je imate a smete da je podelite?

Nama je cilj da od ove kompanije napravimo ogromnu kompaniju koja će izaći na berzu koja će biti deo vašeg svakodnevnog života. Zovete frizera, restoran, avio kompaniju, gde god pričate sa korisničkom podrškom mi želimo da budemo deo tog razgovora. Da nemate tu svakodnevnu frustraciju sa kompjuterom. I da oslobodimo ljudski kapital koji je trenutno zarobljen u tim kol centrima.

Malopre sam se našalio oko onog razgovora sa robotom, ali sada se ne šalim. Da li bi bilo moguće napraviti robota koji bi bio Nikola Mrkšić. Koji bi odgovarao na pitanja u ovom intervjuu sa velikom verovatnoćom da će reći ono što Vi mislite?

Apsolutno. Ako ste zainteresovani, u polušali smo moj drug Ivan i ja napravili sistem u kojem ja pričam na srpskom, a njegov glas smo sintetizovali, mogu da vam pustim deo razgovora.

Dakle moguće je da razgovaram sa robotom i da mi on da dosta dobar intervju?

Naravno.

To nije slučaj u ovom razgovoru?

Nije, ne radi nam taj video deo, a i ne izgledam toliko impresivno. Još nismo došli do tog stadijuma.

Otkud Vi u ovoj priči, uopšte u priči sa kompjuterima, a onda i u ovom vokalno instrumentalnom sastavu?

Završio sam Matematičku gimnaziju u Beogradu, dobio stipendiju za Kembridž, otišao tamo. Svašta me je zanimalo, umalo da odem u investiciono bankarstvo u jednom trenutku. Ali bukvalno dve nedelje pre nego što bih to uradio upoznao sam jednu grupu ljudi koji su pravili našu prethodnu firmu VocalIQ. Oni su bili osnivači te firme i pokazali su mi par ovih sistema i bio sam frapiran koliko je to bilo futuristički.

Odmah sam im rekao da idem s njima u tu priču, bila je to divna grupa ljudi.

Našu firmu je na žalost ili na sreću godinu i po dana kasnije kupio Epl. Tako da sam radio za Epl Siri u Kembridžu dve godine.

U isto vreme sam doktorirao i upoznao svoje suosnivače koji su obojica Tajvanci i čudo od ljudi i zajedno smo radili na tehnologijama koje su bile potpuno nova oblast, duboko učenje, primena neuronskih mreža za razumevanje ljudi i planiranje razgovora, sintezu govora. Pošto smo sva trojica radili na razvoju tih sistema znali smo da imamo ozbiljnu tehnologiju koju nema niko drugi. U tom trenutku smo odlučili, okej, to je to, pravimo firmu, dižemo investicije, ceo tim sa Kembridža prebacujemo u firmu i rastemo.

Nakon dve godine imali smo prve klijente iz ugostiteljstva, onda smo dobili neke banke kao klijente, pa telekomunikacione firme, firme koje rade dostavu. Kazino nam je najnoviji klijent. To je postala ozbiljna priča sada.

PolyAI tim iz 2019.

Ovako kako ste ispričali zvuči kao da je bilo bez problema, sve je teklo glatko.

Pa, jeste.

Ne znam šta bi rekli drugi startaperi, da li se kod vas možda našao jedan broj izuzetnih ljudi kojima je sve išlo?

Naravno da imamo neverovatan tim bez kog nikada ne bi do ovde stigli. Mogu da jadikujem, pa da kažem da sve to zahteva danonoćni rad, mnogo odricanja, truda, panike, sve je to deo toga. Ali ako ste spremni da se iscimate oko toga, iskustvo je neverovatno. Ja sa trideset godina sam video toliko stvari u prodaji i u razvoju proizvoda i programiranju, dizanju novca. Sve je to neverovatno iskustvo.

I mnogo, mnogo sreće.

Radite li i na srpskom jeziku?

Radimo sve jezike, firma se zove PolyAI zato što je poliglota, polymath, dakle radi preko različitih aplikacija.

Pitam jer ste upotrebili izraz iscimati se. Da li bi mašina razumela nekoga ko kaže da neće da se cima jer ne bi da se smori. Ja ne razumem kada mi mlađi ljudi kažu takve stvari, a tek robot kako to shvata?

Ono što je interesantno u tim najnovijim tehnologijama je da one u stvarima koje se zovu pretrening čitaju mnogo teksta. Tako radi naš model. Kada radimo port jezika za srpski mi uzmemo sve materijale sa srpskog sa interneta gde se koristi dosta tih kolokvijalnih izraza. I pošto ih koriste to znači da će ih razumeti kada ih susretnu u razgovoru.

Koji biste savet dali nekom učeniku Matematički gimnazije u koju ste išli, šta treba da radi ako želi da bude dobar kao Nikola Mrkšić?

Ne znam koliko sam dobar…

Za sada ste dobri 30 miliona dolara koliko vam je neko poverio za posao.

Pred učenike Matematičke gimnazije se stavlja mnogo očekivanja, to je veoma, veoma takmičarska sredina. Mislim da treba da stanu na sekund, pogledaju šta njih stvarno zanima i da umesto da se, možda, fokusiraju na plasman na neko od međunarodnih takmičenja što je tamo Sveti gral i što sam i ja radio, ne preterano uspešno, mislim da je bitno da se malo stane i razmisli šta to želi da se radi i da se onda dugoročno isplaniraju koraci kako da se tamo stigne.

Pomenuo bih Petnicu kao instituciju koja pomaže ljudima da izbiju malo iz tog kalupa oštro takmičarskog i da malo prošire vidike.

Srbija ima u odnosu na veličinu neproporcionalno dobre košarkaše i tenisere, a često kažemo i da ima mnogo IT stručnjaka. Slažete li se sa time? Da li je Srbija talentovanija ili manje talentovana od drugih, recimo kad gledate koga biste zaposlili?

Mislim da smo tehnički veoma nadareni, ali ne mislim da odudaramo od okruženja. Cela istočna Evropa potencira tu rusku školu matematike gde je obrazovanje jako dobro. Tako da tehnički jesmo vrlo jaki.

Naš temperament ume da bude problem kad već pitate o zapošljavanju. Prgavi smo, temperamentni, malo dinaroidni i to ume da bude problem u komunikaciji.

Na nižem nivou, ulaznica vam je da ste IT stručnjak. Ali na višem nivou, da biste postali menadžer i napredovali u karijeri jako je bitno da ste dobar komunikator i da vam je engleski perfektan.

Mi često verujemo da ako smo tehnički superiorni sve će nam služiti na tacni, a nije tako. Pa se naši ljudi iznenade kada to ne bude tako na Zapadu.

A šta biste savetovali nekog startaperu u Srbiji?

Mislim da u Srbiji ima puno dobrih IT kompanija, taj sektor je uspešan i dobar. Nisam ja tu pozvan da dajem bitne savete, ti ljudi rade u težim uslovima nego ja ovde. Te su kompanije stvorene u teškim uslovima, nemaju pristup enormnoj količini kapitala koji investicione firme investiraju ovde ili u Americi gde ima još više para.

Nije zgoreg kada se radi prodaja da odmah budu ambiciozni. Izraelci su dobar primer s ove strane okeana. Sales office, čim imate malo kapitala, pravite u Americi jer to je jedino tržište na kome se prave enormno velike firme.

Možete da imate najbolji proizvod na svetu, kupiće vas pet godina kasnije daleko manje tehnički sposoban američki kompetitor, takmac, koji će rasti brže jer ima bolje tržište.

Ne treba to odlagati i fokusirati sa na domaće tržište. Razvijajte proizvod u Srbiji, ljudi su sjajni, ali prodaja mora da bude u Americi da bi se napravile globalno bitne firme.

Jeste li razmišljali o otvaranju ogranka u Srbiji?

Voleo bih to da uradim i voleo bih da provodim više vremena u Srbiji. Nadam se da će me život za još jednu deceniju vratiti u Srbiju. Za sada je firma prilično koncentrisana ovde.

Ako bih pozvao vašu firmu telefonom ko bi mi se javio, sekretarica ili robot?

Mi smo nova firma da i nemamo neki određeni broj na koji treba da nas zovete.

Mislio sam da pitam da li to što pravite koristite i za sebe?

Naš osnovni kriterijum za svakog klijenta je da ima pola miliona poziva. Na žalost još nemam pola miliona klijenata koji me zovu godišnje, ali čim budem imao i tu će se naći PolyAI.

Šta vam znači to što ste na Forbsovoj listi 30 ispod 30 u IT-ju?

Ništa posebno.

Je li bilo više poziva nego inače, dobro, možda ne baš pola miliona?

Jeste, bilo je više interesovanja, ali ne razmišljam o tome.

(Izvor RTS)