• Hrvatski
  • English

Thinking Fast and Slow, but with computers

Image for post

Nobelovac Daniel Kahneman posvetio je svoj život proučavanju ljudske inteligencije. U bestseleru Thinking, Fast and Slow, koji je zasigurno već postao stvar opće kulture, Kahneman razotkriva različite pristranosti našeg uma (eng. bias) koje su svakoga tko je pročitao knjigu natjerale da se zapita jesmo li zaista inteligentni kao što mislimo. Poznatiji primjeri su tzv. confirmation biastendencija da vjerujemo informacijama koje potvrđuju naše predrasude, hindsight biastendencija da događaje iz prošlosti smatramo predvidljivijima nego što zaista jesu u trenutku kada se dogode, i Dunning-Kruger efektprema kojemu ljudi s manje znanja često precjenjuju svoje znanje dok ga ljudi s više znanja često podcjenjuju.

Proučavanje ovakvih slučajeva u kojima nas inteligencija iznevjeri dovelo je Kahnemana do teze o dva principa inteligencije. Prema Kahnemanu, ljudska inteligencija nije monolitna struktura, nego ju sačinjavaju dva sustava: refleksni i sistematični. Refleksni sustav, ili kako ga Kahneman naziva Sistem 1, zadužen je za donošenje instinktivnih odluka te funkcionira automatski, bez svjesno uloženog ljudskog truda. Na primjer, zbog Sistema 1 automatski se okrećete prema glasnim zvukovima, vrištite kad vas netko preplaši, vežete žnjirance bez razmišljanja i možete pričati sa suvozačem dok vozite po praznoj cesti. U drugu ruku, sistematični sustav aktivira se pri donošenju odluka koje zahtjevaju svjestan trud, poput parkiranja automobila u uskom prostoru, usmjeravanju pažnje prema osobi u glasnom okruženju te kompleksnih matematičkih izračuna.

Image for post
Raspoznavači uzoraka identificiraju tipične uzorke (oblike) koji definiraju različite objekt. Na primjer, prepoznaju mačke prema tipičnom obliku ušiju, očiju, njuške i repa.

Umjetna inteligencija, područje koje se bavi imitiranjem ljudske inteligencije putem računalnih procesa, sasvim se slučajno kroz svoju povijest razvila na sličan način. Od samih početaka u 60-tim godinama prošlog stoljeća, umjetna inteligencija podijeljena je na dva različita pristupa inteligenciji. Prvi pristup podudara se sa Kahnemanovim refleksivnim sustavom i temelji se na tzv. raspoznavaju uzoraka. Intuitivno gledano, raspoznavači uzoraka donose odluke tako da uspoređuju nove podatke s uzorcima koji se pojavljuju u starim podacima. Na primjer, proučavajući hrpu slika mačaka, raspoznavači uzoraka naučili bi prepoznati mačku prema tipičnom obliku tijela, ušiju, njuške i očiju. Upravo te tipične oblike nazivamo uzorkom. Pokažete li im novu sliku i pitate li ih nalazili se mačka na njoj, donijeli li odluku tako da bi pokušavali pronaći upravo te uzorke na novoj slici.

Raspoznavači uzoraka u svakom se smislu ponašaju kao Kahnemanom refleksivni sustav — sposobni su vrlo brzo donositi odluke prepoznavajući ogromne količine različitih uzoraka, no također su skloni su iznenađujućim pogreškama. Na primjer, zasigurno vam i lijeva i desna slika pande izgledaju isto; no, dodavanjem male količine “vizualne buke” lijevoj slici vrlo lako možemo zavarati UI sustav i pretvoriti pandu u gibona. Dodavanjem “buke” promijenili smo uzorak koji je umjetno-inteligentni algoritam tražio.

Drugi pristup umjetnoj inteligenciji, koji odgovara Kahnemanovom sistematičnom sustavu, temelji se na tzv. manipuliranju simbola. Simboli predstavljaju stvari i objekte, te njihove međusobne veze i interakcije, o kojima umjetno-inteligentni algoritam treba razmišljati i donositi odluke. Možda najbolja ilustracija kako točno funckioniraju umjetno-inteligentni algoritmi bazirani na manipulaciji simbola jest postupak koji smo svi mukotrpno drilali u prvom razredu osnovne škole — zbrajanje.

Brojevi koje zbrajate, recimo da su to 19 i 12, su simboli su koje manipulirate putem operacije zbrajanja. Zbrajanjem zadnje dvije znamenke, 9 i 2, stvarate dva nova simbola — 1 koju zapisujete, te 1 koju prenosite. Nakon toga, zbrajate (zapravo manipulirate) preostalim znamenkama iz početnih brojeva, 1 i 1 te 1 koju ste prenesli. Ovakav simbolički način opisivanja svijeta univerzalan je način na koji mi ljudi zapisujemo znanje i komuniciramo: simboli slova predstavljanju vokalne jedinice komunikacije; pojedinačna slova možemo manipulirati i stvoriti riječi koje predstavljenju koncepte; simbole riječi kombiniramo u rečenice kako bi im dali dublje značenje i kontekst.

Jednako kao što se raspoznavači uzoraka ponašaju kao sistem 1, tako se i manipulatori simbola ponašaju kao sistem 2: ovi algoritmi vrlo sistematično i studijski pristupaju rješavanju problema, sposobni su povezati dugačke lance činjenica no pod cijenu toga da su sporiji u donošenju odluka od raspoznavača uzoraka.

Za razliku od ljudske inteligencije gdje sistem 1 i sistem 2 funkcioniraju u timu, u umjetnoj inteligenciji još uvijek su razdvojeni. Kako ujediniti ove dvije struje trenutno jedno je od gorućih pitanja umjetne inteligencije, te jedan od problema kojima se i ja bavim. Obje struje imaju svoje prednosti i mane: raspoznavači uzoraka brzi su u donošenju odluka, mogu analizirati velike količine podataka, no mogu jedino prepoznati već viđene uzorke; manipulatori simbola mogu izvršiti vrlo komplicirane operacije, čak i u situacijama koje nisu iskusili, no predstaviti znanje i podatke na simbolički način često zahtjeva dosta rada. Razliku je najlakše vidjeti upravo na problemu zbrajanja: pokažete li raspoznavaču uzoraka kako zbrojiti 2 + 9 znat će zbrojiti 2 i 9 no ne i 22 + 29, dok manipulatori simbola neće imati tih problema.

2018. godine, zajedno s kolegama iz laba za umjetnu inteligencija sa KU Leuvena, razvio sam sustav DeepProblog koji spaja raspoznavanje uzoraka i manipulaciju simbola. Naziv DeepProblog dolazi od pojedinčnih ideja koji čine cjelinu: dubinsko učenje (eng. deep learning) kao raspoznavač uzoraka, te teoriju vjerojatnosti (eng. probability) i logičko zaključivanje kao manipulatore simbola. Cijeli sustav znatno je inspiriran načinom na koji ljudi procesuiraju svoje okruženje: raspoznavači uzoraka pretvaraju ono što vide u svom okruženju u simbole (te su izvrsni u tome), dok manipulatori simbola odlučuju što napraviti s tim simbolima (upravo ono u čemu su najbolji). Upravo ovakav način rada iskorištava prednosti oba pristupa umjetnoj inteligenciji te minimizira njihove mane.

Image for post

Ono po čemu je DeepProblog poseban, u odnosu na druge radove koji se bave istim problemom (te zapravo samo simuliraju manipulaciju simbola putem raspoznavanja uzoraka), je to što dva podsustava ne funkcioniraju odvojeno nego kao komplementarna cjelina. Dva podsustava tako pomažu jedan drugome da postanu što bolji; na primjer, manipulator simbola može lako uvidjeti grešku raspoznavača uzoraka te ga ispraviti. Na primjer, DeepProblog bi naučio zbrajati iz primjera zbroja (dodajte sliku broja 9 kao rezultat na gornjoj slici). Ukoliko raspoznavač uzoraka napravi pogrešku te prepozna broj 4 kao 3, manipulator simbola znat će da nešto ne valja jer 5 + 3 nikako ne može biti 9. U tom slučaju će informirati raspoznavača uzoraka da je napravio pogrešku u prepoznavanju druge slike te bi trebao prepoznati 4, a ne 3. Sljedeći put kad raspoznavač uzoraka vidi istu sliku, prepoznat će je kao 4. Želite li znati više, sve detalje možete pronaći u radu:
R. Manhaeve, S. Dumančić, A. Kimmig, T. Demeester, L. de Raedt: DeepProbLog: Neural Probabilistic Logic Programming. NeurIPS 2018

Sebastijan Dumančić
sebastijan.dumancic@gmail.com
Declarative Languages and Artificial Intelligence Lab
KU Leuven, Belgium

150 150 admin

Leave a Reply