Dok računala s lakoćom rješavaju kompleksne matematičke operacije, vizualna percepcija im predstavlja popriličan izazov. Računalni vid, područje računarstva inspirirano ljudskim vizualnim sustavom, nastoji računalima prenijeti instinkte koji su nama ljudima urođeni — dohvaćanje podataka iz okoline, njihovo obrađivanje i prevođenje u korisne informacije. Drugim riječima, cilj je omogućiti računalima da „vide“.
Ranije su se značajke izlučene iz slika morale određivati ručno, što je ograničavalo broj stvari koje je računalo moglo otkriti. Duboke neuronske mreže s vremenom su se pokazale kao bolji pristup zbog svoje prilagodljivosti i skalabilnosti. Neuronske mreže čini velik broj međusobno povezanih procesnih jedinica — neurona. Svaki neuron analizira pojedini segment slike i njegove karakteristike kao što je boja, tekstura, rubovi, i sl. kako bi se pronašli poznati uzorci. Što više podataka mreža obradi, to su rezultati bolji i precizniji. Zato je svaku mrežu na početku potrebno trenirati skupovima podataka koji sadrže tisuće, a često i milijune, slika. Kao i naš mozak, neuronska mreža „uči“ na prošlim iskustvima kako bi zatim osigurala što točnije rezultate.
U Visage Technologies fokusirani smo na dvije specifične primjene računalnog vida — ljudska lica i autonomnu vožnju. U skladu s time, firma je podijeljena na dvije specijalizirane divizije.
Prva divizija bavi se praćenjem, analizom i prepoznavanjem ljudskih lica. Naš glavni proizvod, visage|SDK, omogućava računalima da čine ono što mi ljudi svakodnevno radimo bez razmišljanja — detektira lica, prepoznaje osobe, procjenjuje njihovu dob i spol, te analizira trenutno raspoloženje. Naša tehnologija može se primijeniti u gotovo svim industrijama — od jednostavnih filtera za lice (kao što je Snapchat) do složenih biometričkih sustava. Cilj je većinom isti — olakšati ili automatizirati određene zadatke. Tako, na primjer, osobe s tjelesnim oštećenjima mogu upravljati računalom pomicanjem očiju, vozače se upozorava ukoliko je na njihovom licu detektiran umor, čekanje u redovima se eliminira automatskim prepoznavanjem lica, virtualno isprobavanje proizvoda (kao što su šminka, nakit, naočale i sl.) olakšava kupovinu, i tako dalje.
U drugoj diviziji firme razvijamo sustav za analizu slike iz frontalnih kamera u automobilima. On prepoznaje i prati objekte kao što su prometni znakovi, druga vozila, semafori, pješaci itd. Osim toga, estimira i stanje u stvarnom svijetu, odnosno udaljenost, poziciju, orijentaciju, brzinu, te ubrzanje detektiranih objekata. Automatsko sigurnosno kočenje samo je jedna od primjena, no sustav služi i za adaptivno upravljanje tempomatom, upozoravanje o napuštanju prometne trake, detekciju ruba ceste, ali i kao sastavni dio multisenzornog rješenja za autonomnu vožnju. Ukratko, računalni vid omogućava vozilu da „prepozna“ što se dešava u prometu i pomogne vozaču prilagoditi vožnju konkretnim uvjetima kako bi što sigurnije stigao na svoju destinaciju.
Iako koncept računalnog vida postoji od 60ih godina, još nismo dosegli njegov pun potencijal. Zato kontinuirano razvijamo svoju tehnologiju, a posebnu pažnju pridajemo istraživanju i edukaciji. Samo u zadnjih godinu dana posjetili smo dvadesetak ljetnih škola i konferencija, a možemo se pohvaliti i brojnim znanstvenim istraživanjima. Naš je cilj razviti algoritme računalnog vida koji će prikupljati sve relevantne informacije bez greške i time osigurati što bolju interakciju između stvarnog i digitalnog svijeta.
Valentina Žeželj
valentina.zezelj@visagetechnologies.com
Leave a Reply
You must belogged in to post a comment.