Toshiba Corporation razvila je umjetnu inteligenciju s 3D prepoznavanjem koja je sposobna izmjeriti udaljenost s preciznošću stereo fotoaparata, koristeći sliku snimljenu komercijalnom kamerom i analizirajući zamućenje slike uzrokovano lećom kamere koristeći duboko učenje. Ova tehnologija eliminirat će upotrebu stereo kamera što na kraju smanjuje troškove i prostor. Toshiba će ovo postignuće predstaviti na međunarodnoj konferenciji o računalnom vidu (ICCV2019) koja će se održati u Južnoj Koreji 30. listopada 2019. od 10 sati.
Osjećanje slike postaje sve važnije, a aplikacije poput robota koji se kreću objektima, autonomna vozila bez posade, bespilotne letjelice s daljinskim upravljanjem koje pregledavaju infrastrukturu itd. Zahtijevaju više od slika subjekata, potreban im je mali uređaj za analizu 3D podataka koji uključuje oblik i udaljenost. Stoga su povećana istraživanja kako bi se razvila mjerna tehnologija s monokularnim kamerama (lako ih je minijaturizirati) korištenjem dubokog učenja za bolje učenje oblika, pozadine i drugih podataka krajolika snimljenog objekta.
Ova metoda ima nedostatak; točnost udaljenosti procjenjuje se uz pomoć monokularne kamere, ovisno o naučenim podacima krajolika što uzrokuje pad točnosti zbog snimaka snimljenih u različitim krajolicima. Da bi to prevladao, Toshiba je razvila fotografiju blende filtrirane u boji u kojoj su na objektiv pričvršćeni dva filtra u boji, a boja i veličina nastalog zamućenja slike analiziraju se prema udaljenosti od objekta. Iako ovo rješava problem ovisnosti o podacima, modifikacija postojećih leća košta vrijeme i novac.
Toshiba je prevladala ovaj problem razvijanjem AI s tehnologijom 3D prepoznavanja koja koristi duboko učenje kako bi analizirala kako se slika zamućuje u skladu s njezinim položajem na leći, kako bi se postiglo mjerenje udaljenosti s istom visokom preciznošću kao i stereo sustav kamera, s normalnom monokularnom kamerom, ali bez potrebe za podacima krajolika. Do sada se smatralo da je teoretski nemoguće izmjeriti udaljenost na temelju oblika zamućenja, koji je jednak za objekte koji imaju i udaljenost i udaljenost kada su jednako udaljeni od žarišne točke. Ali, analitički rezultati pokazali su značajnu razliku između oblika zamućenja blizu i dalje objekata, čak i ako su jednako udaljeni od žarišne točke. Uz to je Toshiba uspješno analizirala zamućenje podataka sa snimljenih slika pomoću modula za duboko učenje obučenog s modelom duboke neuronske mreže.
Kad svjetlost prolazi kroz leću, poznato je da se oblik stvorenog zamućenja mijenja ovisno o valnoj duljini svjetlosti i položaju u leći. U razvijenoj mreži položaj i boja obrađuju se odvojeno kako bi se pravilno uočile promjene oblika zamućenja, a zatim, nakon prolaska kroz ponderirani mehanizam pažnje, kontroliralo gdje se na gradijentu svjetline fokusira kako bi se pravilno izmjerilo udaljenost. Kroz učenje, mreža se zatim ažurira kako bi se smanjila pogreška između izmjerene udaljenosti i stvarne udaljenosti. Koristeći ovaj AI modul, Toshiba je potvrdila da jedna slika snimljena komercijalno dostupnom kamerom ostvaruje istu točnost mjerenja udaljenosti zajamčene stereo kamerama. Više informacija možete pronaći na ovoj službenoj stranici Toshibe.
Toshiba će potvrditi svestranost sustava komercijalno dostupnim kamerama i lećama i ubrzati obradu slike, s ciljem javne provedbe u fiskalnoj 2020. godini.
