Inspiriran mozgovnim vizualnim korteksom, novi AI potpuno uništava CAPTCHA sigurnost

Inspiriran mozgovnim vizualnim korteksom, novi AI potpuno uništava CAPTCHA sigurnost

Računalni algoritmi imaju puno bolje prepoznavanje uzoraka, kao što su specifične životinje ili lica ljudi, omogućujući softveru da automatski kategorizira velike zbirke slika. Ali se moramo osloniti na neke stvari koje računala ne mogu učiniti dobro. Algoritmi ne mogu uskladiti svoje prepoznavanje slike s semantičkim značenjem, tako da danas možete osigurati prisutnost čovjeka tražeći od njih da odaberu slike uličnih znakova. I algoritmi ne čine posebno dobro pri prepoznavanju kada su poznate slike izobličene ili zakopane u buku, što nas je zadržalo u oslanjanju na tekstualne CAPTCHA-e, iskrivljeni tekst koji se koristi za potvrđivanje ljudskog interakcije s web-uslugama.

Ili smo se sada oslanjali na njih, barem. U današnjem izdanju Sciencea, početak zvanja Bay Area pod nazivom Vicarious AI opisuje algoritam koji je stvorio koji je u stanju uzeti minimalnu obuku i lako obraditi CAPTCHAs. Također je uspjelo prepoznavanje općeg teksta. Vicarious ‘tajna? Ona je modelirala strukturu svog AI na informacije koje smo stekli proučavajući kako vizualni korteks sisavaca obrađuje slike.

Razmišljajući vizualno

U vizualnom korteksu različite skupine neurona prepoznaju značajke kao što su rubovi i površine (i drugi prepoznaju kretnje, koje ovdje nisu stvarno relevantne). Umjesto gledanja scene ili predmeta kao zbirke ovih dijelova, neuroni počinju međusobno komunicirati, otkrivajući blizinu koje su značajke dio jednog objekta. Kako su objekti izgrađeni i priznati, scena je izgrađena hijerarhijski na temelju objekata umjesto pojedinih značajki.

Rezultat ove klasifikacije na temelju objekta jest da se slična zbirka značajki može prepoznati čak i ako su u drugoj orijentaciji ili su djelomično zasjenjena, pod uvjetom da vidljive značajke imaju iste relativne orijentacije. Zato i dalje možemo prepoznati pojedinačna slova ako su naopako, unatrag i zakopani u bučnoj pozadini. Ili, da biste koristili Vicariousov primjer, zašto još možemo reći da je stolica od leda stolica.

Da bi pokušao oponašati pristup mozga, tim je stvorio ono što zove rekurzivna kataloška mreža ili RCN. Ključni korak je prepoznavanje konture, značajke koje definiraju rubove objekta, kao i unutarnje strukture. Drugi skup agenata izvlači površinske karakteristike, kao što je glatkoća površine definirane ovim obrisima. Zbirke tih priznatih svojstava grupiraju se u bazene na temelju fizičke blizine. Ti bazeni zatim uspostavljaju veze s drugim bazenima i prosljeđuju poruke kako bi utjecali na druge značajke izbora, stvarajući grupe povezanih značajki.

Skupine srodnih značajki se hijerarhijski grade kroz sličan proces. Na vrhu tih stabala su zbirke povezanih značajki koje bi mogle biti objekti (istraživači ih nazivaju “objektnim hipotezama”). Analizirati cijelu scenu s zbirkom objekata, RCN prolazi krugove prolaza poruke. RCN stvara rezultat za svaku hipotezu i ponovno vrši najvišu ocjenu kako bi ih procijenio u svjetlu drugih hipoteza na istoj sceni, osiguravajući da svi zauzimaju susjedni 2D prostor. Jednom kada se objektna hipoteza provede kroz nekoliko rundi ovog odabira, obično se može prepoznati njegov objekt usprkos umjerenim promjenama u veličini i orijentaciji.

Visoka efikasnost

Izvanredna stvar o treningu je njezina učinkovitost. Kada su autori odlučili da se bore s reCAPTCHA-om, jednostavno su uspoređivali neke primjere sa skupom fontova dostupnih na računalu. Uspoređujući se na fontu Georgia kao razumnu procjenu, pokazali su RCN pet primjera za svaku parcijalnu rotaciju svih gornjih i malih slova. Na razini znaka, to je bilo dovoljno za preciznu prepoznavanje prepoznavanja od 94%. To je dovelo do rješavanja reCAPTCHA dvije trećine vremena. Ljudska točnost iznosi 87 posto, a sustav se smatra bezvrijednim s gledišta sigurnosti ako ga softver može upravljati s jednim postoom preciznosti.

I nije samo reCAPTCHA. Ovaj sustav je uspio sustav BotDetect sa sličnom točnošću i Yahoo i PayPal sustavima s 57 posto točnosti. Jedine razlike uključuju fontove koji se koriste i neke ručno ugađanje nekoliko parametara koji se prilagođavaju za deformacije i pozadinsku buku u različitim sustavima. Nasuprot tome, druge neuronske mreže trebale su po redoslijedu od 50.000 riješenih CAPTCHA-ja za trening u usporedbi s 260 slika pojedinačnih znakova RCN-a. Ove neuronske mreže obično će morati biti prekvalificirane ako sigurnosna služba mijenja duljinu niza ili mijenja iskrivljenje koje koristi.

Za prilagodbu RCN-a za rad s tekstom na stvarnim slikama, tim mu je pružio informacije o pojavljivanju slova i učestalosti korištenih riječi, kao io sposobnosti analize geometrije. Završio je pobijedivši model s najboljom izvedbom za oko 1,9 posto. Opet, nije ogromna margina, ali ovaj sustav je uspio s puno manje treninga – vodeći natjecatelj bio je obučen na 7,9 milijuna im

Author Description

Dominik Dragičević

Dominik Dragičević