ZOV BUDUĆNOSTI

VEĆ OPONAŠA LJUDSKI MOZAK

Visited 257 times, 1 visit(s) today

Mi smo krenuli od nule inspirisani mozgom, jer ga priroda već milijardama godina usavršava. Naš model razmišlja i zaključuje kao čovek, a ne samo da računa verovatnoće. Verujemo da će dostići, a zatim i nadmašiti ljudsku inteligenciju”, kaže Guan Vang, direktor novoosnovane singapurske kompanije Sapient Intelligen

Singapurska novoosnovana kompanija Sapient Intelligence  objavila je ambiciozan cilj – postići ono što mnogi smatraju svetim gralom veštačke inteligencije: oppštu veštačku inteligenciju (AGI) koja bi dostigla i prestigla ljudskuDa bi to ostvarili, umesto da grade sve veće jezičke modele (LLM) kakvi su GPT-4, GPT-4o, Claude 3, Gemini, LLaMA 3, DeepSeek R1 i slični, odlučili su krenuti drugim putem. Osmislili su hijerarhijski model zaključivanja (Hierachical Reasoning Model, HRM), nadahnut načinom na koji ljudski mozak obrađuje informacije. Prema studiji objavljenoj u elektronskom naučnom časopisu ArXiv, HRM sa samo 27 miliona parametara, treniran na samo hiljadu  primera, nadmašuje daleko veće modele kao što su OpenAI o3-mini, Claude 3.7 8K ili DeepSeek R1 u rešavanju složenih zadataka zaključivanja.

Kompanija nije obična početnička, okupila je bivše istraživače iz DeepMind, DeepSeek,  Anthropica i xAI, a i naučnike sa vrhunskih univerziteta. To su pojedinci koji su radili na najnaprednijim projektima veštačke inteligencije današnjice. Osnivač i direktor Guan Vang kaže da je ideja da mašine ostvare ljudsku inteligenciju, a na kraju i više.

„Chain-of-Thought,  način na koji rade današnji modeli, samo je trik za igranje s verovatnoćom. Mi smo krenuli od nule inspirisani mozgom, jer ga priroda već milijardama godina usavršava. Naš model razmišlja i zaključuje kao čovek, a ne samo da računa verovatnoće. Verujemo da će dostići, a zatim i nadmašiti ljudsku inteligenciju i da će tada rasprava o opštoj veštačkoj inteligenciji postati stvarna”, tumači Vang.

Ljudski mozak nije samo skup neurona; to je sistem podeljen u funkcionalne module. HRM pokušava oponašati dva ključna centra mozga: prefrontalni korteks i bazalne ganglije. Prefrontalni korteks nalazi se u prednjem delu i povezuje se sa apstraktnim razmišljanjem, planiranjem i kontrolom impulsa. To je područje  mozga koje omogućuje da promislimo unapred, razmotrimo posljedice i odaberemo najbolju strategiju. Kod HRM tu ulogu igra rekurentna mreža visokog nivoa koja planira sporo i apstraktno, određuje smer razmišljanja i prati globalni cilj. Drugi deo ljudskog mozga čine bazalne ganglije, skup duboko smeštenih jezgara, zaduženih za brze i automatske reakcije, za koordinaciju pokreta, a i za donošenje odluka koje se ponavljaju i izvode bez puno svesnog promišljanja.

U HRM ovu ulogu preuzima mreža niskog nivoa koja brzo i detaljno obrađuje konkretne zadatke, prilagođava akcije i donosi intuitivne odluke. Takva organizacija mu omogućuje da istovremeno kombinije brzu, intuitivnu logiku i sporo, promišljeno planiranje. Drugim rečima, u istoj strukturi paralelno rade oba načina razmišljanja.

Rezultati su impresivni. Na ARC-AGI testu, jednom od najzahtevnijih merila sposobnosti induktivne inteligencije, postigao je 40,3% tačnosti, dok GPT-4 i Claude 3.5 jedva prelaze 21%. U složenim zadacima igre „sudoku” i pronalaženju optimalnih puteva kroz lavirinte veličine 30 × 30, jedini je uspeo pronaći ispravno rešenje. U drugom slučaju radi se o kvadratnom lavirintu s 30 redaka i 30 stubaca polja (ukupno 900 čvorova/polja). Model je trebalo da pronađe najkraći put od početne do završne tačke, što je računski vrlo zahtevan problem jer broj mogućih kombinacija raste eksponencijalno s veličinom mreže. HRM snaga nije u velikoj količini znanja, nego u načinu rezonovanja.

Veliki jezički modeli (LLM) poput GPT uglavnom koriste tehniku Chain-of-Thought – lančano razmišljanje, u kojem se zadatak razbija u niz malih koraka. To može biti korisno, ali je i nepouzdano – lako se može izgubiti nit zbog čega može doći do pogreške u lancu. Rekurentna mreža, s kojom radi HRM, podrazumeva da se izlaz iz prethodnog koraka vraća natrag kao ulaz u novi, što stvara petlju i omogućuje modelu da pamti ranije stanje i da planira. Višeskalna vremenska obrada odnosi se na to da jedan deo modela radi brzo i kratkoročno, a drugi sporo i dugoročno, slično kao što mozak istovremeno upravlja brzim refleksima i sporim strateškim odlučivanjem

HRM moć nije samo u tome što pobeđuje u zagonetkama, nego i što mu ne treba puno podataka da bi bio uspešan. To otvara mogućnosti u područjima u kojima su podaci ograničeni, a preciznost presudna. Primerice, u zdravstvu bi mogao pomagati u dijagnostifikovanju retkih bolesti, gde nema miliona primera za učenje, već mali broj kliničkih slučajeva. Druga moguća primena je klimatologija. Tvorci tvrde da on u klimatskim modeliranju postiže do 97% tačnosti u sezonskim prognozama.

Konačno, prednost je i to što bi se, zahvaljujući malim zahtevima za računarskom snagom, mogao ugrađivati u robote koji rade u stvarnom vremenu, u dinamičnim i nepredvidivim okruženjima. HRM pokazuje da nije uvek potrebno graditi sve veće i sve skuplje modele da bi se postigao napredak. Umesto da sve pokušava rešiti snagom gomile podataka, singapurska kompanija je posegnula za biologijom, za samim mozgom kao rešenjem. Rezultat je sistem koji nadmašuje svoje daleko moćnije konkurente na području u kojem je ljudska inteligencija još superiorna – u apstraktnom razmišljanju i rešavanju problema

Hoće li to biti prvi pravi korak prema AGI ili tek usputna faza u istraživanju, prerano je reći. Jedno je jasno: priroda je odličan inženjer, a AI koja se gradi na primeru mozga mogao bi biti jedini put do mašina koje će jednoga dana razmišljati poput ljudi ili čak bolje.

(Indeks)

Visited 257 times, 1 visit(s) today

O autoru

administrator

Ostavite komentar