Egy rejtett helyszínen a világ legkiválóbb matematikai elméi gyűltek össze, hogy megküzdjenek az AI-val. Ám a küzdelem végül kudarccal zárult számukra.

Harminc kiemelkedő kutató, köztük néhány nemzetközi szakember, egy különleges kihívás keretében gyűlt össze: céljuk az OpenAI legújabb, rendkívül fejlett o4-mini chatbotjának teljesítményének tesztelése volt. A matematikai szakértők arra törekedtek, hogy olyan kérdéseket fogalmazzanak meg, melyek kifejezetten a mesterséges intelligencia zavarba ejtésére lettek megalkotva - számol be róla a Scientific American.

Ken Ono, a Virginiai Egyetem matematikai szakértője, lenyűgözve szemlélte, ahogy az o4-mini szinte villámgyorsan megoldotta a matematika legkomplexebb rejtélyeinek egy részét. Ono különösen hangsúlyozta, hogy a chatbot olyan mély és összetett számelméleti problémát is képes volt gyorsan megoldani, amely akár egy doktori disszertáció alapjául is szolgálhatott volna.

"Még sosem találkoztam ilyen különleges gondolkodásmóddal egyetlen modell esetében sem" - fogalmazott. "Olyan érzésem van, mintha egy igazi tudós munkálkodna itt. Egyszerre káprázatos és rémisztő."

Az o4-mini abban tér el az eddigi nyelvi modellektől, hogy speciálisan kifinomult matematikai problémák megoldására képezték ki. Speciális adathalmazokon, intenzív emberi irányítással fejlesztették, így jóval hatékonyabb lett a logikai következtetésben és a matematikai meglátásokban, mint a korábbi mesterséges intelligenciák. Az Epoch AI, egy mesterséges intelligenciák teljesítményét vizsgáló nonprofit szervezet, kezdetben 300, még nem publikált matematikai problémával tesztelte a chatbotot. Az eredmények szerint az o4-mini ezek közül mintegy húsz százalékot megoldott, ami messze túlszárnyalta a korábbi modellek teljesítményét.

A Berkeley-i rendezvény az Epoch AI innovatív kezdeményezésének egyik fontos állomása volt, ahol a kutatók új, komolyabb kihívások megalkotására kaptak ösztönzést. A résztvevők csapatokba szerveződtek, hogy versenyezzenek egymással olyan feladatok létrehozásában, amelyekkel „megbéníthatják” a mesterséges intelligenciát. Minden egyes olyan kihívásért, amelyet az o4-mini nem tudott megoldani, körülbelül 7500 dolláros jutalmat kínáltak. Annak ellenére, hogy a matematikai szakma legjobbjai vettek részt a versenyben, a chatbot eszén túljárni nem volt könnyű feladat; végül csupán tíz olyan problémát tudtak összeállítani, amelyeket az o4-mini nem tudott megoldani.

Yang Hui He, a londoni Matematikai Tudományok Intézetének kutatója szerint az o4-mini teljesítménye egy kiemelkedő posztgraduális hallgató teljesítményével vetekszik. Azonban van egy jelentős eltérés: míg egy emberi hallgatónak hetekbe vagy akár hónapokba telhet egyes feladatok megoldása, addig az o4-mini mindezt csupán percek alatt végzi el.

A találkozó végén a kutatók arról beszélgettek, hogy milyen lesz a mesterséges intelligencia szerepe a jövő matematikájában. Úgy látják, hogy a matematikusok főleg kérdéseket fognak feltenni, miközben a mesterséges intelligencia válik majd a felfedezések nélkülözhetetlen segítőjévé. Ono külön hangsúlyozta, hogy az oktatásban a kreativitás fejlesztése lesz a kulcsa annak, hogy megőrizzék a matematikai gondolkodás jelentőségét a rohamosan fejlődő mesterséges intelligencia korszakában. Ono egyben figyelmeztette kollégáit is, hogy ne becsüljék alá az új technológiákat, hiszen az olyan modellek, mint az o4-mini, már ma is felülmúlják a világ legjobb posztgraduális hallgatóinak a többségét.

London Egyesült Államok dollár Mesterséges intelligencia OpenAI Matematika Megismerés Logika Virginia Kreativitás Ken Ono Scientific American