
Mašine prestižu ljude: Veštačka inteligencija nadmašila čoveka u tehničkim zadacima
Razlika između ljudskog i mašinskog rezonovanja se smanjuje… i to brzo.
Tokom protekle godine, sistemi veštačke inteligencije doživeli su ogroman napredak, prevazilazeći ljudske performanse u tehničkim zadacima u kojima su ranije zaostajali — poput napredne matematike i vizuelnog rezonovanja.
Najnovija epizoda podkasta Mario Zna 1. maj u 20h | Zabranjena istina: Čovek koji je srušio zapadnu propagandu | Gost: Aron Palasios
Na sledećem grafikonu, koji je izradila Kajla Žu za Visual Capitalist, prikazana je efikasnost AI sistema u odnosu na ljudske standarde na osam različitih AI testova, koji obuhvataju sledeće zadatke:
- Klasifikacija slika
- Vizuelno rezonovanje
- Razumevanje čitanja srednjeg nivoa
- Razumevanje engleskog jezika
- Više – jezičko razumevanje
- Takmičarska matematika
- Naučna pitanja na nivou doktora nauka
- Multimodalno razumevanje i rezonovanje
Šta je AI test?
To je standardizovani zadatak koji se koristi za procenu sposobnosti AI sistema u rešavanju određenih problema.
AI Sistemi Prelaze Ljudski Prag u Tehničkim Zadacima
U nastavku je prikazan razvoj performansi AI modela u odnosu na ljudski prag (100%) u različitim tehničkim oblastima tokom godina:
Godina Performanse u odnosu na ljudski prag Zadaci
2012 89,15% Klasifikacija slika
2013 91,42% Klasifikacija slika
2014 96,94% Klasifikacija slika
2015 99,47% Klasifikacija slika
2016 100,74% Klasifikacija slika
2016 80,09% Vizuelno rezonovanje
2017 101,37% Klasifikacija slika
2017 82,35% Razumevanje čitanja (srednji nivo)
2017 86,49% Vizuelno rezonovanje
2018 102,85% Klasifikacija slika
2018 96,23% Razumevanje čitanja (srednji nivo)
2018 86,70% Vizuelno rezonovanje
2019 103,75% Klasifikacija slika
2019 36,08% Više – jezičko razumevanje
2019 103,27% Razumevanje čitanja
2019 94,21% Razumevanje engleskog
2019 90,67% Vizuelno rezonovanje
2020 104,11% Klasifikacija slika
2020 60,02% Višezadaćno jezičko razumevanje
2020 103,92% Razumevanje čitanja
2020 99,44% Razumevanje engleskog
2020 91,38% Vizuelno rezonovanje
2021 104,34% Klasifikacija slika
2021 7,67% Takmičarska matematika
2021 66,82% Više – jezičko razumevanje
2021 104,15% Razumevanje čitanja
2021 101,56% Razumevanje engleskog
2021 102,48% Vizuelno rezonovanje
2022 103,98% Klasifikacija slika
2022 57,56% Takmičarska matematika
2022 83,74% Više – jezičko razumevanje
2022 101,67% Razumevanje engleskog
2022 104,36% Vizuelno rezonovanje
2023 47,78% Naučna pitanja doktorskog nivoa
2023 93,67% Takmičarska matematika
2023 96,21% Više – jezičko razumevanje
2023 71,91% Multimodalno rezonovanje
2024 108,00% Naučna pitanja doktorskog nivoa
2024 108,78% Takmičarska matematika
2024 102,78% Više – jezičko razumevanje
2024 94,67% Multimodalno rezonovanje
2024 101,78% Razumevanje engleskog
Gde AI Još Zaostaje?
Jedina oblast u kojoj veštačka inteligencija još nije dostigla ljude jeste multimodalno razumevanje i rezonovanje — sposobnost obrade i povezivanja podataka iz više formata, poput slika, tabela i grafikona.
Ali i tu se razlika brzo smanjuje.
Na primer, OpenAI-jev o1 model je 2024. godine ostvario rezultat od 78,2% na MMMU testu, koji meri znanje na visokoškolskom nivou u više disciplina, dok je ljudski prag bio 82,6%.
To je značajan skok u poređenju sa krajem 2023. godine, kada je Google Džemini imao svega 59,4%, što dodatno pokazuje ubrzan rast sposobnosti AI sistema.