Geavanceerde AI wordt steeds onvoorspelbaarder in prestaties

De nieuwste AI-modellen van OpenAI krijgen lovende reacties, maar er is een probleem. Experts ontdekken dat deze modellen grillig zijn in hun prestaties. Ze verbreken records op sommige taken maar vallen terug op andere gebieden.
OpenAI lanceerde vorige week zijn o3 en kleinere o4-mini modellen. Het bedrijf noemde ze "de slimste modellen die we tot nu toe hebben uitgebracht". Het o3-model kreeg veel lof voor zijn redeneervermogen en zelfstandigheid bij het uitvoeren van zoekopdrachten zonder menselijke hulp.
Denkproces
"Deze modellen kunnen zoekopdrachten uitvoeren als onderdeel van hun denkproces voordat ze een antwoord geven. Dit blijkt een grote doorbraak", zegt Simon Willison, ontwikkelaar. Econoom-blogger Tyler Cowen ging nog verder: "Ik denk dat het AGI (artificiële algemene intelligentie) is, serieus. Misschien is AGI als pornografie – ik herken het als ik het zie. En ik heb het gezien."
Ondanks de indrukwekkende mogelijkheden vertoont o3 ook tekortkomingen. In een veelgebruikte nauwkeurigheidstest ontdekte OpenAI dat o3 meer dan twee keer zo vaak hallucinaties (verzonnen antwoorden) produceert als zijn voorganger. Een studie naar prestaties bij financiële analyses plaatste o3 bovenaan, maar het gaf slechts in 48,3 procent van de gevallen nauwkeurige resultaten.
Onbetrouwbaar en bovenmenselijk
"Bij sommige taken is AI onbetrouwbaar. Bij andere is het bovenmenselijk", zegt AI-analist Ethan Mollick. "De nieuwste modellen vertegenwoordigen iets kwalitatief anders dan wat er voorheen was. Hun zelfstandige eigenschappen, gecombineerd met hun ongelijke vaardigheden, creëren een echt nieuwe situatie zonder duidelijke vergelijkingen."
LAATSTE AI-NIEUWS



Download GRATIS AI-prompts die je business helpen veranderen!
Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.
Je kunt deze krachtige tools zo downloaden.
➡️ Ga naar de producten-pagina en profiteer nu!