Nieuwe redenerende AI-modellen van OpenAI maken meer fouten

De nieuwste AI-modellen van OpenAI zijn slimmer dan eerdere versies. Toch vertonen ze meer problemen met 'hallucineren'. Dit betekent dat ze vaker onjuiste informatie bedenken. Dit blijkt uit onderzoek van het bedrijf zelf.

OpenAI lanceerde onlangs de modellen o3 en o4-mini. Deze zogenaamde redenerende modellen presteren beter bij taken zoals coderen en wiskunde. Maar volgens interne tests hallucineren ze vaker dan hun voorgangers. Het model o3 gaf bij 33 procent van de vragen over personen onjuiste informatie. Dit is twee keer zo veel als bij oudere modellen.

Verkeerde antwoorden
Het model o4-mini presteerde nog slechter. Bij vragen over personen gaf dit model in 48 procent van de gevallen verkeerde antwoorden. Ook onafhankelijk onderzoek door non-profit lab Transluce bevestigt deze problemen. Sarah Schwettmann, medeoprichter van Transluce, meent dat deze foutmarge de bruikbaarheid van de modellen vermindert.

Kian Katanforoosh, directeur van opleidingsbedrijf Workera, testte het o3-model al in de praktijk. Hoewel het model volgens hem beter presteert dan concurrenten, merkte hij ook problemen op. Zo geeft o3 vaak niet-werkende links naar websites. Dit type fouten maakt AI-modellen minder betrouwbaar voor bedrijven waar nauwkeurigheid essentieel is.

Aanpakken van hallucinaties
"Het aanpakken van hallucinaties in al onze modellen is een doorlopend onderzoeksgebied. We werken voortdurend aan het verbeteren van hun nauwkeurigheid en betrouwbaarheid", zei een woordvoerder van OpenAI.

< Ouder bericht

Nieuwer bericht >

LAATSTE AI-NIEUWS

Elon Muks met microfoon in de hand spreekt een publiek toe.

Elon Musk en AI grootste risico's voor merkimago volgens wereldwijd onderzoek

20 april 2025

Bedrijven die zich verbinden aan Elon Musk of kunstmatige intelligentie verkeerd gebruiken, lopen groot gevaar. Hun merkreputatie kan ernstige schade oplopen. Dit blijkt uit een nieuw internationaal onderzoek onder meer dan honderd leiders in publieke zaken. Het onderzoek werd uitgevoerd door de Global Risk Advisory Council. Isabel Guzman leidde deze raad. Zij was hoofd van de Amerikaanse Small Business Administration (bureau voor kleine ondernemingen) tijdens de regering van Joe Biden. Polariserende bondgenoot Deelnemers aan het onderzoek waarschuwden bedrijven specifiek voor samenwerking met Elon Musk. Ze noemden hem een 'polariserende' bondgenoot van Donald Trump. Bedrijven moeten volgens hen goed nadenken voordat ze zich met hem verbinden. Kunstmatige intelligentie vormt een ander groot risico. Verkeerd gebruik van deze technologie kan het vertrouwen in een merk ernstig schaden. Bedrijven moeten daarom voorzichtig zijn met hoe ze AI inzetten in hun diensten en producten. Samenwerking zorgvuldig kiezen "Deze bevindingen tonen aan hoe belangrijk het is voor bedrijven om hun samenwerkingen zorgvuldig te kiezen", zei Guzman. "In het huidige gepolariseerde klimaat kunnen verkeerde partnerschappen en technologiekeuzes langdurige schade toebrengen aan je merkwaarde."

Een boze AI-agent tegen een donkere achtergrond waar blauwe lichtflitsen doorheen schieten.

AI-agenten veranderen bedrijven en klanten voorgoed, toont nieuw onderzoek

20 april 2025

AI-agenten nemen steeds meer taken van mensen over. Ze regelen hypotheken, boeken reizen en vergelijken verzekeringen. Dit blijkt uit recent onderzoek naar de veranderende rol van kunstmatige intelligentie in de markt. Nizan Geslevich Packin, expert op dit gebied, beschrijft hoe snel deze verandering gaat. "Tientallen banken en fintechbedrijven testen al software-agenten die leningen regelen en zelfs vastgoedtransacties afsluiten", zegt Packin. Deze agenten werken als plaatsvervangers voor menselijke klanten. Nieuw protocol Een nieuw protocol maakt deze ontwikkeling mogelijk. Het Model Context Protocol (MCP) laat AI-agenten rechtstreeks met servers praten. Grote bedrijven zoals Google, Microsoft en OpenAI steunen dit protocol. Alipay gebruikt het al om agenten zelfstandig betalingen te laten uitvoeren. Deze verschuiving brengt zorgen met zich mee. Mensen vertrouwen vaak te veel op AI-aanbevelingen, zelfs als ze weten dat machines fouten maken. Dit heet 'automation bias'. Daarnaast wordt menselijke hulp steeds meer een premium dienst, alleen beschikbaar voor wie extra betaalt. Rechtvaardigheid, transparantie en verantwoording "We moeten ervoor zorgen dat AI-agenten rechtvaardigheid, transparantie en verantwoording behouden", waarschuwt Packin. "Als we het goed aanpakken, kunnen AI-agenten meer mensen toegang geven tot financiële diensten en kosten verlagen voor gezinnen en kleine bedrijven."

AI groeit door tot voorbij menselijke kennis volgens Google DeepMind

19 april 2025

Google DeepMind stelt dat kunstmatige intelligentie (AI) zich verder moet ontwikkelen via ervaringen. Deze nieuwe aanpak heet 'streams'. Hierbij leert AI van signalen uit de omgeving zonder menselijke vooroordelen. Onderzoekers David Silver en Richard Sutton publiceerden hun visie in een recent paper. Zij stellen dat huidige AI-modellen te beperkt zijn. Deze modellen leren alleen van vooraf bepaalde gegevens. Volgens de wetenschappers moeten AI-systemen zelf kunnen leren door interactie met de wereld. Zelf kennis ontdekken Het duo bekritiseert de huidige chatbotmodellen zoals ChatGPT. Deze zijn alleen ontworpen om vragen te beantwoorden. "Bij deze overgang ging iets verloren: het vermogen van een agent om zelf kennis te ontdekken", schrijven zij. Menselijke voorkeuren zouden een begrenzing vormen voor wat AI kan leren. De onderzoekers pleiten voor AI die continu leert via 'streams' van ervaringen. Dit lijkt op hoe mensen leren gedurende hun leven. Zo kunnen AI-systemen langetermijndoelen ontwikkelen. Deze aanpak bouwt voort op het versterkend leren dat Silver gebruikte bij AlphaZero, de AI die mensen versloeg in schaken en Go. Ervaringsleren "Zodra het volledige potentieel van ervaringsleren wordt benut, zullen ongelooflijke nieuwe mogelijkheden ontstaan", aldus David Silver en Richard Sutton in hun paper. De onderzoekers verwachten dat deze vorm van AI zelfs menselijke kennis kan overstijgen.

MEER WEERGEVEN

Download GRATIS AI-prompts die je business helpen veranderen!

Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.

Je kunt deze krachtige tools zo downloaden.

➡️ Ga naar de producten-pagina en profiteer nu!

BRENG ME HIERHEEN

Nieuwe redenerende AI-modellen van OpenAI maken meer fouten

Elon Musk en AI grootste risico's voor merkimago volgens wereldwijd onderzoek

AI-agenten veranderen bedrijven en klanten voorgoed, toont nieuw onderzoek

AI groeit door tot voorbij menselijke kennis volgens Google DeepMind

Download GRATIS AI-prompts die je business helpen veranderen!

Deel dit bericht

Navigatie

Contactinformatie