logo

BBC ontdekt grote fouten in samenvattingen van AI-chatbots

Vier grote AI-chatbots maken regelmatig ernstige fouten bij het samenvatten van nieuws. Dit blijkt uit onderzoek van de BBC. De onderzoekers testten ChatGPT, Copilot, Gemini en Perplexity.


De chatbots moesten honderd nieuwsberichten samenvatten voor het onderzoek. Bij meer dan de helft van de antwoorden vonden de onderzoekers grote problemen. Bijna twintig procent bevatte feitelijke fouten.


De systemen maakten opvallende vergissingen. ChatGPT noemde een verkeerde sterfdatum voor Hamas-leider Ismail Haniyeh. Gemini gaf onjuist medisch advies over vapen. Beide systemen noemden oud-politici nog actief.


Copilot en Gemini maakten meer fouten dan de andere twee systemen. De chatbots hadden moeite met het verschil tussen meningen en feiten. Ook misten ze vaak belangrijke details.


Deborah Turness, hoofd van BBC News, maakt zich zorgen over de bevindingen. "AI biedt geweldige kansen. Maar mensen die antwoorden zoeken, krijgen nu vaak verwarrende onzin voorgeschoteld", zei Turness.


Illustratie van een zwevend brein in een laboratorium  met een persoon erbij.
door Erwin Blatter 19 februari 2025
Het Amerikaanse advocatenkantoor Morgan & Morgan waarschuwt zijn medewerkers voor kunstmatige intelligentie. Het stuurde een dringende mail naar meer dan duizend advocaten. De boodschap was duidelijk: wie nepzaken gebruikt in rechtbankdocumenten, riskeert ontslag. De waarschuwing kwam nadat twee advocaten van het kantoor in de problemen kwamen. Ze gebruikten niet-bestaande rechtszaken in een zaak tegen Walmart. Een van de advocaten gaf toe dat hij AI had gebruikt. Het computerprogramma had de zaken verzonnen. Nepzaken Rechters in Amerika hebben al in zeven verschillende zaken advocaten bestraft voor het gebruik van nepzaken. Het probleem komt steeds vaker voor sinds de komst van chatbots zoals ChatGPT. Veel advocatenkantoren gebruiken AI-programma's om tijd te besparen bij onderzoek. Michael Cohen, de vroegere advocaat van Donald Trump, maakte dezelfde fout. Hij gebruikte de chatbot Bard van Google. Cohen gaf per ongeluk valse verwijzingen door aan zijn eigen advocaat. De rechter noemde het voorval 'beschamend', maar legde geen straf op.  Zelf controleren Een onderzoek laat zien dat 63 procent van de advocaten AI gebruikt voor hun werk. Twaalf procent doet dit zelfs regelmatig. Experts waarschuwen dat advocaten altijd zelf moeten controleren wat AI schrijft. "Als advocaten ChatGPT of andere AI-programma's gebruiken zonder de bronnen te controleren, is dat gewoon onbekwaamheid", zei Andrew Perlman, decaan van de rechtenfaculteit van Suffolk University.
Hoofd van een chatbot die een blauwe neonkleur uitstraalt met licht dat naar links uitstraalt.
door Erwin Blatter 19 februari 2025
Mira Murati start een nieuw bedrijf in kunstmatige intelligentie. De voormalige technisch directeur van OpenAI richtte dinsdag Thinking Machines Lab op. Het bedrijf telt nu dertig medewerkers uit verschillende AI-bedrijven. Het team bestaat voor twee derde uit oud-medewerkers van OpenAI. Een belangrijke naam is Barret Zoph, die samen met Murati in september vertrok bij OpenAI. Zoph wordt technisch directeur bij de nieuwe onderneming. Menselijke waarden De startup wil AI-systemen maken die menselijke waarden bevatten. Dit moet de systemen veiliger en betrouwbaarder maken. Het bedrijf wil zich ook richten op meer toepassingen dan andere bedrijven in de sector. John Schulman sluit zich aan als wetenschappelijk directeur. Hij verliet OpenAI in augustus voor concurrent Anthropic. Schulman is een van de oprichters van OpenAI. Meer werknemers van OpenAI zullen waarschijnlijk nog volgen. Ontwikkeling van ChatGTP Mira Murati werkte sinds 2018 bij OpenAI. Daar leidde ze de ontwikkeling van ChatGPT. Ze was vaak het gezicht van het bedrijf, samen met directeur Sam Altman. Voor haar tijd bij OpenAI werkte ze bij Leap Motion en Tesla. "Wij bouwen AI die zich kan aanpassen aan alle vormen van menselijke kennis. Hierdoor kunnen we meer verschillende toepassingen maken dan huidige systemen", zei het bedrijf in een aankondiging.
Illustratieve en kunstzinnige weergave van een kleurrijke chatbot.
door Erwin Blatter 18 februari 2025
Duitse bedrijven zijn technisch sterk in kunstmatige intelligentie maar verdienen er weinig geld mee. Dit blijkt uit onderzoek van verschillende deskundigen in Duitsland. Het bedrijf Black Forest Labs is een zeldzame uitzondering in het Duitse AI-landschap. Hun systeem voor het maken van afbeeldingen trekt internationale aandacht. "We moeten sneller handelen, anders betalen we daar een hoge prijs voor", zei Björn Ommer van de Ludwig Maximilian Universiteit in München. 200 miljard euro De Europese Unie heeft onlangs 200 miljard euro vrijgemaakt voor AI-ontwikkeling. Dit volgt op grote investeringen in de Verenigde Staten en China. Het Chinese bedrijf DeepSeek zorgt voor opschudding met zijn nieuwe taalsysteem. Katharina Morik van het Lamarr Instituut ziet kansen voor Duitse bedrijven. Het midden- en kleinbedrijf kan zich richten op speciale toepassingen. "Als het gaat om onderzoek staan we vooraan. We hebben fantastisch talent", vertelde Morik aan nieuwsplatform DW. Tijdelijke contracten Toch vertrekken veel Duitse AI-experts naar Amerika. Duitse bedrijven bieden vaak tijdelijke contracten aan. Ook willen Duitse klanten niet betalen voor AI-diensten. "Ik begrijp niet waarom er hier zo weinig bereidheid is om te experimenteren", zei Katharina Morik.
Share by: