Vier grote AI-chatbots maken regelmatig ernstige fouten bij het samenvatten van nieuws. Dit blijkt uit onderzoek van de BBC. De onderzoekers testten ChatGPT, Copilot, Gemini en Perplexity.
De chatbots moesten honderd nieuwsberichten samenvatten voor het onderzoek. Bij meer dan de helft van de antwoorden vonden de onderzoekers grote problemen. Bijna twintig procent bevatte feitelijke fouten.
De systemen maakten opvallende vergissingen. ChatGPT noemde een verkeerde sterfdatum voor Hamas-leider Ismail Haniyeh. Gemini gaf onjuist medisch advies over vapen. Beide systemen noemden oud-politici nog actief.
Copilot en Gemini maakten meer fouten dan de andere twee systemen. De chatbots hadden moeite met het verschil tussen meningen en feiten. Ook misten ze vaak belangrijke details.
Deborah Turness, hoofd van BBC News, maakt zich zorgen over de bevindingen. "AI biedt geweldige kansen. Maar mensen die antwoorden zoeken, krijgen nu vaak verwarrende onzin voorgeschoteld", zei Turness.