Onderzoek onthult: kunstmatige intelligentie worstelt met softwareontwikkeling

OpenAI-onderzoekers hebben een opvallende ontdekking gedaan over de beperkte mogelijkheden van kunstmatige intelligentie (AI) bij softwareontwikkeling. Hun nieuwste onderzoek toont aan dat zelfs de meest geavanceerde AI-modellen moeite hebben met het oplossen van coderingsuitdagingen.
Het onderzoeksteam gebruikte een nieuwe meetmethode genaamd SWE-Lancer, gebaseerd op meer dan 1.400 softwareontwikkelingstaken van het platform Upwork. Drie grote taalmodellen werden getest: het eigen o1-model, GPT-4o en Claude 3.5 Sonnet van Anthropic.
Kopiëren van bestaande oplossingen onmogelijk
De onderzoekers analyseerden twee soorten taken: individuele opdrachten voor het oplossen van bugs en managementtaken voor strategische besluitvorming. Opvallend was dat de AI-modellen geen toegang hadden tot internet, wat kopiëren van bestaande oplossingen onmogelijk maakte.
Uit het onderzoek bleek dat de AI-systemen slechts oppervlakkige softwareproblemen konden aanpakken. "De modellen slaagden er niet in om wijdverspreide bugs te herkennen of de context ervan te begrijpen", aldus de onderzoekers. Hoewel de AI veel sneller werkte dan mensen, waren de oplossingen vaak onvolledig of onjuist.
Meeste antwoorden incorrect
Claude 3.5 Sonnet presteerde het beste van de geteste modellen, maar nog steeds waren de meeste antwoorden incorrect. De onderzoekers benadrukten dat de betrouwbaarheid aanzienlijk moet verbeteren voordat AI echt kan worden ingezet voor softwareontwikkeling.
"De modellen zijn momenteel nog niet geschikt om menselijke software-ingenieurs te vervangen", zegt het onderzoeksteam. Dit staat in schril contrast met de verwachtingen van sommige techleiders, zoals Sam Altman van OpenAI, die beweren dat AI tegen het einde van het jaar 'junior' softwareontwikkelaars zal kunnen vervangen. "Hoewel AI snel vooruitgaat, is het nog ver verwijderd van menselijke expertise", aldus de onderzoekers.
LAATSTE AI-NIEUWS



Download GRATIS AI-prompts die je business helpen veranderen!
Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.
Je kunt deze krachtige tools zo downloaden.
➡️ Ga naar de producten-pagina en profiteer nu!