Onderzoek onthult: kunstmatige intelligentie worstelt met softwareontwikkeling

OpenAI-onderzoekers hebben een opvallende ontdekking gedaan over de beperkte mogelijkheden van kunstmatige intelligentie (AI) bij softwareontwikkeling. Hun nieuwste onderzoek toont aan dat zelfs de meest geavanceerde AI-modellen moeite hebben met het oplossen van coderingsuitdagingen.


Het onderzoeksteam gebruikte een nieuwe meetmethode genaamd SWE-Lancer, gebaseerd op meer dan 1.400 softwareontwikkelingstaken van het platform Upwork. Drie grote taalmodellen werden getest: het eigen o1-model, GPT-4o en Claude 3.5 Sonnet van Anthropic.


Kopiëren van bestaande oplossingen onmogelijk
De onderzoekers analyseerden twee soorten taken: individuele opdrachten voor het oplossen van bugs en managementtaken voor strategische besluitvorming. Opvallend was dat de AI-modellen geen toegang hadden tot internet, wat kopiëren van bestaande oplossingen onmogelijk maakte.


Uit het onderzoek bleek dat de AI-systemen slechts oppervlakkige softwareproblemen konden aanpakken. "De modellen slaagden er niet in om wijdverspreide bugs te herkennen of de context ervan te begrijpen", aldus de onderzoekers. Hoewel de AI veel sneller werkte dan mensen, waren de oplossingen vaak onvolledig of onjuist.


Meeste antwoorden incorrect
Claude 3.5 Sonnet presteerde het beste van de geteste modellen, maar nog steeds waren de meeste antwoorden incorrect. De onderzoekers benadrukten dat de betrouwbaarheid aanzienlijk moet verbeteren voordat AI echt kan worden ingezet voor softwareontwikkeling.


"De modellen zijn momenteel nog niet geschikt om menselijke software-ingenieurs te vervangen", zegt het onderzoeksteam. Dit staat in schril contrast met de verwachtingen van sommige techleiders, zoals Sam Altman van OpenAI, die beweren dat AI tegen het einde van het jaar 'junior' softwareontwikkelaars zal kunnen vervangen. "Hoewel AI snel vooruitgaat, is het nog ver verwijderd van menselijke expertise", aldus de onderzoekers.

LAATSTE AI-NIEUWS

Het logo van Google op de glazen pui van zijn hoofdkantoor
12 juli 2025
Google heeft vrijdag bekendgemaakt dat het bedrijf Varun Mohan aanneemt. Hij is de oprichter en baas van kunstmatige intelligentie startup Windsurf. Het techbedrijf betaalt 2,4 miljard dollar voor licenties en salarissen. Samen met Mohan komen ook andere belangrijke onderzoekers van Windsurf naar Google. De zoekgigant krijgt een licentie op bepaalde technologie van Windsurf. Deze licentie is niet exclusief. Dat betekent dat Windsurf zijn techniek ook aan anderen mag verkopen. Google investeert niet in het bedrijf zelf. Naast Varun Mohan stapt ook medeoprichter Douglas Chen over naar Google. Toptalent "We zijn blij om toptalent op het gebied van AI-coderen van het Windsurf-team te verwelkomen bij Google DeepMind", vertelde een woordvoerder van Google in een e-mail. Het bedrijf wil zijn werk aan coderen met AI-agenten verder ontwikkelen. Deze agenten zijn programma's die zelfstandig code kunnen schrijven. De deal komt nadat Windsurf met OpenAI had gepraat over een overname van 3 miljard dollar. Die onderhandelingen liepen op niets uit. Jeff Wang, het nieuwe hoofd van Windsurf, schrijft op X dat het grootste deel van het team bij Windsurf blijft werken. "Ze blijven het Windsurf-product bouwen met als doel de impact voor bedrijven te maximaliseren", zei Wang. Vibe coding Windsurf is dit jaar populair geworden voor zogeheten 'vibe coding'. Dit is een nieuwe manier van programmeren waarbij mensen AI-tools gebruiken om code te schrijven. Zowel ontwikkelaars als mensen zonder programmeerervaring omarmen dit concept. Dit heeft geleid tot meer inkomsten voor Windsurf en concurrenten zoals Cursor. "We zijn enthousiast om de voordelen van Gemini naar softwareontwikkelaars overal te blijven brengen", aldus de Google-woordvoerder. 
Een robothand en een mensenhand reiken naar elkaar.
12 juli 2025
De snelle opkomst van kunstmatige intelligentie leidt tot angst voor baanverlies. Toch kan de technologie juist kansen bieden voor veel werknemers. Bedrijven hebben mensen nodig om AI-systemen te beheren of te controleren. Ook ontstaan er functies die creativiteit en complex denken vereisen. "Het is niet zo dat AI een vloedgolf is waar we geen controle over hebben – er zijn plekken waar we wel controle hebben", zegt Harry Holzer. Hij is hoogleraar aan Georgetown University. Voorspellingen over baanverlies door AI lopen sterk uiteen. Dario Amodei, baas van Anthropic, denkt dat AI binnen vijf jaar de helft van de startersbanen kan schrappen. Positiever beeld Het Wereld Economisch Forum schetst een positiever beeld. Zij ondervroegen duizend grote bedrijven wereldwijd. AI blijkt de belangrijkste aanjager van nieuwe banen tot 2030. De technologie zou wereldwijd 170 miljoen banen creëren in vijf jaar. Dat is veel meer dan de 92 miljoen banen die verloren gaan. Vacaturessite Glassdoor ziet nu al nieuwe AI-functies verschijnen. Het aandeel AI-vacatures verdubbelde tussen 2023 en 2024. Dit jaar steeg het aantal met nog eens 56 procent. Chris Martin van Glassdoor onderscheidt twee soorten AI-banen. Volledig nieuwe functies Ten eerste bestaande functies met AI-taken, zoals software-ontwikkelaars die zich specialiseren in AI. Ten tweede volledig nieuwe functies, zoals AI-trainers die de technologie verbeteren. Ethan Mollick, professor aan de University of Pennsylvania, waarschuwt voor overhaaste beslissingen. "Het ergste wat je nu kunt doen is een complexe carrièrebeslissing nemen op basis van wat AI vandaag doet, want we weten het gewoon niet", aldus Mollick.
Hoofdkantoor Europese Unie in Straatsburg.
11 juli 2025
De Europese Unie heeft donderdag nieuwe regels bekendgemaakt voor kunstmatige intelligentie (AI). Bedrijven die de krachtigste AI-systemen maken, moeten transparanter worden. Ze moeten ook auteursrechten respecteren. En ze moeten de openbare veiligheid beschermen. De regels gaan pas volgend jaar in. Ze komen op een belangrijk moment. In Brussel wordt fel gediscussieerd over AI-regels. Veel leiders zien AI als cruciaal voor economisch succes. Europa wil concurreren met de Verenigde Staten en China. Sommige critici zeggen dat de regels te zwak zijn. Ze denken dat Europa de industrie te veel tegemoet komt. Klein aantal techbedrijven De richtlijnen gelden alleen voor een klein aantal techbedrijven. Denk aan OpenAI, Microsoft en Google. Deze bedrijven maken zogeheten algemene AI-systemen. Deze systemen zijn de basis voor diensten zoals ChatGPT. Ze kunnen enorme hoeveelheden data analyseren. Ze kunnen zelf leren. En ze kunnen sommige menselijke taken uitvoeren. Henna Virkkunen werkt bij de Europese Commissie. Zij zegt dat de nieuwe wet AI-modellen beter maakt. "Ze worden niet alleen innovatief, maar ook veilig en transparant", verklaart ze. De regels dwingen bedrijven om openheid te geven over hun systemen. Ze moeten laten zien hoe hun AI werkt. Bedrijven moeten ook voorzichtiger zijn met auteursrechten. AI-systemen gebruiken vaak teksten en afbeeldingen van anderen. De nieuwe regels moeten dit beter beschermen. Ook moeten bedrijven bewijzen dat hun AI veilig is voor het publiek. Dit is belangrijk omdat AI steeds meer invloed heeft op ons dagelijks leven. Discussie over strengheid Niet iedereen is blij met de nieuwe regels. Sommige experts vinden ze niet streng genoeg. Ze vrezen dat Europa te veel rekening houdt met grote techbedrijven. Anderen zeggen juist dat de regels innovatie kunnen remmen. Ze maken zich zorgen dat Europa achterloopt op andere landen. De timing van de regels is opvallend. AI ontwikkelt zich razendsnel. Diensten zoals ChatGPT worden steeds populairder. Tegelijk maken mensen zich zorgen over de risico's. Ze vrezen voor hun privacy en banen. De EU probeert een balans te vinden tussen innovatie en bescherming. Wat betekent dit voor bedrijven? De nieuwe regels raken vooral grote techbedrijven. Kleinere bedrijven die AI gebruiken, hebben minder verplichtingen. Maar ook zij moeten rekening houden met de wet. Bedrijven hebben tot volgend jaar om zich voor te bereiden. Dan worden de regels van kracht. Europa loopt voorop met AI-wetgeving. Andere landen kijken mee. De Verenigde Staten en China hebben nog geen vergelijkbare regels. Dit maakt de Europese aanpak uniek. Het kan een voorbeeld worden voor de rest van de wereld. "We willen laten zien dat innovatie en veiligheid samen kunnen gaan", aldus Virkkunen.
MEER WEERGEVEN

Download GRATIS AI-prompts die je business helpen veranderen!

Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.

Je kunt deze krachtige tools zo downloaden.

➡️ Ga naar de producten-pagina en profiteer nu!

BRENG ME HIERHEEN

Deel dit bericht