Onderzoek onthult: kunstmatige intelligentie worstelt met softwareontwikkeling

OpenAI-onderzoekers hebben een opvallende ontdekking gedaan over de beperkte mogelijkheden van kunstmatige intelligentie (AI) bij softwareontwikkeling. Hun nieuwste onderzoek toont aan dat zelfs de meest geavanceerde AI-modellen moeite hebben met het oplossen van coderingsuitdagingen.


Het onderzoeksteam gebruikte een nieuwe meetmethode genaamd SWE-Lancer, gebaseerd op meer dan 1.400 softwareontwikkelingstaken van het platform Upwork. Drie grote taalmodellen werden getest: het eigen o1-model, GPT-4o en Claude 3.5 Sonnet van Anthropic.


Kopiëren van bestaande oplossingen onmogelijk
De onderzoekers analyseerden twee soorten taken: individuele opdrachten voor het oplossen van bugs en managementtaken voor strategische besluitvorming. Opvallend was dat de AI-modellen geen toegang hadden tot internet, wat kopiëren van bestaande oplossingen onmogelijk maakte.


Uit het onderzoek bleek dat de AI-systemen slechts oppervlakkige softwareproblemen konden aanpakken. "De modellen slaagden er niet in om wijdverspreide bugs te herkennen of de context ervan te begrijpen", aldus de onderzoekers. Hoewel de AI veel sneller werkte dan mensen, waren de oplossingen vaak onvolledig of onjuist.


Meeste antwoorden incorrect
Claude 3.5 Sonnet presteerde het beste van de geteste modellen, maar nog steeds waren de meeste antwoorden incorrect. De onderzoekers benadrukten dat de betrouwbaarheid aanzienlijk moet verbeteren voordat AI echt kan worden ingezet voor softwareontwikkeling.


"De modellen zijn momenteel nog niet geschikt om menselijke software-ingenieurs te vervangen", zegt het onderzoeksteam. Dit staat in schril contrast met de verwachtingen van sommige techleiders, zoals Sam Altman van OpenAI, die beweren dat AI tegen het einde van het jaar 'junior' softwareontwikkelaars zal kunnen vervangen. "Hoewel AI snel vooruitgaat, is het nog ver verwijderd van menselijke expertise", aldus de onderzoekers.

LAATSTE AI-NIEUWS

Een smartphone met daarop het logo van Meta AI.
29 mei 2025
De AI-assistent van Meta heeft een miljard maandelijkse gebruikers bereikt. Dit maakte topman Mark Zuckerberg woensdag bekend tijdens de jaarlijkse aandeelhoudersvergadering van zijn bedrijf. De kunstmatige intelligentie werkt in alle apps van Meta. Zuckerberg wil dit jaar de ervaring verbeteren. Het doel is om Meta AI de beste persoonlijke AI te maken. "De focus voor dit jaar ligt op het verdiepen van de ervaring en Meta AI de leidende persoonlijke AI maken met nadruk op personalisatie, spraakgesprekken en entertainment", zei Mark Zuckerberg. Mijlpaal Meta bereikte deze mijlpaal nadat het bedrijf in april een losse app voor de tool uitbracht. Het plan is om het product eerst verder te laten groeien. Daarna wil Meta er geld mee gaan verdienen. Zuckerberg denkt aan verschillende manieren om inkomsten te genereren. Meta kan betaalde aanbevelingen toevoegen of een abonnementsdienst aanbieden.  "Er zullen kansen zijn om betaalde aanbevelingen in te voegen of een abonnementsdienst aan te bieden zodat mensen kunnen betalen om meer rekenkracht te gebruiken", aldus Mark Zuckerberg. Uitstoot van broeikasgassen Tijdens de vergadering stemden aandeelhouders over veertien verschillende punten. Negen daarvan waren voorstellen van aandeelhouders over onderwerpen zoals kinderveiligheid en uitstoot van broeikasgassen. "Het lijkt misschien een beetje grappig dat een miljard maandelijkse gebruikers er niet uitziet alsof het op schaal is voor ons, maar dat is waar we staan", vertelde Mark Zuckerberg aan de aandeelhouders.
Een smartphone met daarop Claude, de LLM van Anthropic.
29 mei 2025
Topman Dario Amodei van AI-bedrijf Anthropic slaat alarm over de gevolgen van kunstmatige intelligentie voor de arbeidsmarkt. Dario Amodei verwacht dat AI binnen vijf jaar de helft van alle beginnende kantoorbanen zal wegvagen. De werkloosheid kan hierdoor stijgen naar 20 procent. Amodei vertelde aan nieuwssite Axios dat hij gelooft in deze drastische verandering. De werkloosheid zou kunnen stijgen tot tussen de tien en twintig procent. Hij wil met deze waarschuwing zowel het publiek als de overheid voorbereiden op wat er komt. Dreiging De meeste mensen zijn zich niet bewust van deze dreiging. "De meesten weten niet dat dit op het punt staat te gebeuren", zei Amodei. Hij vindt dat AI-bedrijven de plicht hebben om eerlijk te zijn over de gevolgen. "Het klinkt gek en mensen geloven het gewoon niet. Wij als makers van deze technologie hebben de plicht en verplichting om eerlijk te zijn over wat er komt." Amodei keert zich niet tegen AI-ontwikkeling. Zijn bedrijf Anthropic heeft net chatbot Claude 4 uitgebracht. Hij blijft positief over de mogelijkheden van AI. Er is volgens hem nog tijd om de ergste gevolgen te voorkomen. Dit kan door mensen beter te informeren en werknemers te helpen omgaan met AI. Ook kunnen beleidsmakers nog maatregelen nemen. Voorspellingen Amodei is niet de enige die waarschuwt voor AI's impact op banen. Zakenman Kai-Fu Lee noemde voorspellingen dat AI tegen 2027 de helft van alle banen wegneemt 'angstwekkend accuraat'. "Je kunt niet voor de trein gaan staan en hem stoppen", aldus Amodei. "De enige zet die gaat werken is de trein sturen. Stuur hem tien graden in een andere richting. Dat kan gedaan worden, maar we moeten het nu doen."
Een persoon schrijft in een schrijfblok.
.
28 mei 2025
Amerikaanse universiteiten keren terug naar pen en papier. Studenten gebruiken ChatGPT massaal voor huiswerk en essays. De AI-app kan elke vraag beantwoorden en complete werkstukken schrijven. Docenten proberen het valsspelen tegen te gaan met ouderwetse methodes. Ze laten studenten weer handgeschreven examens maken in speciale boekjes. Deze examenboekjes heten 'blue books' (blauwe boekjes). De verkoop ervan stijgt enorm sinds ChatGPT uitkwam in 2022. Texas A&M University zag een toename van meer dan dertig procent. De Universiteit van Florida noteerde bijna vijftig procent groei. Bij UC Berkeley steeg de verkoop zelfs met tachtig procent over twee jaar. De Wall Street Journal ontdekte deze opvallende trend bij grote openbare universiteiten.  Gevreesd Blue books waren vroeger gevreesd bij studenten. Ze moesten binnen korte tijd essays schrijven in deze kleine boekjes. De pagina's waren te klein en de lijnen te groot. Nu worden deze boekjes gezien als redmiddel tegen AI-fraude. Roaring Spring Paper Products maakt de meeste blue books voor universiteiten. Het familiebedrijf profiteert ironisch genoeg van het AI-tijdperk. Toch lost de terugkeer van handgeschreven toetsen niet alles op. Studenten verliezen belangrijke vaardigheden door AI-gebruik. Een recente enquête toonde aan dat 89 procent van de studenten ChatGPT gebruikt. Software om AI-fraude te ontdekken werkt vaak niet goed. Jongeren zien hun opleiding steeds meer als een spel. Ze proberen het systeem te slim af te zijn met algoritmes. Gevolgen Philip D. Bunn werkt als docent aan Covenant College in Georgia. Hij waarschuwt voor de gevolgen van deze ontwikkeling. "Het schrijfproces buiten de les kan niet zomaar worden nagebootst in een blue book examen. We verliezen iets belangrijks als we het traditionele essay volledig opgeven", schrijft Bunn op zijn blog.
MEER WEERGEVEN

Download GRATIS AI-prompts die je business helpen veranderen!

Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.

Je kunt deze krachtige tools zo downloaden.

➡️ Ga naar de producten-pagina en profiteer nu!

BRENG ME HIERHEEN

Deel dit bericht