Nieuwe redenerende AI-modellen van OpenAI maken meer fouten

De nieuwste AI-modellen van OpenAI zijn slimmer dan eerdere versies. Toch vertonen ze meer problemen met 'hallucineren'. Dit betekent dat ze vaker onjuiste informatie bedenken. Dit blijkt uit onderzoek van het bedrijf zelf.


OpenAI lanceerde onlangs de modellen o3 en o4-mini. Deze zogenaamde redenerende modellen presteren beter bij taken zoals coderen en wiskunde. Maar volgens interne tests hallucineren ze vaker dan hun voorgangers. Het model o3 gaf bij 33 procent van de vragen over personen onjuiste informatie. Dit is twee keer zo veel als bij oudere modellen.


Verkeerde antwoorden
Het model o4-mini presteerde nog slechter. Bij vragen over personen gaf dit model in 48 procent van de gevallen verkeerde antwoorden. Ook onafhankelijk onderzoek door non-profit lab Transluce bevestigt deze problemen. Sarah Schwettmann, medeoprichter van Transluce, meent dat deze foutmarge de bruikbaarheid van de modellen vermindert.


Kian Katanforoosh, directeur van opleidingsbedrijf Workera, testte het o3-model al in de praktijk. Hoewel het model volgens hem beter presteert dan concurrenten, merkte hij ook problemen op. Zo geeft o3 vaak niet-werkende links naar websites. Dit type fouten maakt AI-modellen minder betrouwbaar voor bedrijven waar nauwkeurigheid essentieel is.


Aanpakken van hallucinaties
"Het aanpakken van hallucinaties in al onze modellen is een doorlopend onderzoeksgebied. We werken voortdurend aan het verbeteren van hun nauwkeurigheid en betrouwbaarheid", zei een woordvoerder van OpenAI.

LAATSTE AI-NIEUWS

Logo OpenAI op het hoofdkantoor.
17 juni 2025
OpenAI heeft een verrassende deal gesloten met Google Cloud. Het bedrijf gaat de cloudservice van Alphabet gebruiken voor extra rekenkracht. Dit is opmerkelijk omdat beide bedrijven fel concurreren in de kunstmatige intelligentie. De overeenkomst werd in mei afgerond na maanden overleg. Drie bronnen bevestigden dit aan persbureau Reuters. OpenAI wil hiermee zijn afhankelijkheid van Microsoft verminderen. Het bedrijf zoekt nieuwe bronnen voor rekenkracht naast zijn hoofdpartner Microsoft. Belangrijke klant Google Cloud krijgt hierdoor een belangrijke klant erbij. Het platform gaat extra rekenkracht leveren voor het trainen van AI-modellen. OpenAI gebruikt deze capaciteit ook voor het draaien van ChatGPT. De samenwerking komt terwijl ChatGPT de grootste bedreiging vormt voor Google's zoekdominantie in jaren. Het aandeel van Google-moeder Alphabet steeg dinsdag met 2,1 procent na het nieuws. Microsoft-aandelen daalden daarentegen met 0,6 procent. Analisten van Scotiabank noemden de ontwikkeling 'enigszins verrassend'. Het bedrijf ziet groeikansen voor Google's cloudafdeling.  Groeinde vraag OpenAI heeft te maken met groeiende vraag naar rekenkracht sinds ChatGPT eind 2022 werd gelanceerd. Het bedrijf meldde maandag dat zijn jaarlijkse omzet is gestegen naar 10 miljard dollar. Google Cloud had 43 miljard dollar omzet in 2024. Dit was 12 procent van Alphabet's totale inkomsten. "We bekijken dit als een grote overwinning voor Google's cloudafdeling, maar er blijven zorgen dat ChatGPT een steeds grotere bedreiging wordt voor Google's zoekdominantie", schreven de Scotiabank-analisten.
De homepage van een dagblad.
17 juni 2025
Nieuwswebsites krijgen zware klappen van Google's nieuwe AI-tools. Chatbots vervangen steeds vaker het traditionele zoeken op Google. Hierdoor verdwijnt de behoefte om op blauwe links te klikken naar nieuwssites. Het verkeer naar nieuwswebsites stort dramatisch in. Uitgevers verloren bezoekers waar ze jarenlang op konden rekenen. De AI-revolutie raakt de online nieuwsindustrie harder dan verwacht. Google's zoekresultaten sturen steeds minder mensen door naar externe websites. Antwoorden direct in het zoekscherm Chatbots geven antwoorden direct in het zoekscherm. Gebruikers hoeven niet meer door te klikken naar de oorspronkelijke bron. Dit betekent minder advertentie-inkomsten voor nieuwsorganisaties. Hun verdienmodel staat zwaar onder druk. Uitgevers zien hun website-bezoek kelderen sinds Google AI-functies heeft uitgerold. Sommige nieuwssites verliezen wel de helft van hun verkeer via Google. De impact is groter dan bij eerdere veranderingen in zoekalgoritmes. Veel uitgevers vrezen voor hun voortbestaan. Drastische aanpassingen De situatie dwingt nieuwsorganisaties tot drastische aanpassingen. Ze moeten nieuwe manieren vinden om lezers te bereiken en inkomsten te genereren. "De AI-apocalyps voor online nieuwsuitgevers is begonnen", aldus branchekenners die de ontwikkelingen nauwlettend volgen.
Apple-producten op een bureaublad.
16 juni 2025
Het Chinese techbedrijf Alibaba heeft nieuwe versies uitgebracht van zijn AI-modellen. Deze Qwen3-modellen werken nu op Apple apparaten. Dat meldt persbureau Reuters maandag. De modellen draaien op iPhone, iPad, MacBook en Mac computers. Alibaba paste de software aan voor Apple's MLX-structuur. Dit is een speciaal systeem voor AI op Apple apparaten. De stap brengt Apple Intelligence dichterbij voor Chinese gebruikers. Schrijfhulp Apple Intelligence is de naam voor Apple's AI-functies. Het bevat tools zoals Genmoji en schrijfhulp. Deze functies zijn nog niet beschikbaar in China. Apple moet daar samenwerken met lokale bedrijven vanwege Chinese regels. Daarom koos Apple voor een deal met Alibaba. De lancering in China loopt vertraging op door handelsspanningen. Amerika en China voeren al jaren een handelsoorlog. Dit maakt het moeilijk voor Amerikaanse bedrijven om diensten aan te bieden in China. Toch blijft China een belangrijke markt voor Apple. Cijfers Apple verkocht in mei de meeste telefoons in China. De verkoop steeg wereldwijd met 15 procent in april en mei. Onderzoeksbureau Counterpoint Research verzamelde deze cijfers. China is Apple's grootste markt buiten Amerika. Beleggers reageerden positief op het nieuws. Het aandeel Alibaba steeg maandag met 3 procent. Apple ging 0,5 procent omhoog. Beide bedrijven profiteren mogelijk van de samenwerking. "Deze stap toont dat techbedrijven wegen vinden rond handelsbeperkingen", zei een analist tegen Reuters.
MEER WEERGEVEN

Download GRATIS AI-prompts die je business helpen veranderen!

Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.

Je kunt deze krachtige tools zo downloaden.

➡️ Ga naar de producten-pagina en profiteer nu!

BRENG ME HIERHEEN

Deel dit bericht