Geavanceerde AI wordt steeds onvoorspelbaarder in prestaties

De nieuwste AI-modellen van OpenAI krijgen lovende reacties, maar er is een probleem. Experts ontdekken dat deze modellen grillig zijn in hun prestaties. Ze verbreken records op sommige taken maar vallen terug op andere gebieden.


OpenAI lanceerde vorige week zijn o3 en kleinere o4-mini modellen. Het bedrijf noemde ze "de slimste modellen die we tot nu toe hebben uitgebracht". Het o3-model kreeg veel lof voor zijn redeneervermogen en zelfstandigheid bij het uitvoeren van zoekopdrachten zonder menselijke hulp.


Denkproces
"Deze modellen kunnen zoekopdrachten uitvoeren als onderdeel van hun denkproces voordat ze een antwoord geven. Dit blijkt een grote doorbraak", zegt Simon Willison, ontwikkelaar. Econoom-blogger Tyler Cowen ging nog verder: "Ik denk dat het AGI (artificiële algemene intelligentie) is, serieus. Misschien is AGI als pornografie – ik herken het als ik het zie. En ik heb het gezien."


Ondanks de indrukwekkende mogelijkheden vertoont o3 ook tekortkomingen. In een veelgebruikte nauwkeurigheidstest ontdekte OpenAI dat o3 meer dan twee keer zo vaak hallucinaties (verzonnen antwoorden) produceert als zijn voorganger. Een studie naar prestaties bij financiële analyses plaatste o3 bovenaan, maar het gaf slechts in 48,3 procent van de gevallen nauwkeurige resultaten.


Onbetrouwbaar en bovenmenselijk
"Bij sommige taken is AI onbetrouwbaar. Bij andere is het bovenmenselijk", zegt AI-analist Ethan Mollick. "De nieuwste modellen vertegenwoordigen iets kwalitatief anders dan wat er voorheen was. Hun zelfstandige eigenschappen, gecombineerd met hun ongelijke vaardigheden, creëren een echt nieuwe situatie zonder duidelijke vergelijkingen."

LAATSTE AI-NIEUWS

Logo OpenAI op het hoofdkantoor.
17 juni 2025
OpenAI heeft een verrassende deal gesloten met Google Cloud. Het bedrijf gaat de cloudservice van Alphabet gebruiken voor extra rekenkracht. Dit is opmerkelijk omdat beide bedrijven fel concurreren in de kunstmatige intelligentie. De overeenkomst werd in mei afgerond na maanden overleg. Drie bronnen bevestigden dit aan persbureau Reuters. OpenAI wil hiermee zijn afhankelijkheid van Microsoft verminderen. Het bedrijf zoekt nieuwe bronnen voor rekenkracht naast zijn hoofdpartner Microsoft. Belangrijke klant Google Cloud krijgt hierdoor een belangrijke klant erbij. Het platform gaat extra rekenkracht leveren voor het trainen van AI-modellen. OpenAI gebruikt deze capaciteit ook voor het draaien van ChatGPT. De samenwerking komt terwijl ChatGPT de grootste bedreiging vormt voor Google's zoekdominantie in jaren. Het aandeel van Google-moeder Alphabet steeg dinsdag met 2,1 procent na het nieuws. Microsoft-aandelen daalden daarentegen met 0,6 procent. Analisten van Scotiabank noemden de ontwikkeling 'enigszins verrassend'. Het bedrijf ziet groeikansen voor Google's cloudafdeling.  Groeinde vraag OpenAI heeft te maken met groeiende vraag naar rekenkracht sinds ChatGPT eind 2022 werd gelanceerd. Het bedrijf meldde maandag dat zijn jaarlijkse omzet is gestegen naar 10 miljard dollar. Google Cloud had 43 miljard dollar omzet in 2024. Dit was 12 procent van Alphabet's totale inkomsten. "We bekijken dit als een grote overwinning voor Google's cloudafdeling, maar er blijven zorgen dat ChatGPT een steeds grotere bedreiging wordt voor Google's zoekdominantie", schreven de Scotiabank-analisten.
De homepage van een dagblad.
17 juni 2025
Nieuwswebsites krijgen zware klappen van Google's nieuwe AI-tools. Chatbots vervangen steeds vaker het traditionele zoeken op Google. Hierdoor verdwijnt de behoefte om op blauwe links te klikken naar nieuwssites. Het verkeer naar nieuwswebsites stort dramatisch in. Uitgevers verloren bezoekers waar ze jarenlang op konden rekenen. De AI-revolutie raakt de online nieuwsindustrie harder dan verwacht. Google's zoekresultaten sturen steeds minder mensen door naar externe websites. Antwoorden direct in het zoekscherm Chatbots geven antwoorden direct in het zoekscherm. Gebruikers hoeven niet meer door te klikken naar de oorspronkelijke bron. Dit betekent minder advertentie-inkomsten voor nieuwsorganisaties. Hun verdienmodel staat zwaar onder druk. Uitgevers zien hun website-bezoek kelderen sinds Google AI-functies heeft uitgerold. Sommige nieuwssites verliezen wel de helft van hun verkeer via Google. De impact is groter dan bij eerdere veranderingen in zoekalgoritmes. Veel uitgevers vrezen voor hun voortbestaan. Drastische aanpassingen De situatie dwingt nieuwsorganisaties tot drastische aanpassingen. Ze moeten nieuwe manieren vinden om lezers te bereiken en inkomsten te genereren. "De AI-apocalyps voor online nieuwsuitgevers is begonnen", aldus branchekenners die de ontwikkelingen nauwlettend volgen.
Apple-producten op een bureaublad.
16 juni 2025
Het Chinese techbedrijf Alibaba heeft nieuwe versies uitgebracht van zijn AI-modellen. Deze Qwen3-modellen werken nu op Apple apparaten. Dat meldt persbureau Reuters maandag. De modellen draaien op iPhone, iPad, MacBook en Mac computers. Alibaba paste de software aan voor Apple's MLX-structuur. Dit is een speciaal systeem voor AI op Apple apparaten. De stap brengt Apple Intelligence dichterbij voor Chinese gebruikers. Schrijfhulp Apple Intelligence is de naam voor Apple's AI-functies. Het bevat tools zoals Genmoji en schrijfhulp. Deze functies zijn nog niet beschikbaar in China. Apple moet daar samenwerken met lokale bedrijven vanwege Chinese regels. Daarom koos Apple voor een deal met Alibaba. De lancering in China loopt vertraging op door handelsspanningen. Amerika en China voeren al jaren een handelsoorlog. Dit maakt het moeilijk voor Amerikaanse bedrijven om diensten aan te bieden in China. Toch blijft China een belangrijke markt voor Apple. Cijfers Apple verkocht in mei de meeste telefoons in China. De verkoop steeg wereldwijd met 15 procent in april en mei. Onderzoeksbureau Counterpoint Research verzamelde deze cijfers. China is Apple's grootste markt buiten Amerika. Beleggers reageerden positief op het nieuws. Het aandeel Alibaba steeg maandag met 3 procent. Apple ging 0,5 procent omhoog. Beide bedrijven profiteren mogelijk van de samenwerking. "Deze stap toont dat techbedrijven wegen vinden rond handelsbeperkingen", zei een analist tegen Reuters.
MEER WEERGEVEN

Download GRATIS AI-prompts die je business helpen veranderen!

Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.

Je kunt deze krachtige tools zo downloaden.

➡️ Ga naar de producten-pagina en profiteer nu!

BRENG ME HIERHEEN

Deel dit bericht