AI kan binnenkort taken aanpakken die mensen weken kosten

Een nieuwe maatstaf laat zien dat AI-systemen snel beter worden in het uitvoeren van langdurige taken. De kloof met menselijke deskundigen wordt in hoog tempo kleiner. Dat is de conclusie in een recente analyse.


METR, een non-profitorganisatie uit Berkeley, heeft bijna 170 praktijkgerichte opdrachten ontwikkeld. Deze taken omvatten programmeren, cyberveiligheid en machinaal leren. Het team stelde eerst vast hoelang ervaren programmeurs nodig hadden om deze taken te voltooien.


Nieuwe meetmethode

Daarna ontwikkelde METR een nieuwe meetmethode genaamd 'taak-voltooiing tijdshorizon'. Deze maatstaf toont hoeveel tijd programmeurs gewoonlijk nodig hebben voor taken die AI-modellen met een bepaald slagingspercentage kunnen voltooien.


In een onderzoek dat deze week verscheen op arXiv, meldt METR dat GPT-2 uit 2019 faalde bij alle taken die langer dan één minuut duurden. Claude 3.7 Sonnet, uitgebracht in februari door Anthropic, voltooide daarentegen vijftig procent van de taken die mensen 59 minuten zouden kosten.


Zeer lage of hoge drempels
"Als je zeer lage of hoge drempels kiest, verandert het verwijderen of toevoegen van één geslaagde of mislukte taak je schatting aanzienlijk", legde Lawrence Chan uit. METR koos bewust voor de vijftig procent slagingsdrempel omdat deze het meest betrouwbaar bleek bij kleine veranderingen in de gegevensverdeling.


"Het beste AI-model zit momenteel rond een 40-minuten tijdshorizon, en er is niet veel economisch waardevol werk dat iemand in die tijd kan doen", zei Ben West. De nieuwste onderzoeksresultaten van METR bieden volgens hem een gedeeltelijke verklaring waarom geavanceerde AI-modellen nog relatief weinig economische impact hebben gehad.

LAATSTE AI-NIEUWS

Een closeup van een groene printplaat met daarop allerlei IC's etc.
8 mei 2025
Het aandeel van Nvidia steeg woensdag met 3 procent na nieuws over mogelijke veranderingen in het Amerikaanse exportbeleid voor AI-chips. De Trump-administratie is van plan om de exportbeperkingen voor kunstmatige intelligentie (AI) chips die onder Joe Biden werden ingevoerd te herroepen, volgens een bericht van Bloomberg. Het Amerikaanse ministerie van Handel bevestigde deze beleidswijziging in een verklaring aan Reuters en Axios. De AI-regel van Biden werd door het ministerie omschreven als "buitensporig ingewikkeld" en "te bureaucratisch". "We zullen deze vervangen door een veel eenvoudigere regel die Amerikaanse innovatie losmaakt en zorgt voor Amerikaanse AI-dominantie", zei een woordvoerder van het ministerie. Aanzienlijke koersdalingen Ook concurrent Advanced Micro Devices (AMD) profiteerde van dit nieuws met een stijging van ongeveer 1,8 procent. Beide bedrijven hadden in 2025 te maken met aanzienlijke koersdalingen door andere handelsmaatregelen van Trump. De aandelen van Nvidia en AMD daalden respectievelijk ongeveer 13 en 17 procent dit jaar, mede door Trumps verbod op de export van AI-chips naar China. De Biden-regel, bekend als de AI-verspreidingsregel, gebruikte een gelaagd systeem om de hoeveelheid AI-chips te beperken die naar belangrijke handelspartners mocht worden uitgevoerd. Het doel was om chipsmokkel naar China via andere landen tegen te gaan. De regel beperkte ook sterk de mogelijkheden voor Amerikaanse bedrijven om hun AI-datacentercapaciteit in het buitenland uit te breiden. Verschuiving "Analisten waarschuwen dat een verschuiving van de AI-verspreidingsregel het eigenlijk moeilijker zou kunnen maken voor chipfabrikanten om in het buitenland zaken te doen", meldde Reuters in hun berichtgeving over de veranderingen die de Trump-administratie overweegt.
Twee handen houden een smartphone vast met daarop het homescherm van Google.
8 mei 2025
Apple onderzoekt actief hoe het zijn Safari-webbrowser kan veranderen om meer te focussen op zoekmachines met kunstmatige intelligentie (AI). Dit kan een bedreiging vormen voor de dominante positie van Google in de lucratieve zoekmarkt. De eerste tekenen hiervan werden al zichtbaar toen het aantal zoekopdrachten via Safari vorige maand voor het eerst daalde. Apple-topman Eddy Cue gaf tijdens een rechtszaak van het Amerikaanse ministerie van Justitie tegen Google-moederbedrijf Alphabet aan dat deze daling komt doordat gebruikers steeds vaker AI-tools verkiezen boven traditionele zoekmachines. Google is momenteel de standaard zoekmachine op Safari, een positie waarvoor het jaarlijks ongeveer 20 miljard dollar aan Apple betaalt. Analisten schatten dat dit bedrag overeenkomt met 36 procent van de zoekadvertentie-inkomsten die Google via Safari genereert. Slecht nieuws Het verlies van deze positie zou slecht nieuws zijn voor Google, dat al onder druk staat door felle concurrentie van AI-startups zoals OpenAI en Perplexity. Apple sloot eerder al een overeenkomst met OpenAI om ChatGPT als optie aan te bieden in Siri. Tegelijkertijd probeert Google nog voor juli een akkoord te bereiken om zijn Gemini AI-technologie in Apple-apparaten te integreren. De aankondiging had direct gevolgen voor de aandelenkoersen van beide bedrijven. Het aandeel van Alphabet daalde met 6 procent, terwijl Apple ongeveer 2 procent verloor. Beide bedrijven gaven geen reactie op vragen van Reuters over deze ontwikkeling. Veel adverteerders hebben momenteel al hun zoekadvertenties bij Google ondergebracht vanwege de bijna-monopoliepositie met een marktaandeel van 90 procent. AI-zoekaanbieders "Wij geloven dat AI-zoekaanbieders, waaronder OpenAI en Perplexity AI, uiteindelijk standaard zoekmachines zoals Google zullen vervangen. We zullen deze spelers in de toekomst als opties toevoegen aan Safari", zei Cue. "We zullen ze aan de lijst toevoegen - ze worden waarschijnlijk niet de standaardoptie."
Het IBM-logo op de zijkant van een zwarte desktop-computer.
7 mei 2025
Arvind Krishna, de hoogste baas van IBM, heeft bekendgemaakt dat kunstmatige intelligentie het werk van ongeveer tweehonderd personeelsmedewerkers heeft overgenomen. Tegelijk heeft het bedrijf meer programmeurs en verkopers aangenomen. Dit vertelde Krishna afgelopen maandag tijdens een toelichting. De uitspraken komen op een moment dat bedrijven de gevolgen van AI voor hun werknemers onderzoeken. Vooral AI-agents, zelfstandige programma's die taken kunnen uitvoeren zonder menselijke hulp, krijgen veel aandacht. Deze slimme programma's kunnen onder andere spreadsheets analyseren, onderzoek doen en e-mails opstellen. Nieuwe diensten IBM heeft deze week nieuwe diensten gelanceerd waarmee bedrijven hun eigen AI-agents kunnen maken. Deze tools helpen klanten om zelf slimme programma's te ontwikkelen die specifieke taken kunnen overnemen. Het techbedrijf investeert flink in deze nieuwe richting en heeft daarom zijn personeelsbestand aangepast. Ondanks het verlies van banen in sommige afdelingen belooft IBM dat het totale aantal werknemers zal toenemen. Het bedrijf herverdeelt zijn middelen naar functies zoals softwareontwikkeling en verkoop. Deze verschuiving past in de bredere strategie van IBM om meer te focussen op AI-diensten. Efficiënter werken "Het gebruik van AI heeft ons geholpen om efficiënter te werken, maar we hebben ook nieuwe rollen nodig om onze groeiende AI-activiteiten te ondersteunen", zei Krishna tijdens de presentatie.
MEER WEERGEVEN

Download GRATIS AI-prompts die je business helpen veranderen!

Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.

Je kunt deze krachtige tools zo downloaden.

➡️ Ga naar de producten-pagina en profiteer nu!

BRENG ME HIERHEEN

Deel dit bericht