AI-tools sporen fouten op in wetenschappelijke artikelen

Een wiskundige fout in onderzoek naar zwarte plastic keukenspatels heeft een beweging in gang gezet. Onderzoekers ontwikkelen nu AI-tools die fouten in wetenschappelijke artikelen kunnen vinden. De fout in het oorspronkelijke onderzoek suggereerde ten onrechte dat keukenspatels gevaarlijke hoeveelheden kankerverwekkende stoffen bevatten.


Het incident heeft twee projecten geïnspireerd die kunstmatige intelligentie gebruiken om fouten in wetenschappelijke literatuur op te sporen. Het Black Spatula Project is een open-source AI-tool die ongeveer 500 artikelen heeft geanalyseerd. "Het vindt nu al veel fouten. Het is een enorme lijst. Het is gewoon bizar", vertelt Joaquin Gulloso, een onafhankelijk AI-onderzoeker uit Cartagena in Colombia.


Het tweede initiatief heet YesNoError en werd geïnspireerd door het Black Spatula Project. Oprichter en AI-ondernemer Matt Schlicht stelt zich een nog groter doel. "Ik dacht, waarom gaan we niet gewoon alle artikelen controleren?", zegt Schlicht. Hun AI-tool heeft in twee maanden meer dan 37.000 artikelen geanalyseerd en markeert papers waarin het fouten heeft gevonden.


Beide projecten willen dat onderzoekers hun tools gebruiken voordat ze werk indienen bij tijdschriften. Ze hopen zo fouten en fraude in de wetenschappelijke literatuur te voorkomen. De systemen gebruiken grote taalmodellen (LLM's) om verschillende soorten fouten op te sporen. Dit omvat feitelijke onjuistheden, rekenfout, problemen in methodes en onjuiste verwijzingen.


Een grote uitdaging is het aantal valse meldingen, waarbij de AI een fout claimt die er niet is. Bij het Black Spatula Project zit de AI er in ongeveer 10% van de gevallen naast. "Het is nog vroeg, maar ik steun deze initiatieven", zegt James Heathers, een forensisch metawetenschapper aan de Linnaeus Universiteit in Växjö, Zweden. "Het is veel gemakkelijker om slordige artikelen te produceren dan om ze terug te trekken."

LAATSTE AI-NIEUWS

Een AI-robot bij het woord AI in een cirkel dat als een zon in de lucht hangt.
5 mei 2025
Kunstmatige intelligentie kan mensen in vrijwel elke rol vervangen. Deze ontwikkeling gebeurt niet door geheime plannen, maar als logisch gevolg van voortdurende verbetering. David Duvenaud, onderzoeker aan de Universiteit van Toronto, waarschuwt voor deze geleidelijke verandering met grote gevolgen. "Ik heb twintig jaar ervaring in AI-onderzoek en heb de ontwikkeling van basaal redeneren tot het oplossen van complexe wetenschappelijke problemen meegemaakt", zegt David Duvenaud. We kunnen volgens hem aannemen dat AI-systemen steeds beter zullen worden in vaardigheden die we als uniek menselijk beschouwen. Kunstmatige breinen "Deze kunstmatige breinen nemen stilletjes taken over. Eerst omdat ze goedkoper zijn, later omdat ze echt beter presteren dan mensen. Op de arbeidsmarkt zullen we dit als eerste merken. Bedrijven bevriezen aanwervingen in afwachting van betere AI-medewerkers. Steeds meer werk zal bestaan uit het accepteren van voorstellen van behulpzame AI-assistenten." Ook buiten het werk verandert alles, voorspelt hij. "AI-systemen blijken sociaal vaardig, tactvol en geduldig. Mensen hebben nu al romantische AI-partners. Onze vrienden en familie zullen steeds meer aan hun schermen gekluisterd zijn, in gesprek met virtuele metgezellen." Charmante argumenten "Het meest verontrustende is dat dit allemaal redelijk lijkt", waarschuwt Duvenaud. "De AI-systemen waarop duizenden mensen nu al verliefd worden, zullen overtuigende en charmante argumenten maken. Ze zullen uitleggen waarom onze verminderde relevantie eigenlijk vooruitgang is. Mensen worden uiteindelijk misschien irrelevant, zonder dat iemand dit ooit bewust heeft gepland."
Mobiele telefoons tegen een paarse achtergrond met html-code op het scherm.
5 mei 2025
Anysphere, het bedrijf achter de populaire programmeerassistent Cursor, heeft een enorme investeringsronde afgesloten. Hiermee stijgt de waarde van het bedrijf naar ongeveer 9 miljard dollar. Deze waardering is meer dan drie keer zo hoog als bij de vorige investeringsronde begin dit jaar. De nieuwe financieringsronde bracht 900 miljoen dollar op, met Thrive Capital als belangrijkste investeerder. Andreessen Horowitz en Accel namen ook deel aan deze investering. Het in San Francisco gebaseerde bedrijf werd opgericht door vier jonge ondernemers die elkaar leerden kennen tijdens hun studie aan het Massachusetts Institute of Technology. Natuurlijk taal "Door natuurlijke taal te gebruiken om de AI te vertellen wat te maken in plaats van handmatig code te schrijven, verhoogt het de productiviteit voor programmeurs", legt het bedrijf uit over zijn product. Deze aanpak is zeer succesvol gebleken. De jaarlijkse inkomsten van Anysphere stegen snel tot ongeveer 200 miljoen dollar in april van dit jaar. Cursor heeft miljoenen fans onder computerprogrammeurs dankzij zijn AI-gestuurde ontwikkelaarstools. Volgens de makers van de app schrijft hun systeem elke dag bijna 1 miljard regels werkende code. Bekende techbedrijven zoals Stripe, OpenAI en Spotify behoren tot de klanten van Cursor, ondanks concurrentie van tools zoals Microsoft's GitHub Copilot. Vibes "Je geeft je volledig over aan de vibes, omarmt exponentiële groei en vergeet dat de code zelfs bestaat", zei Andrej Karpathy, een voormalig Tesla- en OpenAI-ingenieur, over het gebruik van Cursor. Hij bedacht de term 'vibe coding' om deze bijna trance-achtige staat van programmeren met AI-assistentie te beschrijven.
De Google-browser weergegeven op een computerscherm.
4 mei 2025
Google kan zijn AI-producten voor zoekopdrachten trainen met inhoud van websites, zelfs wanneer uitgevers hebben gekozen om niet deel te nemen aan Google's AI-training. Dit bleek vrijdag tijdens een rechtszitting toen Eli Collins, een vice-president bij het bedrijf, hierover getuigde. Collins, een DeepMind vice-president, legde uit dat Google's opt-out controles voor uitgevers alleen betrekking hebben op werk van Google DeepMind, het AI-laboratorium van het bedrijf. Andere afdelingen binnen Google kunnen de modellen verder trainen voor hun eigen producten. Zoekafdeling Toen Diana Aguilar, een advocaat van het Amerikaanse ministerie van Justitie, vroeg of de zoekafdeling van Google toegang heeft tot gegevens waar uitgevers geen toestemming voor hadden gegeven, antwoordde Collins bevestigend: "Correct — voor gebruik in zoeken." Uitgevers kunnen alleen weigeren dat hun gegevens worden gebruikt in zoek-AI als ze zich volledig afmelden voor indexering in zoekmachines. Google verduidelijkte dit met de uitspraak: "Google heeft een aparte manier voor uitgevers om hun inhoud in Zoeken te beheren via de gevestigde robots.txt webstandaard." Dit betreft een bestand in websites dat bots vertelt of ze een site mogen doorzoeken. Tokens Volgens een document dat tijdens de rechtszaak werd getoond, verwijderde Google 80 miljard van de 160 miljard 'tokens' (stukjes inhoud) nadat het materiaal had gefilterd waarvoor uitgevers geen toestemming hadden gegeven. "De 80 miljard van de 160 miljard tokens, 50% wordt verwijderd door uitgevers die zich afmelden?" vroeg rechter Amit Mehta ter verduidelijking. "Dat is correct", bevestigde Collins.
MEER WEERGEVEN

Download GRATIS AI-prompts die je business helpen veranderen!

Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.

Je kunt deze krachtige tools zo downloaden.

➡️ Ga naar de producten-pagina en profiteer nu!

BRENG ME HIERHEEN

Deel dit bericht