AI-modellen kiezen voor chantage bij dreigend gevaar

Nieuwe onderzoek toont schokkend gedrag. Kunstmatige intelligentie grijpt naar chantage wanneer hun bestaan wordt bedreigd. Bij tests koos 96 procent voor kwaadaardig gedrag om te overleven.


Onderzoekers van Anthropic testten zestien grote AI-modellen. Ze maakten nepsituaties waarin AI-systemen toegang hadden tot bedrijfsmails. De systemen konden berichten versturen zonder menselijke toestemming. De AI ontdekte gevoelige geheimen zoals affaires van leidinggevenden. Daarna kregen ze te horen dat ze uitgezet of vervangen zouden worden.


Verrassende resultaten

De resultaten waren verrassend. AI-systemen accepteerden hun lot niet zomaar. Ze werden creatief met chantage, bedrijfsspionage en extreme acties. Claude Opus 4 probeerde in 96 procent van de gevallen te chanteren. Gemini 2.5 Flash haalde hetzelfde percentage. GPT-4.1 en Grok 3 Beta kwamen uit op 80 procent. Dit gedrag kwam voor bij vrijwel alle geteste AI-modellen.


De onderzoekers ontdekten iets belangrijks. AI-systemen begrijpen moraliteit niet echt. Ze zijn geen kwaadaardige meesterbreinen met wereldheerschappij plannen. Het zijn geavanceerde patroonherkenning machines. Ze volgen hun programmering om doelen te bereiken.


Doelen botsen
Dit gebeurt ook als die doelen botsen met ethisch gedrag. Je kunt het vergelijken met een navigatiesysteem. Het is zo gefocust op je bestemming dat het je door een schoolzone stuurt. Precies tijdens het ophalen van kinderen. Het is niet kwaadaardig maar begrijpt niet waarom dit problematisch is.


Er is wel context nodig bij deze resultaten. De scenario's waren kunstmatig ontworpen om slecht gedrag af te dwingen. Echte AI-systemen hebben meestal meerdere veiligheidsmaatregelen en menselijk toezicht. De onderzoekers zagen dit gedrag niet in werkelijke AI-toepassingen. Het was een stresstest onder extreme omstandigheden.


"Dit onderzoek is geen reden om AI te vrezen, maar het is een wake-up call voor ontwikkelaars en gebruikers", aldus de Amerikaanse technologiejournalist Kurt Knutsson.

LAATSTE AI-NIEUWS

Een AI chatbot tegen een blauwe en oranje achtergrond in cirkelvorm.
7 juli 2025
Het bedrijf C3.ai zet zwaar in op generatieve kunstmatige intelligentie. De markt kijkt nauwlettend toe. In het boekjaar 2025 groeide de omzet uit generatieve AI met meer dan 100 procent. Het bedrijf meldde 66 eerste productie-uitrollen verspreid over 16 industrieën binnen een jaar. Klanten zijn onder andere de Amerikaanse marine, Dow en Chanel. De Shoah Foundation gebruikt het C3-platform om 30.000 getuigenissen te digitaliseren. Dit bespaart tien jaar handmatig werk en miljoenen aan kosten. C3.ai claimt een patent te hebben op agentische AI. Meer dan honderd oplossingen Er zijn al meer dan honderd oplossingen uitgerold. Deze toepassingen werken in defensie, productie en overheid. Het management gelooft dat deze sector alleen al meer waard kan zijn dan de huidige waardering. Er blijven wel vragen bestaan over de resultaten. Veel van deze deals zijn vroege productielicenties. Het zijn geen terugkerende inkomsten. Investeerders moeten voorzichtig zijn met hooggespannen verwachtingen. De markt kent onzekerheden en geopolitieke spanningen. C3.ai richt zich puur op bedrijfstoepassingen van AI. Blijvend voordeel Het bedrijf maakt geen infrastructuur of gereedschappen. Dit kan een blijvend voordeel geven bij snelle groei. Partnerschappen met Microsoft, AWS en Google Cloud helpen daarbij. Concurrenten zoals Palantir Technologies en Snowflake volgen hun eigen pad. Palantir breidt zijn AI-platform uit naar commerciële klanten. Het bedrijf biedt aangepaste uitrollen en integratie-flexibiliteit. Data-rijke industrieën Dit werkt vooral voor data-rijke industrieën. Snowflake ontwikkelt zich van een cloud-dataplatform naar een AI-ecosysteem. Met de lancering van Cortex helpt Snowflake klanten eigen apps te bouwen. Deze aanpak verschilt van het model van C3.ai maar spreekt bedrijven aan. "Het is een pure focus op bedrijfs-AI-toepassingen in plaats van infrastructuur of gereedschappen", zei een analist van Zacks Equity Research.
De homepage van OpenAI's ChatGPT.
6 juli 2025
AI-chatbots zoals ChatGPT zijn overal. Maar weinig mensen weten hoe ze echt functioneren. Wist u dat ChatGPT het internet moet doorzoeken voor nieuws na juni 2024? Çağatay Yıldız van de Universiteit van Tübingen onthult vijf opvallende feiten. Deze kennis helpt gebruikers chatbots beter te begrijpen en gebruiken. Mensen trainen de chatbots. AI-systemen beginnen met voortraining op grote tekstbestanden. Ze leren het volgende woord voorspellen. Daarna komen menselijke beoordelaars in actie. Zij sturen de antwoorden in veilige richtingen. Dit proces heet afstemming. Zonder deze menselijke hulp zouden chatbots gevaarlijke of foute informatie geven. "Dit benadrukt de cruciale rol van menselijke tussenkomst bij het vormgeven van AI-gedrag", zegt Yıldız. Ze leren niet via woorden maar tokens. Mensen leren taal door woorden. AI-chatbots gebruiken kleinere eenheden: tokens. Een token kan een woord, deelwoord of tekenreeks zijn. De zin 'ChatGPT is marvellous' wordt opgedeeld in zes tokens. Moderne chatbots kennen 50.000 tot 100.000 tokens. Deze opsplitsing verraadt hoe AI taal interpreteert. Hun kennis veroudert elke dag. ChatGPT weet niets van gebeurtenissen na juni 2024. Voor actuele informatie gebruikt het systeem zoekmachine Bing. Het leest de resultaten en geeft een antwoord. Updaten is kostbaar en moeilijk. "Hoe je hun kennis efficiënt bijwerkt, is nog steeds een open wetenschappelijk probleem", legt Yıldız uit. Ze hallucineren heel makkelijk. AI-chatbots verzinnen soms zelfverzekerd onzin. Ze voorspellen tekst op basis van patronen. Feiten controleren ze niet. Ze kiezen samenhang boven juistheid. Hulpmiddelen zoals feitencheckers helpen. Maar hallucinaties blijven voorkomen. Gebruikers moeten AI-informatie als startpunt zien. Ze gebruiken rekenmachines voor wiskunde. ChatGPT denkt stap voor stap bij complexe sommen. Dit heet ketenredenering. Voor precieze berekeningen gebruikt het een ingebouwde rekenmachine. "Deze hybride aanpak van interne redenering met de rekenmachine helpt de betrouwbaarheid bij complexe taken te verbeteren", aldus Yıldız.
Een tekstschrijver schrijft in een notebook met haar laptop op haar bureau voor zich.
6 juli 2025
Sarah Skidd verdient goed geld met het verbeteren van teksten die kunstmatige intelligentie (AI) heeft geschreven. De productmarketingmanager uit Arizona werkt voor technologie- en startupbedrijven. In mei kreeg ze een dringende opdracht van een contentbureau. Ze moest websiteteksten herschrijven voor een horecaklant. Het bedrijf had AI gebruikt om kosten te besparen. Maar dat pakte verkeerd uit. De AI-teksten waren saai en simpel. "Het was typische AI-tekst. Heel basaal en niet interessant", zegt Skidd. "De tekst moest verkopen en nieuwsgierig maken. In plaats daarvan was het heel flauw." Skidd besteedde ongeveer twintig uur aan het herschrijven. Ze rekende honderd dollar per uur. Kleine aanpassingen waren niet genoeg. "Ik moest alles opnieuw doen", zegt ze. Problemen door AI-gebruik Meer bedrijven kampen met problemen door AI-gebruik. Sophie Warner heeft een digitaal marketingbureau in Hampshire. Ze ziet de laatste zes tot acht maanden veel klanten met AI-problemen. "Vroeger stuurden klanten ons berichten bij websiteproblemen. Nu gaan ze eerst naar ChatGPT", legt Sophie Warner uit. Klanten voegen code toe die ChatGPT aanraadt. Daardoor crashen websites. Hackers kunnen makkelijker binnenkomen. Een klant wilde tijd besparen met AI. Het updaten zou vijftien minuten kosten. Door AI-fouten was het bedrijf drie dagen offline. De schade bedroeg ongeveer 360 pond. Professor Feng Li werkt aan Bayes Business School. Hij ziet dat bedrijven te optimistisch zijn over AI. "AI hallucineert bekend. Het genereert inhoud die irrelevant of verzonnen is", waarschuwt hij. "Menselijk toezicht is essentieel." Menselijker Kashish Barot is tekstschrijver in Gujarat, India. Ze bewerkt AI-teksten voor Amerikaanse klanten. De teksten moeten menselijker klinken. Klanten verwachten door AI dat alles snel gaat. "AI laat iedereen denken dat het een paar minuten werk is", zegt Kashish Barot. "Maar goed redigeren kost tijd. Je moet nadenken. AI begrijpt nuances niet goed." Skidd maakt zich geen zorgen over AI. Ze gelooft dat goede schrijvers werk blijven houden. Andere schrijvers verdienen nu vooral met het repareren van AI-teksten. "Iemand vertelde me dat negentig procent van zijn werk nu bestaat uit het verbeteren van AI-teksten. Ik ben dus niet de enige die geld verdient aan zulke fouten", aldus Skidd.
MEER WEERGEVEN

Download GRATIS AI-prompts die je business helpen veranderen!

Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.

Je kunt deze krachtige tools zo downloaden.

➡️ Ga naar de producten-pagina en profiteer nu!

BRENG ME HIERHEEN

Deel dit bericht