Google traint AI voor zoekresultaten met webinhoud ondanks opt-outs van uitgevers

Google kan zijn AI-producten voor zoekopdrachten trainen met inhoud van websites, zelfs wanneer uitgevers hebben gekozen om niet deel te nemen aan Google's AI-training. Dit bleek vrijdag tijdens een rechtszitting toen Eli Collins, een vice-president bij het bedrijf, hierover getuigde.
Collins, een DeepMind vice-president, legde uit dat Google's opt-out controles voor uitgevers alleen betrekking hebben op werk van Google DeepMind, het AI-laboratorium van het bedrijf. Andere afdelingen binnen Google kunnen de modellen verder trainen voor hun eigen producten.
Zoekafdeling
Toen Diana Aguilar, een advocaat van het Amerikaanse ministerie van Justitie, vroeg of de zoekafdeling van Google toegang heeft tot gegevens waar uitgevers geen toestemming voor hadden gegeven, antwoordde Collins bevestigend: "Correct — voor gebruik in zoeken."
Uitgevers kunnen alleen weigeren dat hun gegevens worden gebruikt in zoek-AI als ze zich volledig afmelden voor indexering in zoekmachines. Google verduidelijkte dit met de uitspraak: "Google heeft een aparte manier voor uitgevers om hun inhoud in Zoeken te beheren via de gevestigde robots.txt webstandaard." Dit betreft een bestand in websites dat bots vertelt of ze een site mogen doorzoeken.
Tokens
Volgens een document dat tijdens de rechtszaak werd getoond, verwijderde Google 80 miljard van de 160 miljard 'tokens' (stukjes inhoud) nadat het materiaal had gefilterd waarvoor uitgevers geen toestemming hadden gegeven. "De 80 miljard van de 160 miljard tokens, 50% wordt verwijderd door uitgevers die zich afmelden?" vroeg rechter Amit Mehta ter verduidelijking. "Dat is correct", bevestigde Collins.
LAATSTE AI-NIEUWS


Download GRATIS AI-prompts die je business helpen veranderen!
Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.
Je kunt deze krachtige tools zo downloaden.
➡️ Ga naar de producten-pagina en profiteer nu!