In einer neuen Version der Datenschutz-Richtlinie und Nutzungsbedingungen macht Google klar, alles Greifbare für das Training seiner KI-Modelle zu nutzen.
Respektiert der KI Crawler dann überhaupt Robots.txt?
Letzter Absatz im Artikel:
An dem Absatz ist allerdings auch spannend, dass Google keine Ausnahme zu kennen scheint. Während man verhindern kann, dass Google Webseiten und Inhalte indexiert, sieht zumindest die Datenschutzerklärung das nicht für potenzielle KI-Trainingsdaten vor. Datenschutzrechtlich dürfte das schwierig sein – als würde es eine Einwilligung zu Googles Datenschutzerklärung geben, wenn man das Internet nutzt. Urheberrechtlich scheint das Vorgehen keine Schwierigkeiten zu machen. Es sind öffentlich zugängliche Daten, die zwar genutzt werden, aber nicht gespeichert.
Letzter Absatz im Artikel: