Google hat die Einführung von „Google-Extended“ angekündigt, einer neuen Kontrolloption für Web-Publisher, mit der sie steuern können, ob ihre Websites zur „Verbesserung“ der generativen APIs von Bard- und Vertex-AI sowie zukünftiger Modelle beitragen sollen.
Darüber kann man also recht einfach festlegen, ob die AI- bzw. KI-Modelle mit dem eigenen Content trainiert werden dürfen oder nicht. Google-Extended wird in der robots.txt platziert. Es gibt laut Google dafür keinen separaten User-Agent-String für HTTP-Anfragen. Das Crawling erfolgt mit den bestehenden Google User-Agent-Strings.