Která data poskytovat umělé inteligenci typu OpenAI?

Obrovské množství dat slouží k tréninku umělé inteligence (LLM). Je ale dobré ji poskytovat skutečně vše? Zatímco v USA se boti jen tak nedostanou až ke třetině největších stránek, u nás jsou blokována pouhá 3 % webových stránek (většinou jde o stránky tuzemských médií). Existuje správný přístup? A je to nějak zákonně ošetřeno? 

Více si přečtete zde.