Голоса, которых нет в датасетах: искусственный интеллект стирает языковое разнообразие английского
Современные генеративные ИИ обучаются примерно на 90 % на английском языке — но не на всех его формах. Как показывает исследование Bender et al. (2021), подавляющее большинство данных поступает из …
