
Apple сообщила о работе над исправлением своего инструмента преобразования речи в текст после того, как пользователи обнаружили странную ошибку: когда они произносили слово «расист» на своих iPhone, система транскрибировала его как «Трамп».
Технологический гигант предположил, что проблема в службе диктовки была вызвана трудностями различения слов с буквой «р».
«Мы знаем о проблеме с моделью распознавания речи, на которой работает Dictation, и сегодня мы выпускаем исправление», — заявил представитель Appl
e.Однако эксперты в области распознавания речи подвергли сомнению это объяснение. Питер Белл, профессор речевых технологий в Эдинбургском университете, назвал объяснение компании «просто неправдоподобным» и предположил, что более вероятно произошло намеренное изменение базового программного обеспечения инструмента.
В сети появились видеозаписи, демонстрирующие работу инструмента «Диктант». В некоторых случаях слово «расист» транскрибировалось правильно, но в других превращалось в «Трамп», прежде чем система быстро исправляла его на правильный вариант. BBC не удалось воспроизвести эту ошибку, что может свидетельствовать о том, что исправление Apple уже вступило в силу.
Профессор Белл отметил, что объяснение Apple о фонетическом сходстве лишено смысла, поскольку эти два слова недостаточно похожи, чтобы запутать современную систему искусственного интеллекта. Он пояснил, что модели распознавания речи обучаются на основе аудиозаписей реальной речи с точной транскрипцией и учатся понимать слова в контексте. Например, система может различать похожие по звучанию слова в зависимости от контекста фразы.
По мнению профессора, ситуация с Apple вряд ли является настоящей ошибкой в данных, поскольку английская языковая модель компании обучается на сотнях тысяч часов речи, что должно обеспечивать высокий уровень точности. Он отметил, что подобные проблемы могут возникать при работе с «менее обеспеченными ресурсами языками», но не с английским.
Этот инцидент вызывает вопросы о возможном вмешательстве в работу алгоритмов распознавания речи и о том, насколько надежны современные системы ИИ при обработке потенциально чувствительного контента. Пользователи всё чаще обращают внимание на подобные ошибки, что заставляет технологические компании более тщательно контролировать работу своих инструментов ИИ.