ГлавнаяНовостиSpeechmatics привлекает 62 миллиона долларов для инклюзивного распознавания речи

Speechmatics привлекает 62 миллиона долларов для инклюзивного распознавания речи

распознавание речи, программное обеспечение, технологии, диалект, голос, акцент, языковые технологии, искусственный интеллект

Было показано, что технология Speechmatics, основанная в Кембридже, лучше распознает диалекты расовых меньшинств, чем программное обеспечение для распознавания речи от Google и Amazon.
Согласно Speechmatics, программное обеспечение компании, как было показано, распознает голоса афроамериканцев с точностью 82,8% по сравнению с программами Google и Amazon, которые имеют точность 68,6%.

С учетом того, что в языковые технологии, ориентированные на инклюзивность, были вложены десятки миллионов долларов, похоже, что отрасль проявляет дальнейший интерес к разработке технологий для десятков уникальных акцентов и вариантов, а не только отдельных языков.

Благодаря достижениям в области искусственного интеллекта создание разнообразного программного обеспечения для распознавания речи занимает меньше времени, чем это было в начале. Согласно заявлению Speechmatics от 27 июня, программное обеспечение для распознавания речи исторически требовало обучающих данных, которые были аннотированы вручную — это часто ограничивало их набором стандартизированных и «коммерчески ценных» дикторов. Однако в настоящее время в этом больше нет необходимости, что позволяет разработчикам обучать механизмы преобразования речи в текст на гораздо более широком наборе данных, не зависящем от возраста, пола или диалекта.

12.07.2022