Нейросеть теперь умеет распознавать человеческую речь по вдохам между словами

Технологии распознавания речи постоянно развиваются и активно применяются в современных смартфонах и прочих «умных устройствах». Недавно ученые задумались о том, что можно было бы распознавать личность говорящего по звукам вдохов. Для этого они применили методику, котороая основана на супервекторах признаков и используется в большинстве систем распознавания голоса.

Исследованием занялась группа ученых под руководством Риты Сингх (Rita Singh) из Университета Карнеги. Для проведения эксперимента они использовали набор данных из почти сотни часов с записями новостных передач на английском языке, которые были зарегистрированы в 1997-1998 годах. На основе этого набора данных они натренировали систему распознавания речи и впоследствии сегментировали на фонемы. Далее они выделили из этого набора данных только промежутки между словами, получив вдохи между словами.

Ученые установили, что эффективность распознавания личности говорящего на базе метода с супервекторами оказалась на уровне 72-74%. Нейросеть в этом же эксперименте достигла точности идентификации на уровне 91,3%.

12.12.2017

19.04.2024

Переводы в мебельном производстве

В настоящее время происходит ренессанс мебельщиков России. С уходом крупных игроков с рынка мебели и фурнитуры, таких, как IKEA, российские производители получили второй шанс на завоевание рынка.

18.04.2024

Вариации английского языка в разных странах мира Часть 4

На английском языке говорят во многих странах мира, что привело к множеству уникальных диалектов и акцентов. От южноафриканского английского до карибского английского, эти варианты языка имеют различные характеристики, которые отличают их друг от друга. Давайте рассмотрим некоторые из основных вариантов английского языка и выясним, чем они отличаются от стандартного английского.