Member 12094473 Ответов: 2

Как я могу отличить кого-то говорящего от музыки, воспроизводимой в C#, и время, в которое говорящий начал свою речь в аудиофайле


Как мне понять, в какое время музыка останавливается и кто-то начинает говорить в аудиофайле? мне нужно сделать это для приложения c#

Что я уже пробовал:

я не понимаю, как это решить .я пытался реализовать грамматику в своем коде, но как я могу вставить так много словаря в свой код, есть ли выход для этого .

2 Ответов

Рейтинг:
2

Dave Kreskowiak

На самом деле нет. Встроенные речевые библиотеки не поддерживают "диктовку". Для этого вам нужна сторонняя библиотека, например Dragon.


David_Wimbley

Добавление ссылки SDK для удобства

http://www.nuance.com/for-developers/dragon/index.htm

Рейтинг:
1

Bernhard Hiller

Это невозможно сделать с помощью современных приложений распознавания речи: они будут пытаться распознать какой-то текст из любого вида звука и выдавать тарабарщину.
Вместо этого вы должны проанализировать это сами. В конце концов, это похоже на шумоподавление. Вам нужен аудиофайл, содержащий музыку (того типа, который там воспроизводится), и аудиофайл, содержащий голос говорящего (или кого-то еще). Выполните быстрое преобразование Фурье аудиофайлов, а затем сравните результат БПФ коротких фрагментов этого исполнения с БПФ музыки и речи.