прошивкой, как реализовать диаризации дикторов (которые говорят)?
Я пытаюсь обнаружить голос человека из аудиофайла, который говорит?
Я бы исследование и обнаружили, что "диаризации дикторов" будет работать, но я не знаю как использовать это в iOS?
На самом деле мое требование таково
Person1 говорит "Привет", а затем сохраняет "Person1" в БД
Person2 говорит "Привет", а затем сохраняет "Person2" в БД
Person1 говорит "Привет", затем идентифицирует, что это голос" Person1", и возвращает" Person1 " из БД.
Но звучит для меня сложно, поэтому я решил пока обнаружить людей из аудиофайла.
Пожалуйста, дайте несколько идей для этого. Заранее большое спасибо.
Что я уже пробовал:
У меня есть реализованный механизм речи в iOS 10