Member 13239997 Ответов: 3

Как я могу использовать azure speaker recognition API в C#


Привет. Я студент, занимающийся проектом, связанным с голосом, с помощью c#.

Я уже использовал Azure Bing Speech API и Google Cloud Speech API, чтобы получить голос людей в виде текста.

Но мне также нужен Azure Speaker Recognition API для идентификации и проверки отдельных динамиков с помощью голоса.

Тем не менее, существует не так много информации об этом API, даже несмотря на поиск Google. А сайт Azure(особенно та его часть, которая идентифицирует и проверяет динамик с помощью wav-файла, содержащего голос пользователя) настолько прост..
поэтому я не могу знать, как загрузить wav-файл для идентификации и проверки динамика в коде c#.

Вы использовали API распознавания динамиков Azure?

Пожалуйста. Помоги мне.

Что я уже пробовал:

ниже приведен пример кода на сайте Azure.
https://westus.dev.cognitive.microsoft.com/docs/services/563309b6778daf02acc0a508/operations/5645c725ca73070ee8845bd6

статические асинхронные недействительными функции makerequest()
{
var client = новый HttpClient();
var queryString = HttpUtility.ParseQueryString(строка.Пустой);

// Заголовок запроса
клиент.DefaultRequestHeaders.Добавить("ОВП-Апим-подписка-ключ", "подписка-ключ");
// Параметр запроса
queryString["shortAudio"] = "true";
ВАР Ури = "https://westus.api.cognitive.microsoft.com/spid/v1.0/identify?identificationProfileIds={identificationProfileIds}&" + строка запроса;

HttpResponseMessage ответ;

// Тело запроса
byte[] byteData = Encoding.UTF8.Метод getbytes("{тело}");

использование (var content = new ByteArrayContent(byteData))
{
содержание.Заголовки.ContentType = new MediaTypeHeaderValue("application/json");
ответ = ожидание клиента.PostAsync(uri, content);

}

}

3 Ответов

Рейтинг:
2

Member 13239997

да, это так. Но речь идет о распознавании речи , но я хочу знать о распознавании говорящего.

Рейтинг:
2

Member 14137469

Используй что-нибудь другое. У Microsoft нет кода для этого, и я считаю, что это тупик. Я искал хороший пример в течение 3 лет, но безрезультатно.

Может быть, попробовать AWS. Alexa уничтожила все, что было от MS, Apple и Google. AWS должен иметь гораздо лучшие API. Я проверяю это прямо сейчас.


Рейтинг:
2

Pete O'Hanlon

Я подозреваю, что у вас есть проблема с тем фактом, что вы, кажется, думаете, что часть {тела} буквально означает, что это то, что вы вставляете. То, что вы должны кодировать здесь, - это фактический звук, который вы хотите передать в API. Не забудьте правильно установить такие параметры, как идентификационный профиль, образец кода там не предназначен для использования "как есть".


Member 13239997

Да. Этот код-всего лишь пример кода с сайта Azure.
И в конце концов я использовал API распознавания динамиков.
Я читаю readme дальше https://github.com/Microsoft/Cognitive-SpeakerRecognition-Windows и применил этот пример.
спасибо.

Member 13860438

Как вы добавляете аудиофайл в часть тела? И какие еще изменения должны быть внесены в Кодекс?