Перейти к публикации

Распознавание голоса


Clevelus

Рекомендованные сообщения

Создам отдельную тему, так как ее нет в теме АТС.

В начале сентября Задарма запустила эту функцию. И это классно (учитывая, что будет ее развивать).

Не могу найти стоимость (в тарифные планы минуты включили, это есть), весь сайт перерыл - нет стоимости.

Также появились некоторые вопросы.

При включении функции распознавания на номере (как «по запросу» так и «всегда») звуковой файл записи меняется? Детально не тестировал, но исходя из описания, получается что он становится «стерео», где каждый из участников пишется в свой канал стерео? Это здорово если так, но тогда должны быть «правила», кто на левом канале, а кто на правом?

А что будет с этим файлов при конференциях? Число каналов в файле будет по числу участников? Тогда этот файл можно будет проиграть в любом плеере нормально? 

Будет ли распознавание «на лету»? По сути писал об этом тут: https://forum.zadarma.com/index.php?app=forums&module=forums&controller=topic&id=3251
Не все могут нажимать цифры, но большинство может их говорить (как и слова «оператор», «баланс») ... Учитывая, что у Задарма уже в худах есть реализация работы с IVR -все это вместе даёт много возможностей (как минимум повторить возможности «Скайпа для бизнеса» при интеграции с телефонией), в перспективе бесконечные ... А если учесть что все идёт с сторону ботов и автоматизации ...

Ссылка на комментарий

Спасибо за вопросы, постараюсь ответить на все:

Цитата

И это классно (учитывая, что будет ее развивать).

Не могу найти стоимость (в тарифные планы минуты включили, это есть), весь сайт перерыл - нет стоимости.

Да, развивать будем, в том числе после анонса доп функционала создадим отдельную страницу с подробным описанием и стоимостью.

На сейчас стоимость указана в настройках при попытке включения. Стоимость зависит от языка и указана при выборе языка.

 

4 часа назад, Clevelus сказал:

При включении функции распознавания на номере (как «по запросу» так и «всегда») звуковой файл записи меняется?

Да пишется 2 канала, файл записывается не в mp3  а уже в ogg. Это позволяет не потерять данных разговора при сжатии и лучше его распознать. На сейчас все плееры и браузеры умеют воспроизводить ogg. Правда некоторые crm такое не смогли и для них дублируем в mp3.

4 часа назад, Clevelus сказал:

А что будет с этим файлов при конференциях? Число каналов в файле будет по числу участников? Т

Насколько знаю нет, с большим количеством каналов по моему никто не работает. Но вопрос интересный, передал разработчикам. На сейчас 99% что будет 2 канала - владелец внутреннего номера (у которого включено распознавание) и все остальные.

 

4 часа назад, Clevelus сказал:

Будет ли распознавание «на лету»?

Да это также будет,  надеюсь очень скоро.

Ссылка на комментарий

При выборе распознавания есть вариант «автоматически». А как оно работает?

Пример: конференция на троих: заказчик + клиент + переводчик. В результате клиент и переводчик попадают в один канал (пока непонятно плохо это или нет), по всей видимости. Но языка два. Точнее в канале заказчика и клиента язык один (хотя из вежливости могут быть простые слова сказаны и на другом языке, спасибо, досвидания ...) и они разные, а в канале переводчика сразу два языка ...

Но очень интересно как будет работать на лету. Особенно в связке с IVR и все по API ...

Ссылка на комментарий

О! Алгоритм понятен ...
Все эти моменты неплохо бы отразить в справке (когда она появится).

Но приходится разговаривать с московскими номерами с иностранцами (в некоторых компаниях директора и топ менеджеры не говорят по русски).
Хотя конечно такой сценарий не массовый, хотя часто говорят на разных сленгах ...

Получается, если не указать язык принудительно, распознавать нормально не будет.

Но и указать его принудительно не получится, если используется сразу два языка ...

Есть над чем подумать разработчикам. )) 
Лиха беда начало.

Ссылка на комментарий

Если один оператор использует в разговорах с одной и той-же страной несколько языков, пока единственный вариант это включить "запись для выборочного распознавания" и выбирать язык при распознавании каждого звонка.

Универсального способа это обойти думаю нет, все равно надо как-то чтобы передавалась информация о языке. Если будет спрос именно на такие случаи, придумаем варианты (как минимум в webrtc и в наших приложениях это можно встроить при звонке).

Ссылка на комментарий

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас
×
×
  • Создать...