Использование голосовых технологий всегда представлялось компаниям, массово работающим с физическими лицами, перспективным направлением деятельности. Однако до недавнего времени использование таких технологий было ограничено рядом факторов.
С одной стороны, промышленное решение, работающее с «голосом», должно использовать всю мощь математического аппарата – искусственные нейронные сети, алгоритмы машинного обучения, построение вероятностных моделей и т.д. С другой стороны, поддержка работоспособности такого математического аппарата требовала определенных аппаратных мощностей.
В связи с этим, еще 5-10 лет назад вендоры были вынуждены идти на компромиссы, подменяя наиболее эффективные методы и алгоритмы менее требовательными, но и менее трудоемкими. Например, вынужденно отказываться от использования искусственных нейронных сетей в пользу статистического моделирования.
Очевидно, что наука и техника не стоят на месте. Аппаратное обеспечение становится мощнее, а его стоимость – более доступной. Современное развитие технологий сделало экономически выгодным решение задач распознавания голоса путем использования алгоритмов машинного обучения и искусственных нейронных сетей. Это означает, что размер словаря поддерживаемых слов в современных системах вырос ориентировочно в 30 раз, а сама система распознавания речи стала обучаемой.
В современные голосовые технологии можно выделить три основных блока:
- «Голосовая биометрия» (верификация) – подтверждение личности по голосу.
-
«Транскрибация» – преобразование речи в текст.
-
«Семантический анализ» – распознавание смысла произнесенных фраз.
Программное обеспечение швейцарской компании SPITCH, официальным представителем и дистрибьютером которой в России и странах СНГ является компания BSS, имеет в своем арсенале решения для каждого такого блока:
- Spitch VeryFI (подтверждение личности по голосу).
-
Spitch CodyFI (автоматическое преобразование речи в текстовую запись).
-
Spitch SignyFI (определение смысла речи и выделение смысловых тэгов).
Все технологии могут работать как независимо, так и в связке друг с другом.
Какие бизнес-задачи решаются с помощью голосовых технологий?
Спектр задач, решение которых с помощью голосовых технологий становится более эффективным, достаточно широк.
Для крупных компаний с большим количеством специалистов в контакт-центрах специализирующихся на разных вопросах абсолютным хитом является построение интеллектуального голосового IVR (Interactive Voice Response). Ответив только на один вопрос: «Чем мы можем Вам помочь?», звонящий сразу попадает на оператора по интересующей его тематике.
Голосовые технологии позволяют поддерживать исходящие обзвоны клиентов, с целью выявления их лояльности (NPS) или удовлетворенностью качеством недавно оказанной услуги (SCI).
Ну и, конечно же, голосовые технологии незаменимы для построения полноценных сервисов самообслуживания. Для использования таких сервисов не требуется привлечение сотрудника компании (оператора контакт-центра, консультанта и т.д.).
Наибольший интерес подобные сервисы вызывают у банков.
Сервисы самообслуживания могут информировать клиентов об открытой информации, которая обычно публикуется на сайтах банков: курсы валют, местонахождение банкоматов, графики работы ближайших отделений и т.д.
После прохождения упрощенной верификации (сравнении голоса звонящего с имеющимся в банке голосовым слепком) возможно проведение пассивных операций: предоставление информации о состоянии баланса, сумме задолженности, ближайшем сроке оплаты по кредиту и т.д.
И, наконец, после похождения полной верификации (когда клиента попросят произнести случайный набор слов или ключевое слово) возможно предоставление активных сервисов: блокировка карты, перевод средств по шаблонам, оплата услуг и т.д.
Стоит отметить, что верификация пользователя при использовании программного обеспечения SPITCH может производиться в фоновом режиме. Для точной идентификации нужен «слепок голоса» и примерно 10 секунд речи человека для сравнения со слепком. Для повышения безопасности, в случаях, когда клиент может оказаться под принуждением, возможно использование стоп-слов, что позволит заблокировать исполнение операций.
Выгоды использования голосовых технологий
Компания или банк, внедривший в процессы обслуживания своих клиентов голосовые технологии, получает прямые выгоды:
- экономия на номере 8-800 за счет сокращения времени пребывания клиента в IVR;
-
90% обращений клиентов могут быть обработаны автоматически, что позволяет существенно сократить время работы операторов;
-
повышение коэффициента First call resolution – интеллектуальный IVR перенаправляет клиента сразу к нужному специалисту;
-
сокращение времени верификации клиента.
Кроме прямых выгод, есть еще и очевидные выгоды для имиджа:
- повышение уровня удовлетворенности и лояльности клиентов из-за упрощения и сокращения процедуры предоставления услуг;
-
увеличение клиентской базы за счет использования «WOW-технологии» («Ого, как круто!» – это первая фраза, которая приходит в голову человеку, столкнувшемуся с успешным использованием голосовых технологий).
Почему SPITCH?
Компания SPITCH базируется в Цюрихе (Швейцария) и тесно сотрудничает с Лабораторией языковых технологий Швейцарской Высшей Технической школы и Институтом компьютерной лингвистики Университета Цюриха. Компетенции специалистов по языковым технологиям страны с четырьмя государственными языками оказались крайне полезны при разработке технологий SPITCH.
В команде SPITCH работают специалисты, накопившие свой опыт в Nuance, Google и Яндекс.
В настоящий момент решения SPITCH поддерживают 5 языков: русский, английский, немецкий (включая его швейцарский диалект), французский и итальянский. На очереди – испанский язык.
Двадцатилетний опыт работы компании BSS на рынке дистанционного банковского обслуживания и квалификация уникальных специалистов SPITCH позволяют предложить российскому рынку решения, базирующиеся на по-настоящему современных голосовых технологиях.