Нефть и песок О стали Компрессор - подбор и ошибки Из истории стандартизации резьб Соперник ксерокса - гектограф Новые технологии производства стали Экспорт проволоки из России Прогрессивная технологическая оснастка Цитадель сварки с полувековой историей Упрочнение пружин Способы обогрева Назначение, структура, характеристики анализаторов Промышленные пылесосы Штампованные гайки из пружинной стали Консервация САУ Стандарты и качество Технология производства Водород Выбор материала для крепежных деталей Токарный резец в миниатюре Производство проволоки Адгезия резины к металлокорду Электролитическое фосфатирование проволоки Восстановление корпусных деталей двигателей Новая бескислотная технология производства проката Синие кристаллы Автоклав Нормирование шумов связи Газосварочный аппарат для тугоплавких припоев
Главная страница / Архитектура отрасли

Распознавание речи - IVR



Сегодня в IVR-платформах нуждаются крупные корпорации, например, мобильные операторы и сервис-провайдеры с абонентской базой в сотни тысяч и миллионы абонентов. В таких системах количество каналов связи составляет десятки и сотни, а интенсивность звонков достигает сотен и тысяч в минуту.

Перспективы использования стандартной IVR-платформы определяются ее функциональностью, в частности:

• возможностью создания голосовых меню;

• доступом к протоколам для взаимодействия с внешними системами: корпоративными базами данных, SMS/USSD-центрами, системами администрирования и отслеживания работоспособности системы;

• наращиванием производительности за счет горизонтального масштабирования системы, т. е. увеличения количества телефонных плат и/или транков (trunks) на них.

Современная IVR-платформа, помимо перечисленных, должна обладать следующими достоинствами:

• открытая структура меню и бизнес-логика;

• надежность и непрерывное обслуживание абонентов;

• корректное функционирование при отказе компонент и восстановление после сбоев;

• минимальные усилия по интеграции существующей телефонной инфраструктуры и корпоративной базы данных.

Грамотно спроектированная IVR-платформа в дальнейшем будет требовать от разработчика минимальных усилий по:

• разработке новых голосовых приложений;

• поддержке новых источников данных и протоколов;

• переходу на новое телефонное оборудование.

Архитектура IVR-платформы

Архитектура IVR-платформы должна удовлетворять следующим требованиям:

• быть многоуровневой, чтобы каждый уровень мог взаимодействовать с другими с помощью абстрактных, четко определенных и минимизированных интерфейсов. Это обеспечит возможность быстро изменить уровень, не затрагивая других (например, для поддержки телефонного оборудования нового производителя);

• каждый уровень должен состоять из заменяемых функциональных подсистем. При выходе из строя одной из подсистем такая архитектура обеспечит защиту IVR от остановки – потеряв часть функциональности, она останется работоспособной. При сбое в какой-либо подсистеме IVR оставшимися доступными средствами должна информировать администратора о проблеме. Кроме того, такая организация позволяет наращивать функциональность IVR-платформы путем добавления новых подсистем на соответствующие уровни, не затрагивая других;

• обеспечивать достаточный уровень дублирования серверов или даже иметь возможность «горячего» дублирования (при выходе из строя одного сервера резервный автоматически обработает все активные звонки без разрыва соединения и потери информации).

Требования к функциональности IVR-платформы

Рассмотрим более подробно необходимую для современного IVR функциональность по уровням.

Уровень приложений


1. Возможность для заказчика самостоятельно менять структуру меню и бизнес-логику, что позволит ки.

2. Динамическое распределение физических телефонных ресурсов для голосовых приложений. Например, когда требуется обзвонить абонентов, IVR должен предоставить автопрозвонщику необходимые ресурсы за счет сокращения ресурсов у других приложений, но таким образом, чтобы не блокировать их работу.

3. Составление фраз из голосовых фрагментов на правильном русском языке, особенно если IVR поддерживает несколько языков. Для согласования текстов целесообразно пригласить носителя

языка, так как ошибки в произношении вызывают недоверие абонентов ко всей системе.



Уровень бизнес-логики


1. Получение информации о состоянии телефонных каналов, транков и базы данных в реальном времени для оперативного реагирования на возникающие проблемы.

2. Статистика по звонкам для формирования отчетов и локализации проблем. Проблемы в телефонной или локальной сети могут носить краткосрочный характер, поэтому статистика должна быть как минимум поминутной. Если строить менее точные графики, например, с десятиминутной статистикой, то на них будут сглаживаться спады и выбросы, сигнализирующие о возможном наличии проблем с оборудованием. Отчеты со статистикой могут использоваться и в качестве аргумента в пользу решения о расширении системы.

3. Возможность без прерывания обслуживания абонентов изменения структуры меню, бизнес-логики и настройки параметров

системы.



Уровень абстракции телефонного оборудования


1. Наличие интерфейса «уровня абстракции оборудования», обеспечивающего использование любой телефонной технологии, так как телефонные протоколы могут существенно различаться по функциональности и способам установки соединения (например, цифровые протоколы ISDN и протоколы IP-телефонии).

2. Повышение производительности IVR за счет модернизации аппаратной части системы. При увеличении количества абонентов или появлении новых голосовых приложений нагрузка на IVR возрастает, который при этом не должен требовать доработки программной части для поддержки горизонтального масштабирования за счет увеличения числа телефонных плат и/или транков на них. Необходимость в наращивании производительности определяется эмпирическим путем – исследуется структура звонков у конкретного оператора связи на конкретную услугу. На рис. 3 представлено суточное распределение звонков у оператора мобильной связи на автоинформатор на один ISDN PRI транк (30 каналов) в минуту.

В часы наибольшей нагрузки (ЧНН) необходимо предпринять статистически значимое количество попыток дозвониться на IVR, и если хотя бы одна из них будет

неудачной по причине занятости линии, то необходимо расширение оборудования, так как непредоставление услуги вызывает нарекания абонентов к оператору связи.

3. Ограничение длительности звонка во избежание ситуаций, когда PBX не определяет разрыв соединения и звонок остается активным, несмотря на то что абонент повесил трубку. Обычно это происходит, когда вызов осуществляется с аналогов которые абонент не хочет или не может решить с помощью IVR. Это требует наличия в IVR перенаправления (трансфера) вызова. Данная функциональность может быть реализована использованием: трансфера, специфичного для конкретной телефонной станции (PBX Private Branch eXchange); стандартных типов трансфера; ресурсов самой телефонной платы. Эти решения обусловливают различные степени интеграции с конкретной PBX и перечислены согласно убыванию данной зависимости. При использовании специфичной функциональности PBX или телефонной платы возникает зависимость реализации от «железа», что осложняет переносимость системы. В IVR-платформе необходимо минимизировать интерфейс «уровня абстракции оборудования» и, как следствие, использовать в ней только стандартные функции телефонных протоколов и обработки голоса.

Реализация IVR-платформы

СТРУКТУРА МЕНЮ

Для создания меню голосовых приложений производители обычно предоставляют графические редакторы. Для формирования сценариев обработки звонков в основном используются блок-схемы. Построение в них иерархических меню – совсем не очевидная задача.

IVR, управляемый тоновым набором, изначально является иерархическим приложением. В приложениях, использующих системы ASR (Automatic Speech Recognition) и управляемые голосом, меню может быть «плоским», т. е. абоненту не нужно последовательно осуществлять тоновый набор, чтобы добраться до нужного пункта меню, а достаточно сказать, что он хочет, и IVR по ключевым словам поймет его. За основу для создания меню необходимо взять открытое средство, имеющее иерархическую структуру. На сегодняшний день лучший выбор – стандарт XML, который обладает следующими возможностями:

• создание иерархического меню естественным и интуитивно понятным способом;

• применение существующих разборщиков (парсеров) для обхода структуры меню;

• использование имеющихся разработок по созданию и редактированию иерархических структур;

• хранение меню в текстовом виде, что позволяет осуществлять доводку IVR у заказчика, где необходимое программное окружение обычно отсутствует.

БИЗНЕС-ЛОГИКА

Для получения необходимой информации IVR может обращаться к различным источникам данных, используя разнообразные протоколы и языки доступа: SQL, HTTP, TCP, протокол сетевого администрирования – SNMP (Simple Network Management Protocol), протокол электронной почты – SMTP (Simple Mail Transfer Protocol), протокол для доступа к SMS/USSD центрам – SMPP (Short Message Peer-to-Peer). Следовательно, для выполнения этой задачи IVR должен предоставить гибкий механизм.

Большинство производителей идут по пути создания собственных языков для поддержки доступа к внешним системам. Это решение оправдывает себя на начальном этапе, но в дальнейшем оборачивается необходимостью поддержки всего синтаксиса языка программирования высокого уровня, предоставления API для всех популярных протоколов, что, в свою очередь, приводит к привлечению зни в актуальном состоянии данной подсистемы. Интерпретатор языка должен быть надежным, производительным и простым в использовании. Все эти требования делают задачу по созданию собственного языка чрезвычайно трудоемкой.

Во избежание проблем необходимо интегрировать в платформу один из открытых языков программирования. Приемлемый вариант – использование языка Perl, который незаменим при работе со сложными структурами текстовых данных (например, ХМL и HTML).

Perl включает библиотеки для поддержки всех распространенных протоколов и источников данных. Без сомнения, в будущем дружное сообщество Perl-разработчиков будет поддерживать все новые стандарты и протоколы. Возможность интеграции с программами на C++, позволяет использовать C++ для разработки самой IVR-платформы.

Данный язык является интерпретатором, запускаемым из командной строки, что позволяет осуществлять доводку логики IVR у заказчика без установки дополнительного программного обеспечения. Открытый код дает возможность вносить необходимые изменения в интерпретатор Perl самому, а не ждать поддержки от разработчиков языка.

МНОГОПЛАТФОРМЕННОСТЬ

IVR поддерживает многоплатформенность (работает на разных операционных системах). С этой целью при разработке платформы необходимо придерживаться ANSI стандарта C++ и не использовать функции, зависимые от конкретной операционной системы. Для реализации системных вызовов применяются многоплатформенные библиотеки.

***

Надеемся, что данная статья заказчикам поможет выработать требования к современной IVR-платформе, а разработчикам – покажет, что подобная задача имеет быстрое и надежное решение, которое в будущем позволит без привлечения значительных людских и временных ресурсов наращивать функциональность, осуществлять поддержку новых протоколов и источников данных, разрабатывать новые голосовые приложения.

ТОЧКА ЗРЕНИЯ

Илья ОПАРИН,

специалист отдела наукоемких разработок, ООО «Центр речевых технологий»

Область речевых технологий, связанная с созданием диалоговых систем, в последнее время является одной из наиболее динамично развивающихся. Это можно объяснить влиянием двух основных факторов. Во-первых, сама идея создания системы, с которой человек максимально легко может общаться и взаимодействовать, является привлекательной. Во-вторых, коммерческий успех диалоговых систем на основе обработки текстовых запросов свидетельствует о перспективности вложения средств в осуществление следующего логического шага в данной области – создания систем, работающих с голосовой информацией.

Текстовые диалоговые системы, в которых пользователь ведет диалог с машиной посредством ввода текста или выбора из меню, а ответ получает в виде речи, синтезированной компьютером, на сегодняшний день успешно применяются для решения многих задач.

Переход от текстового набора к голосовому (и, следовательно, внедрения алгоритмов распознавания речи) делае, использование диалоговых систем избавляет клиента от ожидания свободного оператора.

Перспективность использования методов распознавания речи подтверждается множеством проектов, ведущихся в этом направлении. Однако главной сложностью создания подобных систем является обеспечение надежного уровня распознавания пользовательского голосового запроса. Если в идеальных условиях такая задача решается достаточно успешно, то при появлении шума (что практически неизбежно, например, при использовании мобильного телефона) качество работы системы резко снижается.

Тем не менее общее развитие алгоритмов распознавания речи, которые все чаще рассматриваются в контексте именно диалоговых систем, позволяет надеяться, что задача будет решена с качеством, соответствующим широкому распространению систем IVR. Наличие системы распознавания речи для конкретного языка является обязательным условием создания для него IVR-системы. Для русского таких систем пока не существует, однако работы в этом направлении активно ведутся в ряде компаний и НИИ.

Андрей ПЕТРЕНКО,

эксперт, отдел продаж, CompTek

На настоящий момент нет людей, которые не умеют пользоваться телефоном, как и нет людей, которые не имеют доступа к телефону. Что есть у 100% телефонов? Гарантировать можно только динамик и микрофон, а все остальное зависит от модели. И если нам нужно построить информационную систему, услугами которой должен уметь воспользоваться каждый, то на настоящий момент есть только один терминал, который может это обеспечить – телефон. Все остальные сети требуют более сложного терминального оборудования, а как следствие – значительно сужают общий круг потенциальных пользователей. До недавнего времени единственным способом передавать информацию в систему был DTMF-набор на текстуре телефона, однако при его помощи достаточно сложно реализовать многие сценарии обработки звонка.

Вывод информации также проблематичен, разработчикам систем приходилось записывать много примитивных голосовых файлов, из которых «налету» составлялся ответ системы. А когда информацию нельзя формализовать (частные объявления пользователей системы), то такая задача не решается в принципе... Коренным образом ситуация изменилась с приходом двух технологий на Российский рынок: ASR и TTS. ASR и TTS сродни переходу от ручного коммутатора к АТС, только на другом уровне обслуживания звонка. Технологии созрели...

Дмитрий СТОЛЯР,

директор по продажам, московское представительство FrontRange Solutions

Система IVR, по определению, является одним из элементов классического call-центра, отвечающим за автоматизацию стандартных обращений в компанию и сбор сведений, необходимых для автоматизации работы операторов. Большинство поставщиков IVR-системы ориентированы на реализацию именно этой функциональности.

Более чем пятилетний опыт нашей работы с российскими клиентами показал, что IVR способен на гораздо бол из «центра затрат» в «центр прибыли». Он ускоряет организацию новых платных сервисов, дополнительных к основным услугам call-центра. Самые коммерчески востребованные сервисы в России, такие как развлекательно-игровые порталы, «сказки по телефону», телеголосования, маркетинговый обзвон, справочные услуги «09», успешно реализованы на основе IVR.

Быстрому и качественному развертыванию новых услуг способствует использование современных технологий, таких как поддержка IP-телефонии, распознавание русского языка и русскоязычный синтез речи.

IVR-системы длительное время находились в тени сall-центров. Постоянно возрастающие требования клиентов и совершенствование аппаратной базы делают оправданным превращение IVR в самостоятельный (и экономически выгодный!) элемент бизнес-стратегии компаний.

Главная страница / Архитектура отрасли