Нефть и песок О стали Компрессор - подбор и ошибки Из истории стандартизации резьб Соперник ксерокса - гектограф Новые технологии производства стали Экспорт проволоки из России Прогрессивная технологическая оснастка Цитадель сварки с полувековой историей Упрочнение пружин Способы обогрева Назначение, структура, характеристики анализаторов Промышленные пылесосы Штампованные гайки из пружинной стали Консервация САУ Стандарты и качество Технология производства Водород Выбор материала для крепежных деталей Токарный резец в миниатюре Производство проволоки Адгезия резины к металлокорду Электролитическое фосфатирование проволоки Восстановление корпусных деталей двигателей Новая бескислотная технология производства проката Синие кристаллы Автоклав Нормирование шумов связи Газосварочный аппарат для тугоплавких припоев
Главная страница / Архитектура отрасли

SPECOM'2007 – от синтеза к речи

Интерес к системам распознавания и синтеза речи сегодня высок со стороны как государственных структур, так и коммерческих организаций, в том числе и в России. В конференции приняли участие ведущие специалисты из различных стран: России, Австрии, Беларуси, Бельгии, Великобритании, Вьетнама, Германии, Греции, Дании, Индии, Ирана, Ирландии, Испании, Италии, Канады, Китая, Кореи, Литвы, Малайзии, Мексики, Нидерландов, Норвегии, Польши, Португалии, Румынии, США, Таиланда, Тайваня, Турции, Украины, Финляндии, Франции, Чехии, Чили, Швеции, Эстонии, Японии и др.

Выступающие отметили серьезный прогресс и в области систем автоматизированного перевода, работа над которыми велись с середины прошлого века.

Наиболее значительные успехи машинного перевода наблюдаются в профессиональных областях, поскольку профессиональный язык более структурирован и менее гибок, чем свободная речь.

Интерес государственных структур, прежде всего силовых ведомств, к системам распознавания и лингвистического анализа речи связан с вопросами построения систем информационной безопасности и борьбы с преступностью (в том числе в программах защиты свидетелей). Актуальны перспективы развития речевых технологий для антитеррористических задач. Поэтому самые большие инвестиции в научные разработки и производство подобных систем идут от государства. В России процесс разработки и продажи таких систем контролируется государством посредством лицензирования.

В коммерческом сегменте системы распознавания и синтеза речи также давно и успешно используются, например, в контакт-центрах компаний, как функционал IVR в УПАТС, в системах голосового набора номера и управления отдельными функциями мобильных телефонов и т. п. Существуют специальные решения и средства для людей с ограниченными возможностями. В частности, для людей со слуховыми ограничениями создаются автоматические системы транскрипции новостных передач с использованием технологий распознавания речи.

Несмотря на множество проблем, стоящих перед разработчиками систем распознавания речи и лингвистами, конференция показала, насколько далеко продвинулись исследования в этой области. По словам доктора Ли (Chin-Hui Lee) из университета Джорджии (США), еще десять лет назад точность распознавания речи для дикторонезависимых систем была менее 50%, сейчас этот показатель составляет около 70%. Проблему распознавания отдельных слогов и слов можно считать практически решенной. Однако отсутствие серьезных успехов в распознавании спонтанной речи снижает функциональность автоматизированных систем распознавания речи как минимум в десять раз по сравнению с возможностями человека.

Тем не менее, оптимизм большинства докладчиков на конференции позволяет предположить, что уже в ближайшее время продукты, созданные на основе технологий синтеза и распознавания речи, станут совершеннее и окажутся востребованными в различных сегментах экономики, в том числе и российской.

Главная страница / Архитектура отрасли