зворыкинский проект
проекты/016781/комментарии
регистрация
обложкагалереякомментарииактивность

№16781 Речевой интерфейс


комментарии экспертов



комментарии пользователей

Милованов Максим[ 2 ] 
12 марта 2010 11:08

Успешный и перспективный проект, желаю удачи ребята !

Кушнир Дмитрий[ 1 ] 
12 марта 2010 17:04

Спасибо!

Михеев Михаил[ 2 ] 
18 марта 2010 23:17

Давно пора!
Только советую разделить задачи синтеза и распознавания. Я пару лет назад искал программу чтобы начитывать тексты голосом - более или менее что-то существенное пока есть только для английского языка (Nuance). Правда, распознавание русской речи значительно сложнее. Весьма перспективно с коммерческой точки зрения, можно сказать что рынок ждёт такую технологию.
Что же касается синтеза речи, то тут есть неплохие наработки (вроде бы движок называется "Ольга", читает женским голосом вполне сносно, есть ещё "Алёна").

Кушнир Дмитрий[ 0 ] 
19 марта 2010 11:58

Да, в целом задачи разные и традиционно они решались отдельно друг от друга, хотя и существуют технологии распознавания через синтез. В данном проекте упор делается на распознавание отдельных слов-команд-фраз (до 200 слов активного словаря), поскольку технология распознавания слитной речи у нас еще не отработана в достаточной мере. Это поистине сложная задача, но мы не отступим. К распознаванию слов прикручивается синтез речи (можно взять стороннюю разработку, если она лучше - а пока так и есть, кроме Вами перечисленных, есть отличная разработка у Питерского ЦРТ) система построения диалога, которая представляет собой оболочку для подготовки сценариев диалога для решения традиционных задач на компьютере. При наличии беспроводной гарнитуры большого радиуса действия, можно находиться вдалеке от компьюетера, но при этом решать ряд задач, которые не требуют, например, графического отображения на мониторе. Цель: построить полноценный альтернативный интерфейс при этом сделать его более удобным и естественным. Последнее относится также к сложным задачам построения сценариев диалога - это вторая задача над которой мы активно работаем. Первая - распознавание речи. Конечный продукт - это комплект из гарнитуры и программного обеспечения. Сценарии постоянно совершенствуются и будут доступны для скачивания через Интернет.

Пущин Валерий[ 1 ] 
21 марта 2010 22:44

идея совместить распознавание и синтез для создания полноценного интерфейса кажется вполне здравой для задач управления специализированными техническми системами, там где нужно освободить руки и глаза. Например, управлять навигаторами, аудиосистемами и мобильной связью в автомобилях было бы на порядок безопасней. А вот есть ли востребованность приложений для обычного персонального компьютера? Тем более, что все доступней становятся TabletPC и подобные мобильные устройства с альтернативными способами ввода, которые частично решают проблему "приковывания" человека к монитору и мышке.

Кушнир Дмитрий[ 0 ] 
22 марта 2010 18:40

Вы знаете, для персонального компьютера есть востребованность в подобной технологии у людей с ограниченными возможностями (слабое зрение, ограниченная подвижность), как не печально, но таких людей много. Но это не единственные потенциальные потребители. Всё время смотреть в монитор - это настоящая нагрузка и для здоровых людей, причём далеко не всегда в этом есть необходимость. Очень много задач на компьютере можно решать в режиме диалога. А имея в наличии беспроводную гарнитурку, это можно делать глядя в окно, ходя по комнате, даже выйдя на улицу, получить информацию по запросу, прослушать новые сообщения, пришедшие на почтовый адрес, связаться с коллегой или даже оставить голосовую заметку для себя в указанной категории задач (пока не будет приемлемой для использования технологии распознавания слитной речи), ну и т.д. Вред здоровью от постоянного малоподвижного сидения очевиден и вполне нормально стремиться к естественным видам интерфейса. Думаю, что успех во многом будет определяться качеством и продуманностью сценариев взаимодействия с персональным компьютером при решении конкретных задач. А для мобильных устройств, даже несмотря на серьёзные достижения в области графических интерфейсов, диалог займёт свою прочную нишу. Это ведь универсальный для человека интерфейс.

Чтобы оставить комментарий вам необходимо войти на сайт