Речевой интерфейс к космической технике

насколько это полезно?
 

kost2

втянувшийся

Друзья!
Прошу высказаться по вопросу полезен-не полезен речевой интерфейс (РИ) к
1) Бортовому компу станции
2) скафандру и оборудованию/инструменту ВКД
3) Пилотируемому кораблю.

При этом предполагаем что:
1. РИ уже есть и работает и не требует никаких дополнительных мощностей и обучения
2. РИ имеет точность распознавания команд 99,9%
3. РИ может распознавать любые заранее введенные в систему команды
4. РИ заранее известно что делать по той или иной команде, вне известного поля команд он туп как пробка и не понимает что ему говорят
5. РИ учитывает контекст и понимает умолчания в известных пределах
6. РИ работает через индивидуальные гарнитуры и поддерживает одновременный разговор со всем экипажем в отдельности
7. РИ снабжен распознавателем эмоций и моделирует свое настроение в зависимости от ситуации с помощью стиля свей речи.
8. РИ используется как дополнительный канал интерфейса и не подменяет собой джойстики для динамичных операций.
9. Запоминать команды не надо - говорить в определенной форме можно относительно свободно, но без экзотики. Т е не называть трубопровод змеёй, а трубопровод, трубка, патрубок, соединение, линия номер - нормальные термины.

Если требуются дополнительные данные о РИ для размышлений - не фантазируйте, задавайте вопросы - отвечу если смогу.

Итак,
Какие функции можно нагрузить?
Что это даст в плане безопасности, удобства, работоспособности и производительности труда, психологии?
Неумозрительные советы специалистов очень приветствуются.
 

au

   
★★
kost2> 1) Бортовому компу станции
kost2> 2) скафандру и оборудованию/инструменту ВКД
kost2> 3) Пилотируемому кораблю.

Вреден, попунктно, пока точность распознавания не равна 100.000% А этого нет и не будет с человеческим языком. Он сам в себе противоречив и неоднозначен.
-- Включить систему А111?
-- Да нет.

Вот так вот: "да нет" — кушайте, компутеры, не обляпайтесь.

kost2> 5. РИ учитывает контекст и понимает умолчания в известных пределах

Нет такого и не будет. Контекст — в головах, больше нигде. Чем вы надеетесь синхронизировать внутренние состояния голов (контекст) с внутренними состояниями системы упрввления? Речевым интерфейсом, зависящим от контекста?

kost2> 8. РИ используется как дополнительный канал интерфейса и не подменяет собой джойстики для динамичных операций.

Зачем он тогда нужен? Два выключателя к одной лампочке, или ещё лучше — по одному на всех пассажиров.

kost2> Какие функции можно нагрузить?

Никакие.
Человеческий язык не подходит для точного управления, и не создавался для него. Если бы он подходил, программисты писали бы прозой, а не языками программирования. И даже языки программирования на 99% не дают ожидаемых результатов надёжно. Вы же хотите чтобы это всё ещё и делалось на слух, и цена ошибки — гора денег и кучка трупов. Человеческий язык создан и существует для общения между людьми. Если вам так тяжело нажимать кнопки, включая сенсорные, то создайте непротиворечивый однозначно определённый язык команд, которые человек может освоить до автоматизма, а машина интерпретировать однозначно. Звёздные войны вспомните — вот R2D2 на таком языке общался. Первый шаг для желающих управлять через речь — создание правильного общего языка, а не мечты о "тонко чувствующих"© интерпретаторах контекста.
 

kost2

втянувшийся

kost2>> 1) Бортовому компу станции
kost2>> 2) скафандру и оборудованию/инструменту ВКД
kost2>> 3) Пилотируемому кораблю.
au> Вреден, попунктно, пока точность распознавания не равна 100.000% А этого нет и не будет с человеческим языком. Он сам в себе противоречив и неоднозначен.
au> — Включить систему А111?
au> — Да нет.
au> Вот так вот: "да нет" — кушайте, компутеры, не обляпайтесь.
во-первых ошибки ввода характерны и для других видов интерфейса, 100.000 нет нигде. Клавиатура с трудом дает 99,99. Не приходилось промахиваться мимо кнопок, опечатываться? (Да-нет пример плохой командной фразы, слишком короткие слова, лучше включить/отставить[отключить, не включать,...])
во-вторых есть некритические команды, запросы и системы, ошибки в которых не страшны, и легко отменяются (есть и процедуры подтверждения), а вот польза например от речевых запросов к БД тех документации IMHO несомненна

kost2>> 5. РИ учитывает контекст и понимает умолчания в известных пределах
au> Нет такого и не будет. Контекст — в головах, больше нигде. Чем вы надеетесь синхронизировать внутренние состояния голов (контекст) с внутренними состояниями системы упрввления? Речевым интерфейсом, зависящим от контекста?

Контекст общий и учитывается в виде учета текущего состояния объекта управления и в виде учета предыдущего диалога. По сути заранее строится модель диалогов с цепочками вопрос-ответ и не валится всё в одну фразу.
kost2>> 8. РИ используется как дополнительный канал интерфейса и не подменяет собой джойстики для динамичных операций.
au> Зачем он тогда нужен? Два выключателя к одной лампочке, или ещё лучше — по одному на всех пассажиров.
Для сложных команд, которые иначе только на полнофнкциональной клаве набирать можно, для разгрузки рук, для удаленного управления, и если нет возможности оперировать руками.
Продублировать переключатель света на скафандре. Руки заняты, да и тяжело ворочать кнопками при ВКД.
запрос к документации типа "куда ведет кабель номер НН?" Опять же руки заняты, до БК далеко.
Запрос системы "режим научного модуля трямтрям завершен, переходить к следующему этапу или подождать Вас?" - а космонавт в это время в другом конце станции и с удовольствием ответит "переходить" чтобы не лететь рани одного тумблера минуты три.
При динамических операциях рук всегда не хватает, на не динамические операции, на переключить диапазон связи, камеры, на запрос остатка топлива и тп

kost2>> Какие функции можно нагрузить?
au> Никакие.
au> Человеческий язык не подходит для точного управления, и не создавался для него. Если бы он подходил, программисты писали бы прозой, а не языками программирования. И даже языки программирования на 99% не дают ожидаемых результатов надёжно. Вы же хотите чтобы это всё ещё и делалось на слух, и цена ошибки — гора денег и кучка трупов. Человеческий язык создан и существует для общения между людьми. Если вам так тяжело нажимать кнопки, включая сенсорные, то создайте непротиворечивый однозначно определённый язык команд, которые человек может освоить до автоматизма, а машина интерпретировать однозначно. Звёздные войны вспомните — вот R2D2 на таком языке общался. Первый шаг для желающих управлять через речь — создание правильного общего языка, а не мечты о "тонко чувствующих"© интерпретаторах контекста.

Это все размышлизмы, и не верные. Кто говорит про точные или динамичные операции? Для включения/выключения света и вождения автомобиля речь не нужна. А вот ввести адрес в навигатор- гораздо удобнее голосом, и особенно во время движения автомобиля. Ввести координаты в систему навигации качающегося корабля голосом удобнее, чем через трэкбол. Некоторые кнопульки в приличных машинах отключают во время движения, чтобы "точное управление" не отвлекло и не получить те самые трупы. Вообще, стоит быть осторожным с категоричными суждениями - глупо получается. Речь используется для сложных запросов и команд - или там где использование кнопок неудобно/небезопасно/невозможно. Непротиворечивый язык есть, Это подмножество естесственного языка. Обучение занимает 10 минут. Проверено. Звездные войны - старье. В общем, Вы в стадии "этого не может быть, потому что не может быть никогда", в то время как остальной мир уже в стадии "что-то в этом есть" или даже "как без этого мы жили раньше!"
 

au

   
★★
kost2> во-первых ошибки ввода характерны и для других видов интерфейса, 100.000 нет нигде. Клавиатура с трудом дает 99,99. Не приходилось промахиваться мимо кнопок, опечатываться?

Я в космические корабли ещё не печатал. А сейчас вот печатаю по-русски на клаве, на которой ни одной русской буквы не было и нет, и даже не задумываюсь. Так что наверно она вполне ничего так, если руки растут из плеч. Присутствует обратная связь через глаза: я вижу что печатаю, и прежде чем нажму ввод, глаза уже проверят текст на ошибки. В голосовом это принципиально невозможно. Сейчас в телефонных роботах это делается переспрашиванием. В системе управления переспрашивание закончится подключением клавиатуры раз и навсегда.

kost2> во-вторых есть некритические команды, запросы и системы, ошибки в которых не страшны, и легко отменяются (есть и процедуры подтверждения), а вот польза например от речевых запросов к БД тех документации IMHO несомненна

Напишите этот запрос руками в поиск — займёт две секунды. Так работает гугл — несомненно очень, очень и очень популярная система. К тому же вам ещё нужно доказать что пользователь захочет говорить с машиной постоянно. Я вот не хочу и не захочу. Шевельнуть пальцем можно и в полусне, а во сне можно даже выключить будильник сенсорной (нарисованной на корпусе) кнопкой. Настолько это лёгкий и естественный интерфейс между человеком и вещами — через руки.

kost2> Контекст общий и учитывается в виде учета текущего состояния объекта управления и в виде учета предыдущего диалога. По сути заранее строится модель диалогов с цепочками вопрос-ответ и не валится всё в одну фразу.

Команды рождаются в уме, содержание которого неизвестно и несинхронизируемо с управляющей системой. Когда надо выключить что-то, никаких диалогов люди не захотят вести. Они могут протянуть руку до ближайшей кнопки (на запястье другой руки, например) и сделать всё за секунду, а не вести диалоги со сложным интерфесом, к которому через день будут заслуженно обращаться исключительно матом.

kost2> Для сложных команд, которые иначе только на полнофнкциональной клаве набирать можно, для разгрузки рук, для удаленного управления, и если нет возможности оперировать руками.

Сложные команды состоят из простых. Если вы когда-то программировали на ассемблере (очень полезно перед написанием подобных тем), вы знаете как люди выражают свои сложные мысли в виде простого набора простых команд и полусотни символов на всё это.
Руки управляются телепатически — мыслями на расстоянии, посредством мозга. Нет лучше и универсальнее интерфейса. Достаточно подумать, и они уже сделали. Рукам не нужно объяснять и поправлять. Они — свои.

kost2> Продублировать переключатель света на скафандре. Руки заняты, да и тяжело ворочать кнопками при ВКД.

Неправильный скафандр, кнопки и архитектура управления. Если вы надеетесь что объяснять скафандру что вы от него хотите легче, чем сделать правильные кнопки и управление, то вас ждёт сюрприз.

kost2> запрос к документации типа "куда ведет кабель номер НН?" Опять же руки заняты, до БК далеко.

Откуда ведёт? В каком месте вы на него смотрите? Что вы хотите узнать: куда он уходит или где кончается? Ведёт электрически, физически или ещё как-то? А если в этом кабеле сто каналов и он ведёт в сто мест, какое из них вы хотите услышить в ответ? Это контекст, который вы не высказали, но подразумевали бы. Такая "помощь" нафиг не нужна — вот вердикт, который получите от пользователя.

kost2> Запрос системы "режим научного модуля трямтрям завершен, переходить к следующему этапу или подождать Вас?" - а космонавт в это время в другом конце станции и с удовольствием ответит "переходить" чтобы не лететь рани одного тумблера минуты три.

Повесьте ему на запястье терминал и две кнопки: да и нет. Все сообщения можно писать и проговаривать, а все ответы сводить к да или нет. Так примерно работают реальные голосовые системы в телефонных компаниях. Даже само существование пульта дистанционного управления для телека должно исключать возникновение такой проблемы в уме.

kost2> При динамических операциях рук всегда не хватает, на не динамические операции, на переключить диапазон связи, камеры, на запрос остатка топлива и тп

Если рук уже не хватает, операции построены неправильно. Постройте их правильно, чтобы рук хватало всегда, и ещё оставалось. Косяки одной системы не решаются созданием косяков в другой.

kost2> Это все размышлизмы, и не верные.

Вы бы знали что пишете прежде чем решительные всеохватывающие вердикты выносить. Впрочем, думайте как хотите.
 

kost2

втянувшийся

au> Я в космические корабли ещё не печатал. А сейчас вот печатаю по-русски на клаве, на которой ни одной русской буквы не было и нет, и даже не задумываюсь. Так что наверно она вполне ничего так, если руки растут из плеч. Присутствует обратная связь через глаза: я вижу что печатаю, и прежде чем нажму ввод, глаза уже проверят текст на ошибки. В голосовом это принципиально невозможно. Сейчас в телефонных роботах это делается переспрашиванием. В системе управления переспрашивание закончится подключением клавиатуры раз и навсегда.

Тем не менее клавиатура там присутствует. Вы утверждаете, что не делаете ошибок при вводе? Не верю. Переспрашивать надо не в каждом случае, а в серьезных, и голос здесь не при чем. Блокировки и на кнопках есть.
au> Напишите этот запрос руками в поиск — займёт две секунды. Так работает гугл — несомненно очень, очень и очень популярная система. К тому же вам ещё нужно доказать что пользователь захочет говорить с машиной постоянно. Я вот не хочу и не захочу. Шевельнуть пальцем можно и в полусне, а во сне можно даже выключить будильник сенсорной (нарисованной на корпусе) кнопкой. Настолько это лёгкий и естественный интерфейс между человеком и вещами — через руки.

Говорить все же быстрее. Особенно в скафандре или плавая около консоли в невесомости или когда 2 G. Готов поспорить. Так работает гугл-голосовой поиск:-p Не надо говорить постоянно- только когда удобнее сказать. Шевелить пальцами - это значит тачскрин с собой таскать? И вот ситуация - одной рукой держитесь, другой тащите разъем - а света не хватает, чем тачскринить будем?

au> Команды рождаются в уме, содержание которого неизвестно и несинхронизируемо с управляющей системой. Когда надо выключить что-то, никаких диалогов люди не захотят вести. Они могут протянуть руку до ближайшей кнопки (на запястье другой руки, например) и сделать всё за секунду, а не вести диалоги со сложным интерфесом, к которому через день будут заслуженно обращаться исключительно матом.

Если до кнопки далеко? Если руки заняты? Если руки не поднять? если надо не свет включить а запрос ввести (эдак на 5-7 параметров?)
au> Сложные команды состоят из простых. Если вы когда-то программировали на ассемблере (очень полезно перед написанием подобных тем), вы знаете как люди выражают свои сложные мысли в виде простого набора простых команд и полусотни символов на всё это.

На ассме написано половина ядра - т ч не надо понтоваться ;) Но мидлвеа никто не отменял из вменяемых. Может проверим - что УДОБНЕЕ SQL запрос набрать руками или в речевом диалоге?

au> Руки управляются телепатически — мыслями на расстоянии, посредством мозга. Нет лучше и универсальнее интерфейса. Достаточно подумать, и они уже сделали. Рукам не нужно объяснять и поправлять. Они — свои.

А голос чем управляется? Или Вы думаете всем перейти на язык глухонемых? ;))

au> Неправильный скафандр, кнопки и архитектура управления. Если вы надеетесь что объяснять скафандру что вы от него хотите легче, чем сделать правильные кнопки и управление, то вас ждёт сюрприз.

Сюрприз ждет Вас. Я то пробовал. А Вы пробовали хотя бы в сухом гидрокостюме кнопками шерудить? Связь подбородком переключать? Давление затылком стравливать? Скафандр таки-да пока не правильный, с кнопками;)

au> Откуда ведёт? В каком месте вы на него смотрите? Что вы хотите узнать: куда он уходит или где кончается? Ведёт электрически, физически или ещё как-то? А если в этом кабеле сто каналов и он ведёт в сто мест, какое из них вы хотите услышить в ответ? Это контекст, который вы не высказали, но подразумевали бы. Такая "помощь" нафиг не нужна — вот вердикт, который получите от пользователя.

Нифига. Ответ "кабель НН соединяет то-то и то-то, из блока такого-то проложен в блок такой -то по такой-то стенке. Несет линии управления тем-то и тем-то. Отключение приведет к отключению того-то". Вопрос к составителям документации. Вполне можно задать эти ваши вопросы как следующий этап диалога. Я был бы рад такой помощи. В каком месте - позиционируем гарнитуру в трех координатах и направлении. Следим за зрачком.

au> Повесьте ему на запястье терминал и две кнопки: да и нет. Все сообщения можно писать и проговаривать, а все ответы сводить к да или нет. Так примерно работают реальные голосовые системы в телефонных компаниях. Даже само существование пульта дистанционного управления для телека должно исключать возникновение такой проблемы в уме.

АГА! Таки проговаривать! Не логично ли и ответить голосом?
Пробовали с интернет телевидением общаться через пульт? Понравилось? Еще раз для команды бронепоезда -простейшие переключатели переводить на РИ надо только как резерв и только.
Да-нет прекрасно отдается с помощью одинарного-двойного нажатия на тангету гарнитуры. А если вариантов ответа больше?

au> Если рук уже не хватает, операции построены неправильно. Постройте их правильно, чтобы рук хватало всегда, и ещё оставалось. Косяки одной системы не решаются созданием косяков в другой.

Дополнительные возможности интерфейса облегчают задачу построения операций.Косяки проистекают от ограниченных возможностей в том числе.

au> Вы бы знали что пишете прежде чем решительные всеохватывающие вердикты выносить. Впрочем, думайте как хотите.

Бездоказательных вердиктов договоримся не выносить? Чтобы содержательно было? Я понимаю, что сразу в эту тему врубиться сложно, некоторые тратят на это годы. Интерфейс вообще - штука очень инертная. Т к включает в себя человека, который ОЧЕНЬ не любит нового.;)
 

au

   
★★
kost2> Бездоказательных вердиктов договоримся не выносить? Чтобы содержательно было? Я понимаю, что сразу в эту тему врубиться сложно, некоторые тратят на это годы. Интерфейс вообще - штука очень инертная. Т к включает в себя человека, который ОЧЕНЬ не любит нового.;)

Если вы не поняли, я объясню. Я не вступаю в дискуссию с вами, тем более вы не хотите слушать. Я перечислил вам некоторые проблемы, для которых нет решения. И попытался показать вам почему ваш РИ — пустая хотелка, а не решение для чего-то. Врубитесь ли вы в это или нет — мне безразлично, т.к. мне не нравится ваш тон и я не буду продолжать. Всего хорошего.
 

Fakir

BlueSkyDreamer
★★★
...а самый простой и надёжный способ речевого интерфейса для человека в скафандре - напарник за пультом на станции :D
 3.6.33.6.3

kost2

втянувшийся

au> . Всего хорошего.

Решения есть, просто неочевидные. Не Ваша тема, или там лень - я не в обиде. И Вам не кашлять.
 

kost2

втянувшийся

Fakir> ...а самый простой и надёжный способ речевого интерфейса для человека в скафандре - напарник за пультом на станции :D

У напарника и свои дела есть. Если можно его не грузить мелочами - зачем грузить? Т е вместо компа дрелью управляет отдельный космонавт - неэкономно как-то. Понимаю еще - манипулятором.
 

au

   
★★
Fakir> ...а самый простой и надёжный способ речевого интерфейса для человека в скафандре - напарник за пультом на станции :D

О том и речь (каламбур:): человек человека может понять с полуслова, и контекст тоже. А если не поймёт, то переспросит умно, а не "команда не распознана. Выберите из списка что вы хотели: 1)... 2)... 22)..." Это неумолимо бесит непонятого :)
 

kost2

втянувшийся

Fakir>> ...а самый простой и надёжный способ речевого интерфейса для человека в скафандре - напарник за пультом на станции :D
au> О том и речь (каламбур:): человек человека может понять с полуслова, и контекст тоже. А если не поймёт, то переспросит умно, а не "команда не распознана. Выберите из списка что вы хотели: 1)... 2)... 22)..." Это неумолимо бесит непонятого :)

Ну это Вы про телефонные системы тупые. Меня они бесят не меньше. Я толкую про другой уровень. В телефонной системе - два десятка одномоментных команд и качество распознавания 75% в лучшем случае. У нас - десятки тысяч команд одномоментно и качество за 99,9. Немного разные вещи, не так ли? Экспериментально установлен порог комфорта - 95 %. Что касается что человек лучше - конечно. Но разговаривая с компьютером надо просто придерживаться определенных правил (не каламбурить к примеру) и понимать с чем имеешь дело - и все будет ок. Проверено. Человек поймет с полуслова кстати, и ... неправильно. ;)
 
RU Dem_anywhere #26.07.2011 10:05  @kost2#25.07.2011 12:04
+
-
edit
 

Dem_anywhere

аксакал

kost2> Друзья!
kost2> Прошу высказаться по вопросу полезен-не полезен речевой интерфейс (РИ)
есть анекдот с фразой "ты не умничай, ты пальцем покажи!"
Разница между РИ и кнопками - как между командной строкой и оконным интерфейсом. Т.е. неудобен рядовому пользователю. Каковым космонавт и является - он профессионал в другом.

kost2> 9. Запоминать команды не надо
Надо... "Открыть клапан №75936 на трубе №2934"
Вот как свободно не формулируй, а номера запомни...

kost2> Что это даст в плане безопасности, удобства, работоспособности и производительности труда, психологии?
Неудобно и долго. Плюс, в плане безопасности - теряем аварийные гуделки. Могут не услышать, ведя диалог.

kost2> И вот ситуация - одной рукой держитесь, другой тащите разъем - а света не хватает, чем тачскринить будем?
На ногах тоже пальцы есть :D :D :D
 3.6.183.6.18

au

   
★★
Dem_anywhere> Неудобно и долго. Плюс, в плане безопасности - теряем аварийные гуделки. Могут не услышать, ведя диалог.

Ха! Вот из реальной жизни: Rockwell B-1 Lancer - Wikipedia, the free encyclopedia
Пилоты Б-1 посадили самолёт на пузо — не выпустили шасси. Почему? Потому что пилоты.
On 8 May 2006, B-1B (s/n 86-0132) ... landed "gear-up" during recovery from an 11-hour ferry flight ... The Air Force investigation concluded that the pilots disabled the aural tone generator circuit breaker which creates audible warning signals and then "forgot to lower the landing gear"

Ответ руками на звуки.
 

au

   
★★
Вот как надо — и уже получается делать простые вещи (смотрите ролики):

 
+
-
edit
 

arkhnchul

втянувшийся
немного влезу
kost2> Друзья!
kost2> Прошу высказаться по вопросу полезен-не полезен речевой интерфейс (РИ) к
kost2> 1) Бортовому компу станции
для "повседневных" бытовых запросов, в стиле "а что сегодня на обед" или "а давай сегодня у нас будет +28 цельсия" - возможно, будет приятной штукой
kost2> 2) скафандру и оборудованию/инструменту ВКД
только как дополнительный для некритичных операций, ибо возможны двусмысленности
kost2> 3) Пилотируемому кораблю.
смотря к чему, см. выше.

Тут такое дело: в основном при описании достоинств такого варианта интерфейса предполагается, что речевые команды человеком производятся быстрее моторных (==клавиатура/мышь/планшет/тачскрин/еще чего-то). А это ни разу не так. Просто сравните затраты времени на манипуляции с парой-тройкой программ, в которых вы работаете регулярно: "традиционным" методом, мышью и клавиатурой, и в умозрительном варианте необходимости четкой формулировки и проговаривания действий. Ключевое слово - "регулярно". Это из разряда "графический интерфейс против командного": в графическом проще разобраться именно неподготовленному пользователю, но, к примеру, лично мне куда как быстрее и проще переключиться одной кнопкой на терминал и на автомате вбить туда что-то в стиле "ip r l" или "iptables -t nat -L -nv", чем торкаться мышой по горе менюшек и кнопок. Ну и плюс, осмысленная речь - штука сложная и медленная сама по себе.
 5.05.0
Это сообщение редактировалось 13.08.2011 в 00:45
RU Dem_anywhere #20.08.2011 02:35  @arkhnchul#13.08.2011 00:38
+
-
edit
 

Dem_anywhere

аксакал

Подумалось тут...
Короткие голосовые команды вполне могут иметь место - потому как дольше до устройства ввода тянуться
при широком использовании контекстного дополнения вводимого часто используемые команды сократятся до слова или даже нескольких слогов.
При этом обратный канал - как обычно, экран.
 3.6.203.6.20

Balancer

администратор
★★★★☆

au> Если бы он подходил, программисты писали бы прозой, а не языками программирования

99 Bottles of Beer

The song '99 bottles of beer' programmed in more than 600 different programming languages, from APL to BASIC, to Brainfuck, INTERCAL, FORTRAN, C++ or Java... This project is similiar to the Rosetta stone

// 99-bottles-of-beer.net
 

(если непонятно, там программа на языке Shakespeare — Википедия )

:)
 
+
-
edit
 

Balancer

администратор
★★★★☆

Dem_anywhere> Короткие голосовые команды вполне могут иметь место - потому как дольше до устройства ввода тянуться

Нужна интеллектуальная система активации. Иначе будет много ложных срабатываний. Особенно — на коротких командах.



На сегодняшний день единственное более-менее удобное применение голосового ввода, что я встречал, это поиск всяких адресов в Google Maps под Android. Зажал кнопку, продиктовал адрес, готово. Получается быстрее и удобнее, чем с виртуальной клавиатурой. Увы, там где оно обычно актуально, обычно и слишком шумно :)
 

au

   
★★
Dem_anywhere> Подумалось тут...
Dem_anywhere> Короткие голосовые команды вполне могут иметь место - потому как дольше до устройства ввода тянуться

Согласен. Короткие голосовые команды, в идеале — выкрики. Например:
свет, дверь, стоп, и т.п.
Но их количество должено быть ограничено — как буквы в алфавите, а не как слова в языке. А их длина и вообще звучание не обязательно должны быть языком. Удобные, короткие, простые звуки. Такое может пригодиться и прижиться.

Dem_anywhere> При этом обратный канал - как обычно, экран.

А вот трындеть компы могут хорошо :) И глаза не отвлекает — это ещё лучше. Допустим, делает что-то человек там руками и глазами, даёт команду "бла", а в ответ ожидаемо: "бла ай — три два один бла. Бла офф." Типа такого. Как хозяин с собакой, а не как две женщины, у которых мобилки сели.

Кстати, русский для этого не подойдёт — надо урезать до неузнаваемости. Английский урезаем — подходит со скрипом. А лучше всего синтетический язык, если делать на совесть.
 

U235

старожил
★★★☆
Balancer> Нужна интеллектуальная система активации. Иначе будет много ложных срабатываний. Особенно — на коротких командах.

Я бы просто предложил использовать повторение слов, особенно если используются команды в одно слово. То бишь например на "дверь" автоматика не реагирует, зато реагирует на "дверь-дверь". По крайней мере для грамматики русского языка это подходит, у нас удвоение слов практически не используется в нормальной речи. Для реализации такого интерфейса, я думаю, особого интеллекта не потребуется
Демократия – в аду, на небе Царство  6.06.0

Balancer

администратор
★★★★☆

au> Согласен. Короткие голосовые команды, в идеале — выкрики. Например:
au> свет, дверь, стоп, и т.п.

«Свет, иди сюда!»
«Я завтра поеду в Тверь»
«Стоп, что за фигня у меня получается?»

au> А вот трындеть компы могут хорошо :)
au> Кстати, русский для этого не подойдёт — надо урезать до неузнаваемости.

Почему? Прекрасно подходит. И даже куда лучше английского, так как более помехозащищённый :)
 

Balancer

администратор
★★★★☆

U235> Я бы просто предложил использовать повторение слов, особенно если используются команды в одно слово. То бишь например на "дверь" автоматика не реагирует, зато реагирует на "дверь-дверь"

«Стоп-стоп, куда это мы приехали» — в ряде случаев очень даже используется :)
 
+
-
edit
 

Fakir

BlueSkyDreamer
★★★
Ну ты всё-таки не забывай про "космический" контекст :)
Космонавт во время ВКД вполне может натренироваться отдавать специфические простые команды без косяков. К тому же на звук не должно быть завязано ничего критически важного - т.е. даже ошибочное срабатывание - максимум небольшое неудобство. Т.е. это либо малозначительные вспомогательные, либо медленные процессы.
Управление терморегуляцией скафандра, например, можно бы на звук завязать.
 3.6.33.6.3
+
-
edit
 

Balancer

администратор
★★★★☆

Fakir> Управление терморегуляцией скафандра, например, можно бы на звук завязать.

Ну, разве что.
 
AD Реклама Google — средство выживания форумов :)

au

   
★★
Balancer> «Свет, иди сюда!»

В космосе, ага.. :)

Balancer> «Я завтра поеду в Тверь»

Из космоса прямо в Тверь :) Ты хочешь сказать что язык не подходит в общем случае для управления? Дык я о том и писал выше. Но рассмотрел очень частный случай — структурированную среду (космос) и очень ограниченный язык (набор выкриков). Это меняет дело.

Balancer> «Стоп, что за фигня у меня получается?»

Базар фильтровать надо :) Пилоты в масках в носу ковыряться не могут и не везде могут почесаться — но летают, приспосабливаются. Если язык становится органом управления, за ним придётся следить. Но потому и лучше сделать специальный синтетический язык, чтобы не было интерференции в головах и "эфире".

Balancer> Почему? Прекрасно подходит. И даже куда лучше английского, так как более помехозащищённый :)

Сильно всё длинно на русском, на глаз на 50% длиннее английского в общем случае. Смотри как военные сокращают (товсь, пли и море сокращений) — вот им надо быстро и точно, а язык под это не оптимизирован. Английский в этом лучше, т.к. он более модульный и простой, хотя далёк от идеала в контексте. Разговаривать чтобы включить или подкрутить — пытка. Это должна быть звуковая кнопка — чпок-готово. Именно "свет", "стоп", "пуск", цифры, и т.п. "кнопки".
 

  • Balancer [16.05.2013 19:40]: Перенос сообщений в Google Plus
Последние действия над темой

в начало страницы | новое
 
Поиск
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru