Голосовое управление

KarpovDeniska

Здравствуйте.Нужна помощь,т.к я только как 2 дня разбираюсь с лабвью.Задача следующая.Необходимо например командой завершить работу выключить комп ,для начала локальный.Как записывать звук с микрофона разобрался,как вырубать комп тоже.вот дальше тупик.Я так понимаю нужно получить массив в котором будут частоты этого сигнала с микрофона и сравнить с массивом частот сигнала,хранящегося на компе,присовпадении выполняется команда завершения работы.Для получения частот могу я использовать БПФ ,какая это функция в лабвью и можно ли потом из неё напрямую вывести в массив частоты??

Сообщение **Eugen Graf** » 21 сен 2010, 23:40

А посмотреть пару тем ниже в этой же ветке?
http://labviewportal.org/viewtopic.php?f=81&t=2195

И да, мне кажется достаточно много готовых распознавателей голоса, которые можно встроить в программу. По-моему это не так просто, как кажется.

Сообщение **Eugene** » 21 сен 2010, 23:40

FFT Power Spectrum, Spectral Measurements, Power Spectrum ...

KarpovDeniska

Спасибо,теперь появился другой вопрос,вотя беру waw файл,считываю,разбиваю на части ,делаю FFT(Задаю размер 1024) на выходе засовываю в массив и получаю в массиве 1024 значения,а я так понимаю должно быть 512?Почему так? или я что то не так понимаю (значения вида A+iB)??

Зачем так сурово? Есть же готовые библиотеки:
http://sine.ni.com/devzone/cda/epd/p/id/4401

KarpovDeniska

Спасибо,как то даже не подумал.

Сообщение **Chupakabra** » 27 сен 2010, 10:32

AndreyDmitriev писал(а):Зачем так сурово? Есть же готовые библиотеки:
http://sine.ni.com/devzone/cda/epd/p/id/4401

Это микрософтовский речевой движок задействует, а может человек свой алгоритм хочет реализовать распознавания.
Правда качественное распознавание речи очень нетривиальная задача, которая до сих пор не решена никем.

KarpovDeniska

Да,готовые решения мне не подходят,насчёт нетривиальности я уже понял.Сначала думал что всё будет проще.Увы.

Вообще алгоритм следующий:
Алгоритм распознавания.
1. Программа проводит непрерывное прослушивание.
2. С помощью амплитудного метода происходит выделение слов из общего потока.
3. Полученный блок данных подвергается нормализации.
4. Блок данных разбивается на кадры перекрывающим методом.
5. Каждый кадр переводится в набор коэффициентов с помощью преобразования Фурье.
6. Полученный вектор коэффициентов (для всего блока данных) сравнивается со всеми шаблонами с помощью метода Dynamic Time Warping.
7. Пользователю выдается результат.

Вот с методом Dynamic Time Warping проблемы,не могу понять ка его в лабвью реализовать.Может кто-нибудь сталкивался??

KarpovDeniska

может быть кто-нибудь подскажет книги по лабвью ,на данную тематику,если такие конечно есть.

есть

только не по

Статьи (взято от сюда http://www.gladkos.com/speech/articles )

статьи.zip: (16.03 МБ) 144 скачивания

книги: http://www.gladkos.com/speech/books

PS сорри за поднятие старой темы. просто решил поделиться тем, что нашёл

Голосовое управление

Голосовое управление

Re: Голосовое управление

Re: Голосовое управление

Re: Голосовое управление

Re: Голосовое управление

Re: Голосовое управление

Re: Голосовое управление

Re: Голосовое управление

Re: Голосовое управление

Re: Голосовое управление