Голосовое управление
-
- interested
- Сообщения: 7
- Зарегистрирован: 21 сен 2010, 22:28
- Версия LabVIEW: 10
Голосовое управление
Здравствуйте.Нужна помощь,т.к я только как 2 дня разбираюсь с лабвью.Задача следующая.Необходимо например командой завершить работу выключить комп ,для начала локальный.Как записывать звук с микрофона разобрался,как вырубать комп тоже.вот дальше тупик.Я так понимаю нужно получить массив в котором будут частоты этого сигнала с микрофона и сравнить с массивом частот сигнала,хранящегося на компе,присовпадении выполняется команда завершения работы.Для получения частот могу я использовать БПФ ,какая это функция в лабвью и можно ли потом из неё напрямую вывести в массив частоты??
-
Eugen Graf
- guru
- Сообщения: 6502
- Зарегистрирован: 13 ноя 2007, 02:20
- Награды: 4
- Версия LabVIEW: 2009
- Откуда: Saarbrücken
- Контактная информация:
Re: Голосовое управление
А посмотреть пару тем ниже в этой же ветке?
http://labviewportal.org/viewtopic.php?f=81&t=2195
И да, мне кажется достаточно много готовых распознавателей голоса, которые можно встроить в программу. По-моему это не так просто, как кажется.
http://labviewportal.org/viewtopic.php?f=81&t=2195
И да, мне кажется достаточно много готовых распознавателей голоса, которые можно встроить в программу. По-моему это не так просто, как кажется.
-
- leader
- Сообщения: 548
- Зарегистрирован: 20 авг 2009, 17:58
- Награды: 2
- Версия LabVIEW: 2011
- Контактная информация:
Re: Голосовое управление
FFT Power Spectrum, Spectral Measurements, Power Spectrum ...
We live in a graphical world.
Why not program in one?
Why not program in one?
-
- interested
- Сообщения: 7
- Зарегистрирован: 21 сен 2010, 22:28
- Версия LabVIEW: 10
Re: Голосовое управление
Спасибо,теперь появился другой вопрос,вотя беру waw файл,считываю,разбиваю на части ,делаю FFT(Задаю размер 1024) на выходе засовываю в массив и получаю в массиве 1024 значения,а я так понимаю должно быть 512?Почему так? или я что то не так понимаю (значения вида A+iB)??
-
- VIP
- Сообщения: 1338
- Зарегистрирован: 03 фев 2010, 00:42
- Награды: 6
- Версия LabVIEW: 6.1 - 2024
- Откуда: Германия
- Благодарил (а): 1 раз
- Поблагодарили: 44 раза
- Контактная информация:
Re: Голосовое управление
Зачем так сурово? Есть же готовые библиотеки:
http://sine.ni.com/devzone/cda/epd/p/id/4401
http://sine.ni.com/devzone/cda/epd/p/id/4401
-
- interested
- Сообщения: 7
- Зарегистрирован: 21 сен 2010, 22:28
- Версия LabVIEW: 10
-
Chupakabra
- professional
- Сообщения: 360
- Зарегистрирован: 21 янв 2009, 10:50
- Награды: 1
- Версия LabVIEW: 2015
- Откуда: Москва
- Поблагодарили: 4 раза
- Контактная информация:
Re: Голосовое управление
Это микрософтовский речевой движок задействует, а может человек свой алгоритм хочет реализовать распознавания.AndreyDmitriev писал(а):Зачем так сурово? Есть же готовые библиотеки:
http://sine.ni.com/devzone/cda/epd/p/id/4401
Правда качественное распознавание речи очень нетривиальная задача, которая до сих пор не решена никем.
-
- interested
- Сообщения: 7
- Зарегистрирован: 21 сен 2010, 22:28
- Версия LabVIEW: 10
Re: Голосовое управление
Да,готовые решения мне не подходят,насчёт нетривиальности я уже понял.Сначала думал что всё будет проще.Увы.
Вообще алгоритм следующий:
Алгоритм распознавания.
1. Программа проводит непрерывное прослушивание.
2. С помощью амплитудного метода происходит выделение слов из общего потока.
3. Полученный блок данных подвергается нормализации.
4. Блок данных разбивается на кадры перекрывающим методом.
5. Каждый кадр переводится в набор коэффициентов с помощью преобразования Фурье.
6. Полученный вектор коэффициентов (для всего блока данных) сравнивается со всеми шаблонами с помощью метода Dynamic Time Warping.
7. Пользователю выдается результат.
Вот с методом Dynamic Time Warping проблемы,не могу понять ка его в лабвью реализовать.Может кто-нибудь сталкивался??
Вообще алгоритм следующий:
Алгоритм распознавания.
1. Программа проводит непрерывное прослушивание.
2. С помощью амплитудного метода происходит выделение слов из общего потока.
3. Полученный блок данных подвергается нормализации.
4. Блок данных разбивается на кадры перекрывающим методом.
5. Каждый кадр переводится в набор коэффициентов с помощью преобразования Фурье.
6. Полученный вектор коэффициентов (для всего блока данных) сравнивается со всеми шаблонами с помощью метода Dynamic Time Warping.
7. Пользователю выдается результат.
Вот с методом Dynamic Time Warping проблемы,не могу понять ка его в лабвью реализовать.Может кто-нибудь сталкивался??
-
- interested
- Сообщения: 7
- Зарегистрирован: 21 сен 2010, 22:28
- Версия LabVIEW: 10
Re: Голосовое управление
может быть кто-нибудь подскажет книги по лабвью ,на данную тематику,если такие конечно есть.
-
Sergey Ivanov
- expert
- Сообщения: 1217
- Зарегистрирован: 01 мар 2009, 20:54
- Награды: 5
- Версия LabVIEW: 2018
- Откуда: Санкт-Петербург, Кронштадт
- Благодарил (а): 11 раз
- Поблагодарили: 1 раз
- Контактная информация:
Re: Голосовое управление
есть только не по
Статьи (взято от сюда http://www.gladkos.com/speech/articles )
книги: http://www.gladkos.com/speech/books
PS сорри за поднятие старой темы. просто решил поделиться тем, что нашёл
Статьи (взято от сюда http://www.gladkos.com/speech/articles )
книги: http://www.gladkos.com/speech/books
PS сорри за поднятие старой темы. просто решил поделиться тем, что нашёл
Добро пожаловать на http://rk-stud.ru/
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
- 3 Ответы
- 53 Просмотры
-
Последнее сообщение Artem.spb