Страница: 1 | 2 |
Вопрос: Распознование речи
Добавлено: 27.08.08 18:10
Автор вопроса: Игорь | ICQ: 457394129
Ктонибудь может подсказать примеры распознавания речи?
Зарание благодарен!
Ответы
Всего ответов: 16
Номер ответа: 1
Автор ответа:
Sharp
Лидер форума
ICQ: 216865379
Вопросов: 106
Ответов: 9979
Web-сайт:
Профиль | | #1
Добавлено: 27.08.08 20:56
Распознавание речи - сложная исследовательская задача, не решенная даже наполовину. Что-то мне подсказывает, что ты не найдешь рабочих примеров этого на VB.
Номер ответа: 2
Автор ответа:
HACKER
Разработчик Offline Client
Вопросов: 236
Ответов: 8362
Профиль | | #2
Добавлено: 27.08.08 22:40
Есть компонент от MS для распознавания речи. Есть даже примеры его использования на VB. Компонент этот умеет распознавать только английскую речь, хотя может уже и не только... Но лично я, когда пробовал, так и не смог заставить его распознавать. Может конечно мой разговорный английский довольно хромой, но оно не распознавало даже такие простые слова как car, book, etc... Может я что-то делал не так, или использовал старую версию компонента.
Номер ответа: 3
Автор ответа:
Morpheus
Вопросов: 224
Ответов: 3777
Web-сайт:
Профиль | | #3
Добавлено: 28.08.08 01:39
Как раз над этим работаю (начитался фантастики про Джейн живущую в в волнах Ансибла). Пока нашёл вот чё:
http://www.codeguru.com/vb/gen/vb_misc/plugins/article.php/c11019
http://www.developerfusion.co.uk/show/1989/
http://www.martin2k.co.uk/vb6/tips/vb_10.php
http://idealprogrammer.com/languages/visual-basic-vbnet/visual-studio-2005-express-part-5-speech-recognition/
http://www.speechstudio.com/press/press011030.htm
Номер ответа: 4
Автор ответа:
Игорь
ICQ: 457394129
Вопросов: 52
Ответов: 133
Профиль | | #4
Добавлено: 28.08.08 19:19
Не плохие ссылки! Но я всё пытаюсь собрать собственную систему распознования. Так как я по натуре физик, то я хотел начать с того - как разложить звук на частоты, а уже потом сличать по определённой частоте. Но всё епёрлось в то, что я не могу в одиночку справиться с процесом разложения. Я 100% уверен в успехе данной затее, так как уже доказано что у всех людей в голосе присутствует на 99,9% одинакый отзвук. Если мы сможем его отделить, то можно считать что 50% работы выполнено!
Поэтому у нас 2 задачи:
1)Отделить нужную частоту из звука.
2)Сличить 2 отделённую и исходную(заложенную в память компа) частоты на идентичность!
Номер ответа: 5
Автор ответа:
Artyom
Разработчик
Вопросов: 130
Ответов: 6602
Профиль | | #5
Добавлено: 28.08.08 20:39
Если ты не можешь решить первую задачу, то вряд ли осилишь весь алгорит распознования
Разложение звука на отдельные частоты выполняется по какому-то готовому алгоритму, кажется Фурье, Sharp может поправить если я не прав.
Но одного разложения на частоты тут совсем недостаточно. Как уже сказали, задача очень сложная, чтоб решить ее самому не обладая специальными знаниями (помимо общего курса физики )
Номер ответа: 6
Автор ответа:
Администратор
ICQ: 278109632
Вопросов: 42
Ответов: 3949
Web-сайт:
Профиль | | #6
Добавлено: 28.08.08 21:43
Steel Brand, +1
Я знаю человека, который занимается этой проблемой в большой компании не один год, и, поверь, вряд ли ты справишься с подобной задачей, если ты не гений.
Номер ответа: 7
Автор ответа:
Sharp
Лидер форума
ICQ: 216865379
Вопросов: 106
Ответов: 9979
Web-сайт:
Профиль | | #7
Добавлено: 28.08.08 22:59
Странно, как можно называть себя физиком, даже не слышав о преобразовании Фурье. Алгоритм называется Fast Fourier Transformation (FFT).
В голосах разных людей совершенно разная спектральная картина - разные длительности, интенсивности и частоты разных сигналов. Какие-то фонемы можно выделить только по соотношениям тембров и пауз.
На практике получается, что для любой недикторской речи половина фонем вообще не распознается: мозг дополняет их набор на основе предположений о том, что он может услышать. Но компьютер таких предположений сделать не может - у него нет знаний и он не способен понимать, о чем идет речь.
Номер ответа: 8
Автор ответа:
Игорь
ICQ: 457394129
Вопросов: 52
Ответов: 133
Профиль | | #8
Добавлено: 29.08.08 14:26
Не стоит столбить в один голос о том что мол раз молод, значит глуп. Жизнь такая штука что сегодня 20 мужиков сланяют мозги не могя притворить жизнь идею, а завтра какойнибудь пацан в лице большенства обитателей данного сайта озарится идеей, которая в итоге даст ему ответы на многие вопросы. Все люди мыслят по разному-мы не машины! И здесь не обязательно быть гением. Порой чтото случайно увиденное мгновенно наталкивает на верный путь!
Так что давайте перестанем разводить философию, а займёмся непосредственно работой. И попрошу просто так тему не засорять, берите пример с Morpheus!
Номер ответа: 9
Автор ответа:
Игорь
ICQ: 457394129
Вопросов: 52
Ответов: 133
Профиль | | #9
Добавлено: 29.08.08 14:30
И впреть писать что всё это очень сложно-не стоит! Это и "Ежу" понятно!
Номер ответа: 10
Автор ответа:
Sharp
Лидер форума
ICQ: 216865379
Вопросов: 106
Ответов: 9979
Web-сайт:
Профиль | | #10
Добавлено: 29.08.08 15:44
Случай помогает только подготовленным умам (ц) Луи Пастер
Без знания основ математики, таких, как оператор Фурье, функциональный анализ и кластеризация образов, будь ты хоть суперудачливым пацаном, никакая идея тебе в голову не придет.
Morpheus, между прочим, в топ5 крутейших математиков митуя входит точно.
Номер ответа: 11
Автор ответа:
HACKER
Разработчик Offline Client
Вопросов: 236
Ответов: 8362
Профиль | | #11
Добавлено: 30.08.08 00:19
Ко мне в голову пришла мысль, но уша не застав меня
Номер ответа: 12
Автор ответа:
Smith
ICQ: adamis@list.ru
Вопросов: 153
Ответов: 3632
Профиль | | #12
Добавлено: 31.08.08 20:37
Звучит весьма высокопарно и интригующе,
где нибудь можно посмотреть эти рейтинги?
Номер ответа: 13
Автор ответа:
Artyom
Разработчик
Вопросов: 130
Ответов: 6602
Профиль | | #13
Добавлено: 31.08.08 21:02
Я тоже в этот ТОП вхожу
Номер ответа: 14
Автор ответа:
VβÐUηìt
Вопросов: 246
Ответов: 3333
Web-сайт:
Профиль | | #14
Добавлено: 19.09.08 20:41
Короче, у меня знакомые делали распознавание, но не речи + ко всему на С++. Детектор отбивок, так сказать. В общем он сравнивает запомненные звуки с текущим звуковым потоком.
На этом можно построить распознование речи, только при этом убьешься об стену тысячу раз.
2Steel Brand: Входишь, входишь и никак не войдешь
Номер ответа: 15
Автор ответа:
Администратор
ICQ: 278109632
Вопросов: 42
Ответов: 3949
Web-сайт:
Профиль | | #15
Добавлено: 19.09.08 21:20
На этом можно построить распознование речи
Нельзя.