Вопрос: Распознование речи | Добавлено: 27.08.08 18:10 |
Автор вопроса: ![]() |
Ктонибудь может подсказать примеры распознавания речи?
Зарание благодарен! |
Ответы | Всего ответов: 16 |
Номер ответа: 1 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Лидер форума ICQ: 216865379 Вопросов: 106 Ответов: 9979 |
Web-сайт: Профиль | Цитата | #1 | Добавлено: 27.08.08 20:56 |
Распознавание речи - сложная исследовательская задача, не решенная даже наполовину. Что-то мне подсказывает, что ты не найдешь рабочих примеров этого на VB. |
Номер ответа: 2 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Разработчик Offline Client Вопросов: 236 Ответов: 8362 |
Профиль | Цитата | #2 | Добавлено: 27.08.08 22:40 |
Есть компонент от MS для распознавания речи. Есть даже примеры его использования на VB. Компонент этот умеет распознавать только английскую речь, хотя может уже и не только... Но лично я, когда пробовал, так и не смог заставить его распознавать. Может конечно мой разговорный английский довольно хромой, но оно не распознавало даже такие простые слова как car, book, etc... Может я что-то делал не так, или использовал старую версию компонента. |
Номер ответа: 3 Автор ответа: ![]() ![]() ![]() ![]() ![]() Вопросов: 224 Ответов: 3777 |
Web-сайт: Профиль | Цитата | #3 | Добавлено: 28.08.08 01:39 |
Как раз над этим работаю (начитался фантастики про Джейн живущую в в волнах Ансибла). Пока нашёл вот чё:
http://www.codeguru.com/vb/gen/vb_misc/plugins/article.php/c11019 http://www.developerfusion.co.uk/show/1989/ http://www.martin2k.co.uk/vb6/tips/vb_10.php http://idealprogrammer.com/languages/visual-basic-vbnet/visual-studio-2005-express-part-5-speech-recognition/ http://www.speechstudio.com/press/press011030.htm |
Номер ответа: 4 Автор ответа: ![]() ![]() ICQ: 457394129 Вопросов: 52 Ответов: 133 |
Профиль | Цитата | #4 | Добавлено: 28.08.08 19:19 |
Не плохие ссылки! Но я всё пытаюсь собрать собственную систему распознования. Так как я по натуре физик, то я хотел начать с того - как разложить звук на частоты, а уже потом сличать по определённой частоте. Но всё епёрлось в то, что я не могу в одиночку справиться с процесом разложения. Я 100% уверен в успехе данной затее, так как уже доказано что у всех людей в голосе присутствует на 99,9% одинакый отзвук. Если мы сможем его отделить, то можно считать что 50% работы выполнено!
Поэтому у нас 2 задачи: 1)Отделить нужную частоту из звука. 2)Сличить 2 отделённую и исходную(заложенную в память компа) частоты на идентичность! |
Номер ответа: 5 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Разработчик Вопросов: 130 Ответов: 6602 |
Профиль | Цитата | #5 | Добавлено: 28.08.08 20:39 |
Если ты не можешь решить первую задачу, то вряд ли осилишь весь алгорит распознования ![]() Разложение звука на отдельные частоты выполняется по какому-то готовому алгоритму, кажется Фурье, Sharp может поправить если я не прав. Но одного разложения на частоты тут совсем недостаточно. Как уже сказали, задача очень сложная, чтоб решить ее самому не обладая специальными знаниями (помимо общего курса физики ![]() |
Номер ответа: 6 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() Администратор ICQ: 278109632 Вопросов: 42 Ответов: 3949 |
Web-сайт: Профиль | Цитата | #6 | Добавлено: 28.08.08 21:43 |
Steel Brand, +1
Я знаю человека, который занимается этой проблемой в большой компании не один год, и, поверь, вряд ли ты справишься с подобной задачей, если ты не гений. |
Номер ответа: 7 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Лидер форума ICQ: 216865379 Вопросов: 106 Ответов: 9979 |
Web-сайт: Профиль | Цитата | #7 | Добавлено: 28.08.08 22:59 |
Странно, как можно называть себя физиком, даже не слышав о преобразовании Фурье. Алгоритм называется Fast Fourier Transformation (FFT).
В голосах разных людей совершенно разная спектральная картина - разные длительности, интенсивности и частоты разных сигналов. Какие-то фонемы можно выделить только по соотношениям тембров и пауз. На практике получается, что для любой недикторской речи половина фонем вообще не распознается: мозг дополняет их набор на основе предположений о том, что он может услышать. Но компьютер таких предположений сделать не может - у него нет знаний и он не способен понимать, о чем идет речь. |
Номер ответа: 8 Автор ответа: ![]() ![]() ICQ: 457394129 Вопросов: 52 Ответов: 133 |
Профиль | Цитата | #8 | Добавлено: 29.08.08 14:26 |
Не стоит столбить в один голос о том что мол раз молод, значит глуп. Жизнь такая штука что сегодня 20 мужиков сланяют мозги не могя притворить жизнь идею, а завтра какойнибудь пацан в лице большенства обитателей данного сайта озарится идеей, которая в итоге даст ему ответы на многие вопросы. Все люди мыслят по разному-мы не машины! И здесь не обязательно быть гением. Порой чтото случайно увиденное мгновенно наталкивает на верный путь!
Так что давайте перестанем разводить философию, а займёмся непосредственно работой. И попрошу просто так тему не засорять, берите пример с Morpheus! |
Номер ответа: 9 Автор ответа: ![]() ![]() ICQ: 457394129 Вопросов: 52 Ответов: 133 |
Профиль | Цитата | #9 | Добавлено: 29.08.08 14:30 |
И впреть писать что всё это очень сложно-не стоит! Это и "Ежу" понятно! |
Номер ответа: 10 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Лидер форума ICQ: 216865379 Вопросов: 106 Ответов: 9979 |
Web-сайт: Профиль | Цитата | #10 | Добавлено: 29.08.08 15:44 |
Случай помогает только подготовленным умам (ц) Луи Пастер
Без знания основ математики, таких, как оператор Фурье, функциональный анализ и кластеризация образов, будь ты хоть суперудачливым пацаном, никакая идея тебе в голову не придет. Morpheus, между прочим, в топ5 крутейших математиков митуя входит точно. |
Номер ответа: 11 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Разработчик Offline Client Вопросов: 236 Ответов: 8362 |
Профиль | Цитата | #11 | Добавлено: 30.08.08 00:19 |
Ко мне в голову пришла мысль, но уша не застав меня ![]() |
Номер ответа: 12 Автор ответа: ![]() ![]() ![]() ![]() ![]() ICQ: adamis@list.ru Вопросов: 153 Ответов: 3632 |
Профиль | Цитата | #12 | Добавлено: 31.08.08 20:37 |
топ5 крутейших математиков
Звучит весьма высокопарно и интригующе, где нибудь можно посмотреть эти рейтинги? |
Номер ответа: 13 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Разработчик Вопросов: 130 Ответов: 6602 |
Профиль | Цитата | #13 | Добавлено: 31.08.08 21:02 |
Я тоже в этот ТОП вхожу ![]() |
Номер ответа: 14 Автор ответа: ![]() ![]() ![]() ![]() Вопросов: 246 Ответов: 3333 |
Web-сайт: Профиль | Цитата | #14 | Добавлено: 19.09.08 20:41 |
Короче, у меня знакомые делали распознавание, но не речи + ко всему на С++. Детектор отбивок, так сказать. В общем он сравнивает запомненные звуки с текущим звуковым потоком.
На этом можно построить распознование речи, только при этом убьешься об стену тысячу раз. 2Steel Brand: Входишь, входишь и никак не войдешь ![]() |
Номер ответа: 15 Автор ответа: ![]() ![]() ![]() ![]() ![]() ![]() Администратор ICQ: 278109632 Вопросов: 42 Ответов: 3949 |
Web-сайт: Профиль | Цитата | #15 | Добавлено: 19.09.08 21:20 |
VβÐ пишет:
На этом можно построить распознование речи Нельзя. |
|