Visual Basic, .NET, ASP, VBScript
 

   
   
     

Форум - Общий форум

Страница: 1 | 2 |

 

  Вопрос: Распознование речи Добавлено: 27.08.08 18:10  

Автор вопроса:  Игорь | ICQ: 457394129 
Ктонибудь может подсказать примеры распознавания речи?
Зарание благодарен!

Ответить

  Ответы Всего ответов: 16  

Номер ответа: 1
Автор ответа:
 Sharp


Лидер форума

ICQ: 216865379 

Вопросов: 106
Ответов: 9979
 Web-сайт: sharpc.livejournal.com
 Профиль | | #1
Добавлено: 27.08.08 20:56
Распознавание речи - сложная исследовательская задача, не решенная даже наполовину. Что-то мне подсказывает, что ты не найдешь рабочих примеров этого на VB.

Ответить

Номер ответа: 2
Автор ответа:
 HACKER


 

Разработчик Offline Client

Вопросов: 236
Ответов: 8362
 Профиль | | #2 Добавлено: 27.08.08 22:40
Есть компонент от MS для распознавания речи. Есть даже примеры его использования на VB. Компонент этот умеет распознавать только английскую речь, хотя может уже и не только... Но лично я, когда пробовал, так и не смог заставить его распознавать. Может конечно мой разговорный английский довольно хромой, но оно не распознавало даже такие простые слова как car, book, etc... Может я что-то делал не так, или использовал старую версию компонента.

Ответить

Номер ответа: 3
Автор ответа:
 Morpheus



Вопросов: 224
Ответов: 3777
 Web-сайт: xury.zx6.ru
 Профиль | | #3
Добавлено: 28.08.08 01:39
Как раз над этим работаю (начитался фантастики про Джейн живущую в в волнах Ансибла). Пока нашёл вот чё:

http://www.codeguru.com/vb/gen/vb_misc/plugins/article.php/c11019
http://www.developerfusion.co.uk/show/1989/
http://www.martin2k.co.uk/vb6/tips/vb_10.php
http://idealprogrammer.com/languages/visual-basic-vbnet/visual-studio-2005-express-part-5-speech-recognition/
http://www.speechstudio.com/press/press011030.htm

Ответить

Номер ответа: 4
Автор ответа:
 Игорь



ICQ: 457394129 

Вопросов: 52
Ответов: 133
 Профиль | | #4 Добавлено: 28.08.08 19:19
Не плохие ссылки! Но я всё пытаюсь собрать собственную систему распознования. Так как я по натуре физик, то я хотел начать с того - как разложить звук на частоты, а уже потом сличать по определённой частоте. Но всё епёрлось в то, что я не могу в одиночку справиться с процесом разложения. Я 100% уверен в успехе данной затее, так как уже доказано что у всех людей в голосе присутствует на 99,9% одинакый отзвук. Если мы сможем его отделить, то можно считать что 50% работы выполнено!
Поэтому у нас 2 задачи:
1)Отделить нужную частоту из звука.
2)Сличить 2 отделённую и исходную(заложенную в память компа) частоты на идентичность!

Ответить

Номер ответа: 5
Автор ответа:
 Artyom



Разработчик

Вопросов: 130
Ответов: 6602
 Профиль | | #5 Добавлено: 28.08.08 20:39
Если ты не можешь решить первую задачу, то вряд ли осилишь весь алгорит распознования :)

Разложение звука на отдельные частоты выполняется по какому-то готовому алгоритму, кажется Фурье, Sharp может поправить если я не прав.

Но одного разложения на частоты тут совсем недостаточно. Как уже сказали, задача очень сложная, чтоб решить ее самому не обладая специальными знаниями (помимо общего курса физики :) )

Ответить

Номер ответа: 6
Автор ответа:
 



Администратор

ICQ: 278109632 

Вопросов: 42
Ответов: 3949
 Web-сайт: domkratt.com
 Профиль | | #6
Добавлено: 28.08.08 21:43
Steel Brand, +1
Я знаю человека, который занимается этой проблемой в большой компании не один год, и, поверь, вряд ли ты справишься с подобной задачей, если ты не гений.

Ответить

Номер ответа: 7
Автор ответа:
 Sharp


Лидер форума

ICQ: 216865379 

Вопросов: 106
Ответов: 9979
 Web-сайт: sharpc.livejournal.com
 Профиль | | #7
Добавлено: 28.08.08 22:59
Странно, как можно называть себя физиком, даже не слышав о преобразовании Фурье. Алгоритм называется Fast Fourier Transformation (FFT).

В голосах разных людей совершенно разная спектральная картина - разные длительности, интенсивности и частоты разных сигналов. Какие-то фонемы можно выделить только по соотношениям тембров и пауз.

На практике получается, что для любой недикторской речи половина фонем вообще не распознается: мозг дополняет их набор на основе предположений о том, что он может услышать. Но компьютер таких предположений сделать не может - у него нет знаний и он не способен понимать, о чем идет речь.

Ответить

Номер ответа: 8
Автор ответа:
 Игорь



ICQ: 457394129 

Вопросов: 52
Ответов: 133
 Профиль | | #8 Добавлено: 29.08.08 14:26
Не стоит столбить в один голос о том что мол раз молод, значит глуп. Жизнь такая штука что сегодня 20 мужиков сланяют мозги не могя притворить жизнь идею, а завтра какойнибудь пацан в лице большенства обитателей данного сайта озарится идеей, которая в итоге даст ему ответы на многие вопросы. Все люди мыслят по разному-мы не машины! И здесь не обязательно быть гением. Порой чтото случайно увиденное мгновенно наталкивает на верный путь!
Так что давайте перестанем разводить философию, а займёмся непосредственно работой. И попрошу просто так тему не засорять, берите пример с Morpheus!

Ответить

Номер ответа: 9
Автор ответа:
 Игорь



ICQ: 457394129 

Вопросов: 52
Ответов: 133
 Профиль | | #9 Добавлено: 29.08.08 14:30
И впреть писать что всё это очень сложно-не стоит! Это и "Ежу" понятно!

Ответить

Номер ответа: 10
Автор ответа:
 Sharp


Лидер форума

ICQ: 216865379 

Вопросов: 106
Ответов: 9979
 Web-сайт: sharpc.livejournal.com
 Профиль | | #10
Добавлено: 29.08.08 15:44
Случай помогает только подготовленным умам (ц) Луи Пастер
Без знания основ математики, таких, как оператор Фурье, функциональный анализ и кластеризация образов, будь ты хоть суперудачливым пацаном, никакая идея тебе в голову не придет.
Morpheus, между прочим, в топ5 крутейших математиков митуя входит точно.

Ответить

Номер ответа: 11
Автор ответа:
 HACKER


 

Разработчик Offline Client

Вопросов: 236
Ответов: 8362
 Профиль | | #11 Добавлено: 30.08.08 00:19
Ко мне в голову пришла мысль, но уша не застав меня :)

Ответить

Номер ответа: 12
Автор ответа:
 Smith



ICQ: adamis@list.ru 

Вопросов: 153
Ответов: 3632
 Профиль | | #12 Добавлено: 31.08.08 20:37
топ5 крутейших математиков

Звучит весьма высокопарно и интригующе,
где нибудь можно посмотреть эти рейтинги?

Ответить

Номер ответа: 13
Автор ответа:
 Artyom



Разработчик

Вопросов: 130
Ответов: 6602
 Профиль | | #13 Добавлено: 31.08.08 21:02
Я тоже в этот ТОП вхожу :)

Ответить

Номер ответа: 14
Автор ответа:
 VβÐUηìt



Вопросов: 246
Ответов: 3333
 Web-сайт: смекаешь.рф
 Профиль | | #14
Добавлено: 19.09.08 20:41
Короче, у меня знакомые делали распознавание, но не речи + ко всему на С++. Детектор отбивок, так сказать. В общем он сравнивает запомненные звуки с текущим звуковым потоком.

На этом можно построить распознование речи, только при этом убьешься об стену тысячу раз.


2Steel Brand: Входишь, входишь и никак не войдешь :)

Ответить

Номер ответа: 15
Автор ответа:
 



Администратор

ICQ: 278109632 

Вопросов: 42
Ответов: 3949
 Web-сайт: domkratt.com
 Профиль | | #15
Добавлено: 19.09.08 21:20
VβÐ пишет:
На этом можно построить распознование речи

Нельзя.

Ответить

Страница: 1 | 2 |

Поиск по форуму



© Copyright 2002-2011 VBNet.RU | Пишите нам