-
MusicManager
-
Автор темы
-
Не в сети
-
Новый участник
-
-
Сообщений: 3
-
Спасибо получено: 0
-
-
|
Здравствуйте. Есть задумка сотворить устройство, которое могло бы аппаратно декодировать входящий звуковой поток в транскрипцию на лету. Цепь видится следующей: микрофон -> каскад усиления -> АЦП -> ПЛИС -> последовательный интерфейс, передающий цифровой код фонемы (например со статичной скоростью, скажем, 100 в секунду). Далее конечный аппарат будет подбирать комбинации фонем со словарём, и это будет уже отдельная история.
Поделитесь, пожалуйста, своими мыслями, с какой стороны подходить к логике самого распознавания?
Проблема в том, что поступающий сигнал может быть изрядно зашумлённым..
Как можно ассоциировать тысячи не очень похожих сложных сигналов с одной и той же фонемой? (постарайся записать один и тот же звук и он будет бинарно отличаться).
Я так понимаю, входной сигнал придётся преобразовывать БПФ?
Но как дальше? Очень прошу поделиться знаниями. Интерес чисто научный. С желанием собрать готовое устройство.
|
Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.
|
-
leshabirukov
-
-
Не в сети
-
Захожу иногда
-
-
Сообщений: 56
-
Спасибо получено: 13
-
-
|
Задумка интересная, но зачем вопросы по специфике обработки голоса задавать здесь? ПЛИС это инструмент, а не серебряная пуля. Ищите специалистов, гуглите статьи. БПФ вам позволит получить спектр сигнала, но что с ним дальше делать, это уж вам здесь вряд ли подскажут.
|
Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.
|
-
ali00ff
-
-
Не в сети
-
Новый участник
-
-
Сообщений: 8
-
Спасибо получено: 1
-
-
|
rutracker.org/
> поиск > "электроника"
вывалят книги, мнооооого книг
Точно не помню как назывались, но по теме было много.
Обработка звука, про ADC, специализированные микрухи и.т.п.
|
Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.
|
-
Chaosorg
-
-
Не в сети
-
Завсегдатай
-
-
Сообщений: 312
-
Спасибо получено: 18
-
-
-
|
А еще вряд ли пожалеете, если попробуете нейросети. Через них можно потом и не только звук пропускать, но и вообще все что угодно. И делать кучу всего интересного. БПФ даст Вам ленту со спектром и можно отнестись к ней как к изображению, образы которых надо распознать.
|
Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.
|
-
umarsohod
-
-
Не в сети
-
Администрация форума
-
-
Сообщений: 816
-
Спасибо получено: 168
-
-
|
Chaosorg пишет: А еще вряд ли пожалеете, если попробуете нейросети. Через них можно потом и не только звук пропускать, но и вообще все что угодно. И делать кучу всего интересного. БПФ даст Вам ленту со спектром и можно отнестись к ней как к изображению, образы которых надо распознать.
Это конечно - БРАВО , сам долго думал что ответить. но не нашелся ;)
|
Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.
|
Время создания страницы: 0.132 секунд