Добро пожаловать, Гость
Логин: Пароль: Запомнить меня
  • Страница:
  • 1

ТЕМА: Распознавание голоса

Распознавание голоса 9 года 7 мес. назад #3039

Здравствуйте. Есть задумка сотворить устройство, которое могло бы аппаратно декодировать входящий звуковой поток в транскрипцию на лету. Цепь видится следующей: микрофон -> каскад усиления -> АЦП -> ПЛИС -> последовательный интерфейс, передающий цифровой код фонемы (например со статичной скоростью, скажем, 100 в секунду). Далее конечный аппарат будет подбирать комбинации фонем со словарём, и это будет уже отдельная история.
Поделитесь, пожалуйста, своими мыслями, с какой стороны подходить к логике самого распознавания?
Проблема в том, что поступающий сигнал может быть изрядно зашумлённым..
Как можно ассоциировать тысячи не очень похожих сложных сигналов с одной и той же фонемой? (постарайся записать один и тот же звук и он будет бинарно отличаться).
Я так понимаю, входной сигнал придётся преобразовывать БПФ?
Но как дальше? Очень прошу поделиться знаниями. Интерес чисто научный. С желанием собрать готовое устройство.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Распознавание голоса 9 года 7 мес. назад #3078

Задумка интересная, но зачем вопросы по специфике обработки голоса задавать здесь? ПЛИС это инструмент, а не серебряная пуля. Ищите специалистов, гуглите статьи. БПФ вам позволит получить спектр сигнала, но что с ним дальше делать, это уж вам здесь вряд ли подскажут.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Распознавание голоса 9 года 4 мес. назад #3533

rutracker.org/ > поиск > "электроника"
вывалят книги, мнооооого книг
Точно не помню как назывались, но по теме было много.
Обработка звука, про ADC, специализированные микрухи и.т.п.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Распознавание голоса 9 года 4 мес. назад #3537

А еще вряд ли пожалеете, если попробуете нейросети. Через них можно потом и не только звук пропускать, но и вообще все что угодно. И делать кучу всего интересного. БПФ даст Вам ленту со спектром и можно отнестись к ней как к изображению, образы которых надо распознать.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Последнее редактирование: от Chaosorg.

Распознавание голоса 9 года 4 мес. назад #3538

Chaosorg пишет: А еще вряд ли пожалеете, если попробуете нейросети. Через них можно потом и не только звук пропускать, но и вообще все что угодно. И делать кучу всего интересного. БПФ даст Вам ленту со спектром и можно отнестись к ней как к изображению, образы которых надо распознать.

Это конечно - БРАВО , сам долго думал что ответить. но не нашелся ;)

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

  • Страница:
  • 1
Время создания страницы: 0.132 секунд
Работает на Kunena форум