標籤 即時指令喚醒 2023-12-17 183 閱讀 語音 Pytorch 人工智能 FunASR Pytorch 語音識別 語音喚醒 本文介紹了即時指令喚醒程序的開發與使用,包括安裝環境、指令喚醒、微調模型等步驟。項目基於Anaconda 3和Python 3.11運行,並依賴PyTorch 2.1.0及CUDA 12.1。用戶可通過調整`sec_time`和`last_len`參數來定製錄音時間與長度,同時在`instruct.txt`添加指令進行個性化設置。 程序通過`infer_pytorch.py`或`infer_on 閱讀全文 FunASR語音識別GUI界面應用 2023-10-08 215 閱讀 語音 Pytorch 語音識別 人工智能 FunASR Pytorch 本文介紹了一個基於FunASR開發的語音識別GUI應用,支持本地音頻、視頻文件的識別及錄音識別。該應用包含短音頻、長音頻(含無時間戳和帶時間戳)識別功能,並能播放音頻文件。 安裝環境需PyTorch(CPU/GPU)、FFmpeg、pyaudio等依賴庫。使用時執行`main.py`,界面提供四個選項:短語音識別、長語音識別、錄音識別及播放功能。其中長語音識別分爲兩種模型,一種拼接輸出,另一種顯 閱讀全文