標籤 "FunASR" 下的文章

即時指令喚醒

2023-12-17 183 閱讀語音 Pytorch 人工智能 FunASR Pytorch 語音識別語音喚醒

本文介紹了即時指令喚醒程序的開發與使用，包括安裝環境、指令喚醒、微調模型等步驟。項目基於Anaconda 3和Python 3.11運行，並依賴PyTorch 2.1.0及CUDA 12.1。用戶可通過調整`sec_time`和`last_len`參數來定製錄音時間與長度，同時在`instruct.txt`添加指令進行個性化設置。程序通過`infer_pytorch.py`或`infer_on

閱讀全文

FunASR語音識別GUI界面應用

2023-10-08 215 閱讀語音 Pytorch 語音識別人工智能 FunASR Pytorch

本文介紹了一個基於FunASR開發的語音識別GUI應用，支持本地音頻、視頻文件的識別及錄音識別。該應用包含短音頻、長音頻（含無時間戳和帶時間戳）識別功能，並能播放音頻文件。安裝環境需PyTorch（CPU/GPU）、FFmpeg、pyaudio等依賴庫。使用時執行`main.py`，界面提供四個選項：短語音識別、長語音識別、錄音識別及播放功能。其中長語音識別分爲兩種模型，一種拼接輸出，另一種顯

閱讀全文