# 前言
本文將介紹一個準確率非常高的語音識別框架,那就是FunASR,這個框架的模型訓練數據超過幾萬個小時,經過測試,準確率非常高。本文將介紹如何啓動WebSocket服務和Android調用這個服務來即時識別,一邊說話一邊出結果。
安裝環境¶
- 安裝Pytorch。
# 安裝CPU版本的Pytorch
conda install pytorch torchvision torchaudio cpuonly -c pytorch
# 安裝GPU版本的Pytorch
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
- 使用conda安裝ffmpeg等一些庫。
conda install ffmpeg
conda install -c conda-forge pynini
- 安裝其他依賴庫。
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
啓動服務¶
- 執行
server.py程序,啓動上傳音頻文件識別服務。
python server.py
Python不支持多併發的,如果要使用多併發服務,需要在Linux系統上面,執行websocket目錄的Docker應用。
Android應用¶
使用Android Studio打開源碼中的AndroidClient目錄,這是一個Android應用源碼,打開之後首先就要修改WebSocket地址ASR_HOST,將它修改爲你上面使用的服務器IP地址,點擊運行安裝到Android手機上。
應用效果圖:

掃碼入知識星球,搜索【FunASR語音識別WebSocket服務】獲取源碼
