# 前言

本文將介紹一個準確率非常高的語音識別框架,那就是FunASR,這個框架的模型訓練數據超過幾萬個小時,經過測試,準確率非常高。本文將介紹如何啓動WebSocket服務和Android調用這個服務來即時識別,一邊說話一邊出結果。

安裝環境

  1. 安裝Pytorch。
# 安裝CPU版本的Pytorch
conda install pytorch torchvision torchaudio cpuonly -c pytorch
# 安裝GPU版本的Pytorch
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
  1. 使用conda安裝ffmpeg等一些庫。
conda install ffmpeg
conda install -c conda-forge pynini
  1. 安裝其他依賴庫。
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

啓動服務

  1. 執行server.py程序,啓動上傳音頻文件識別服務。
python server.py

Python不支持多併發的,如果要使用多併發服務,需要在Linux系統上面,執行websocket目錄的Docker應用。

Android應用

使用Android Studio打開源碼中的AndroidClient目錄,這是一個Android應用源碼,打開之後首先就要修改WebSocket地址ASR_HOST,將它修改爲你上面使用的服務器IP地址,點擊運行安裝到Android手機上。

應用效果圖:

![](/static/files/2023-10-21/5189f2799ca54d73b829324740043783.gif)

掃碼入知識星球,搜索【FunASR語音識別WebSocket服務】獲取源碼

![](/static/files/2023-10-21/39018ff6d9dd4e9aada105ec5685fbf5.png)
小夜