标签: FunASR

实时指令唤醒

本文介绍了实时指令唤醒程序的开发与使用,包括安装环境、指令唤醒、微调模型等步骤。项目基于Anaconda 3和Python 3.11运行,并依赖PyTorch 2.1.0及CUDA 12.1。用户可通过调整`sec_time`和`last_len`参数来定制录音时间与长度,同时在`instruct.txt`添加指令进行个性化设置。 程序通过`infer_pytorch.py`或`infer_on

阅读全文
FunASR语音识别GUI界面应用

本文介绍了一个基于FunASR开发的语音识别GUI应用,支持本地音频、视频文件的识别及录音识别。该应用包含短音频、长音频(含无时间戳和带时间戳)识别功能,并能播放音频文件。 安装环境需PyTorch(CPU/GPU)、FFmpeg、pyaudio等依赖库。使用时执行`main.py`,界面提供四个选项:短语音识别、长语音识别、录音识别及播放功能。其中长语音识别分为两种模型,一种拼接输出,另一种显

阅读全文