标签: 音视频

YeAudio音频工具的介绍和使用
2024-08-29 149 阅读 语音 音视频 语音识别 Python FFmpeg

这些类定义了各种音频数据增强技术。每个类都负责一种特定的数据增强操作,并且可以通过设置不同的参数来控制增强的程度和类型。以下是对每个类的详细描述: ### 1. **SpecAugmentor** - **功能**: 频域掩蔽和时域掩蔽 - **主要参数**: - `prob`: 数据增强的概率。 - `freq_mask_ratio`: 频域掩蔽的比例(例如0.15意味着在频谱上随机选

阅读全文
鸿蒙应用开发-录音保存并播放音频

你的代码示例展示了如何在鸿蒙系统中实现音频录制和播放功能。下面是对代码的总结和一些改进建议: ### 总结 1. **权限申请**: - 在启动录音之前,需要先请求用户授权。 - 使用 `requestPermissionsFromUser` 方法来获取用户的许可。 2. **录音功能**: - 使用 `startRecord` 开始录制音频,并将文件保存到指定路径。

阅读全文
轻松识别几个小时的长音视频文件

本文介绍了搭建一个长语音识别服务的方法,使其能够处理几十分钟甚至几个小时的音频或视频。首先,需要将文件夹上传至服务器并执行编译、权限修改和启动Docker容器命令来部署服务。测试显示服务可用后,可以使用WebSocket接口或HTTP服务进行交互。 HTTP服务提供了网页界面,支持多种格式音视频上传及录制识别功能,并返回包含每句话开始和结束时间戳的文本结果。此服务简化了长音频识别流程,提高了用户

阅读全文