标签: 音视频

YeAudio音频工具的介绍和使用

2024-08-29 202 阅读语音音视频语音识别 Python FFmpeg

这些类定义了各种音频数据增强技术。每个类都负责一种特定的数据增强操作，并且可以通过设置不同的参数来控制增强的程度和类型。以下是对每个类的详细描述： ### 1. **SpecAugmentor** - **功能**: 频域掩蔽和时域掩蔽 - **主要参数**: - `prob`: 数据增强的概率。 - `freq_mask_ratio`: 频域掩蔽的比例（例如0.15意味着在频谱上随机选

阅读全文

鸿蒙应用开发-录音保存并播放音频

2024-03-26 157 阅读鸿蒙应用开发 HarmonyOS 音视频华为鸿蒙系统

你的代码示例展示了如何在鸿蒙系统中实现音频录制和播放功能。下面是对代码的总结和一些改进建议： ### 总结 1. **权限申请**： - 在启动录音之前，需要先请求用户授权。 - 使用 `requestPermissionsFromUser` 方法来获取用户的许可。 2. **录音功能**： - 使用 `startRecord` 开始录制音频，并将文件保存到指定路径。

阅读全文

轻松识别几个小时的长音视频文件

2024-01-07 92 阅读语音 Pytorch 音视频语音识别 Pytorch 人工智能

本文介绍了搭建一个长语音识别服务的方法，使其能够处理几十分钟甚至几个小时的音频或视频。首先，需要将文件夹上传至服务器并执行编译、权限修改和启动Docker容器命令来部署服务。测试显示服务可用后，可以使用WebSocket接口或HTTP服务进行交互。 HTTP服务提供了网页界面，支持多种格式音视频上传及录制识别功能，并返回包含每句话开始和结束时间戳的文本结果。此服务简化了长音频识别流程，提高了用户

阅读全文

夜雨飘零

友情链接

标签: 音视频

YeAudio音频工具的介绍和使用

鸿蒙应用开发-录音保存并播放音频

轻松识别几个小时的长音视频文件