标签: FFmpeg

YeAudio音频工具的介绍和使用
2024-08-29 58 阅读 语音 音视频 语音识别 Python FFmpeg

这些类定义了各种音频数据增强技术。每个类都负责一种特定的数据增强操作,并且可以通过设置不同的参数来控制增强的程度和类型。以下是对每个类的详细描述: ### 1. **SpecAugmentor** - **功能**: 频域掩蔽和时域掩蔽 - **主要参数**: - `prob`: 数据增强的概率。 - `freq_mask_ratio`: 频域掩蔽的比例(例如0.15意味着在频谱上随机选

阅读全文