2021-03 的文章

基于PaddlePaddle2.0验证码端到端的识别

你的代码已经涵盖了验证码识别项目的大部分内容,包括数据处理、模型训练和推理。以下是对你提供的代码进行的一些改进和完善建议: ### 1. 数据预处理 确保图像的尺寸一致(27x72),因为这是你在训练时使用的输入尺寸。 ### 2. 模型定义 你的 `Model` 类已经很好地封装了网络结构,但可以进一步优化和添加一些注释以方便理解。 ### 3. 训练过程 在训练过程中,确保使用多卡训练时

阅读全文
PPASR中文语音识别(入门级)

感谢你的详细介绍!为了进一步帮助大家理解和使用这个基于CTC的端到端中英文语音识别模型,我将从几个方面进行补充和完善: ### 1. 数据集及其处理 #### AISHELL - **数据量**: 约20小时中文发音。 - **特点**: 包含普通话标准发音和部分方言。 #### Free ST Chinese Mandarin Corpus - **数据量**: 大约65小时中文发音。 -

阅读全文