任务说明

本任务旨在开发CV180X/CV181x处理器上的语音识别算法,能够从语音信号中准确识别出语音中包含的文本内容。该算法适用于各种语音交互场景,如语音指令识别、语音搜索等,提供用户友好的语音交互体验。

 

  • 验收标准
  1. 算法性能将在评测集上进行评估,主要关注语音识别准确度和计算复杂度。
  2. 识别准确度: 在评测集上达到95%的语音识别准确度。
  3. FLOPS要求: 算法的运算复杂度(FLOPS)应适应处理器平台,不超过35G,以确保在嵌入式设备上的高效运行。

 

  • 评测集工况描述

评测集将包含多个场景,以模拟实际语音识别中可能遇到的各种情况:

  1. 不同说话人: 不同说话人的语音信号,模拟多样化的语音来源。
  2. 不同语调: 不同语调和情绪的语音信号,模拟多样化的语音来源。
  3. 语音噪声: 引入背景噪声、环境噪声,以测试算法在嘈杂环境中的鲁棒性。
  4. 语速和音量变化: 不同语速下的语音信号,以测试算法对语速、音量的适应性。
  5. 样本数量: 评测集中的样本数量应大于500,以确保充分评估算法性能。