任务说明

本任务旨在开发CV180X/CV181x处理器上的通用文字检测与识别算法,能够有效地检测图像中的文本区域并准确识别文本内容。该算法旨在适用于各种应用场景,包括但不限于文档识别、图像中文字提取、自动化报告生成等,能够提高文字信息的自动化处理水平。

 

  • 验收标准

算法性能将在评测集上进行评估,主要关注准确度和计算复杂度。

  1. 准确度: 要求在评测集上达到95%的准确度,确保对不同场景下的文字区域进行准确检测与识别。
  2. FLOPS要求: 算法的运算复杂度(FLOPS)应适应处理器平台,不超过30G,以确保在嵌入式设备上的高效运行。

 

  • 评测集

评测集将包含多个场景,以模拟实际应用中可能遇到的各种情况:

  1. 文字密度变化: 不同密度的文字区域,包括稀疏和密集的文本布局。
  2. 字体与大小变化: 不同字体和文字大小的图像,以测试算法对各种文字样式的适应性。
  3. 光照条件: 光照均匀以及弱光条件下的图像。
  4. 样本数量: 评测集中的样本数量应大于500,以确保充分评估算法性能。

通过这些评测集的要求,我们期望算法在实际应用场景中表现出高准确度和鲁棒性,满足通用文字检测与识别的实际需求

 

数据采集流程

 

  • 数据采集方案制定

采集方案应该根据算法实际应用场景而定,首先确定采集变量,例如:采集场景,采集数量,采集人数,性别,年龄等。为每个变量按照索引编排好,并为每个变量赋予英文简称。例如有采集场景、采集距离、采集性别三个变量,则可编号为:

  1. 场景1:indoor;场景2:outdoor 
  2. 距离1:1m;距离2:3m;距离3:5m
  3. 性别1:male,性别2:female

然后根据变量确定采集流程,如先按变量1采集还是变量2采集,被采集人的动作方式以及注意事项等,将以上采集方案以及变量信息整理为word文档进行保存。

 

  • 准备采集设备

采集设备要尽可能贴近实际使用的设备,并确保可以长时间保存,准备好采集固件。

 

  • 数据采集与保存

进行数据采集,并按照以下格式命名:根据“数据采集方案制定”定义的采集变量的顺序保存文件,名称形如x-x-x-x.xxx。例如有场景、距离、性别三个变量,保存格式为:indoor-3m-female-12.xxx,表示采集到的第12个“indoor场景、3m距离、女性”的数据。采集完毕,应该把采集的数据和“数据采集方案制定”的采集说明文档放到一起,以备查验。