阿拉伯手写字符数据集
手写阿拉伯字符识别系统面临若干挑战,包括人类手写内容的无限变化和大型公共数据库。在这项工作中,我们对深度学习体系结构进行建模,该体系结构可以有效地应用于识别阿拉伯手写字符。卷积神经网络(CNN)是在监督模式下训练的一种特殊类型的前馈多层。CNN对我们的数据库进行了培训和测试,该数据库包含16800个手写阿拉伯字符。本文采用了优化方法来提高CNN的性能。常见的机器学习方法通常结合使用特征提取器和可训练的分类器。CNN的使用在不同的机器学习分类算法之间带来了重大改进。我们提议的CNN平均分为5。
这项研究的目的是利用从多部作品中学到的交叉知识来增强阿拉伯手写字符识别的性能。近年来,具有不同手写风格的阿拉伯手写字符识别也变得越来越重要,因此寻找并研究新的高级手写识别解决方案非常重要。深度学习系统需要大量的数据(图像)才能做出正确的决策。
内容
该数据集由60位参与者书写的16,800个字符组成,年龄范围在19至40岁之间,并且90%的参与者是惯用右手的。每个参与者以两种形式将每个字符(从“ alef”到“ yeh”)写下十次,如图7(a)和7(b)所示。表格以300 dpi的分辨率扫描。使用Matlab 2016a自动分割每个块,以确定每个块的坐标。该数据库分为两组:一个训练集(每个班级13,440个字符到480张图像)和一个测试集(每个班级3,360个字符到120张图像)。培训集和测试集的作者是排他的。包括作者到测试集的顺序是随机的,以确保测试集的作者不是来自单个机构(以确保测试集的可变性)。
在实验部分,我们证明了该结果令人鼓舞,在测试图像上的分类准确率为94.9%。在未来的工作中,我们计划致力于提高手写阿拉伯字符识别的性能。