模式识别系统基本上是由三部分组成,即数据采集、数据处理和分类决策或模型匹配。模式识别系统广泛应用在语音识别、指纹识别、数字水印等领域。
模式识别系统基本上是由三部分组成,即数据采集、数据处理和分类决策或模型匹配。模式识别系统广泛应用在语音识别、指纹识别、数字水印等领域。
简介
一个完整的模式识别系统基本上是由三部分组成,即数据采集、数据处理和分类决策或模型匹配。在设计模式识别系统时,需要注意模式类的定义、应用场合、模式表示、特征提取和选择、聚类分析、分类器的设计和学习、训练和测试样本的选取、性能评价等。针对不同的应用目的, 模式识别系统三部分的内容可以有很大的差异, 特别是在数据处理和模式分类这两部分,为了提高识别结果的可靠性往往需要加入知识库(规则)以对可能产生的错误进行修正,或通过引入限制条件大大缩小识别模式在模型库中的搜索空间,以减少匹配计算量。
组成及工作原理
模式识别系统基本由数据采集、数据处理和分类决策或模式匹配组成,他们的工作原理如下:
数据采集
数据采集是利用用各种传感器把被研究对象的各种信息转换为计算机可以接受的数值或符号串集合。习惯上,称这种数值或符号串所组成的空间为模式空间。这一步的关键是传感器的选取。为了从这些数字或符号串中抽取出对识别有效的信息, 必须进行数据处理, 包括数字滤波和特征提取。
数据处理
数字滤波是为了消除输入数据或信息中的噪声,排除不相干的信号, 只留下与被研究对象的性质和采用的识别方法密切相关的特征如表征物体的形状、周长、面积等等。在进行指纹识别时,指纹扫描设备采用合适的滤波算法, 如基于块方图的方向滤波、二值滤波等,过滤掉指纹图像中不必要的部分。
特征提取是指从滤波数据中衍生出有用的信息, 从许多特征中寻找出最有效的特征,以降低后续处理过程的难度。我们对滤波后的这些特征进行必要的计算后,通过特征选招环口提取或基元选择形成模式的特征空间。那么,如何判断什么特征是最有效的呢?人类很容易获取的特征,对于机器来说就很难获取了,这就是模式识别中的特征选择与提取的问题。特征选择和提取是模式识别的一个关键问题。一般情况下,候选特征种类越多,得到的结果应该越好。但是,由此可能会引发维数灾害,即特征维数过高,计算机难以求解。因此, 数据处理阶段的关键是滤波算法和特征提取方法的选取。不同的应用场合,采用的滤波算法和特征提取方法以及提取出来的特征也会不同。