摘要:在本文中,提出了一种模糊图箱数据模型和模糊空间的概念,给出了模糊相似性度量方法,描述了一个模糊空间中的检索过程。
关键词:基于内容 模糊检索 匹配 数据模型
1.模糊检索的基本概念
模糊检索即根据检索对象的模糊特征来查找所需内容。在传统的信息检索领域,最流行的查询是:精确的查询条件和与满足查询条件的结果。而在实际使用中,有许多查询条件不能精确定义,查询结果却是一组与查询条件近似匹配的对象。其中包含了模糊概念,这就是模糊查询。因此,在模糊查询中,查询条件是不确切的,查询结果是近似的。
2.模糊数据库模型
关系模型是传统数据库使用最多的数据模型。显然,传统关系模型难以适应基于内容的图像数据库的模糊查询。为适应基于内容的图像检索,同时最大限度的利用关系数据库的优点,我们对关系模型的概念进行了
扩展。其数据结构是一张由基本属性和超属性组成的二维表,即超关系构成。
3.模糊查询过程
模糊查询就是根据模糊特征来查找所需内容,由于检索中查询要求往往是根据人的主观性所决定。因此很大程度上带有模糊性,我们用图1所示的查询体系结构来说明具有模糊特征的基于内容检索的基本方法。
3.1模糊查询接口
模糊查询接口是用户输入模糊查询条件的人—机交互接口。模糊特征的描述实际上往往由用户的主观性所决定,对于图像纹理,习惯于用“很粗”、“中等”、“弱”这样的一些模糊概念来描述;形状一般用“几何形的”、“立体形的”或“似长方形的”、“正方形的”等概念描述;颜色特征通常用“很艳”、“一般”、 “暗淡”或“大红”、“紫红”、“红”这样的模糊概念来描述。系统将复杂的多维特征经过模糊分类简化为有限的几个特征集上,数字化表示成模糊特征向量(Qji,j=1,…,Mi,i=1,…,q)。
要使用户模糊查询描述更精确,还需进行模糊特征的调整。当用户用模糊概念输入特征,计算机通过用相似性计算公式求得库中一些与用户输入特征相近的对象,返回给用户,然后由用户从这组相似对象中选择一个对象作为目标对象,并用模糊术语 (如“更窄”、“更暗”等调整参考对象的每个特征,这些模糊术语又被转化为一定的数值,经过相似性匹配求出更相似的对象。假设调整后的特征值为则调整可用如下公式表示:
=+
其中, 是特征的当前值; 是特征调整后的值; 是特征的标准误差;
是由用户指定的改变映射成特征的结果(如“更窄”“更宽”等模糊术语)。
查询模块经过过滤操作得到更相似的对象组,用户再次选择直至找到要查询的对象。
3.2模糊相似性度量模糊相似性度量是实现模糊相似匹配的核心,常用模糊相似距离来作为检查模糊查询向量和模糊图像向量之间的相似性的度量标准。为讨论方便,我们以模糊年龄的相似性度量为例,来定义模糊查询向量Qj,j=1,2,…,q和模糊图像向量Bj,j=1,2,…,q之间的相似性度量。Qj, Bj是相同的模糊空间里的模糊子集(这里我们已经省略了上标)。
我们在多维模糊空间中对Q和B之间的距离dis定义为:
card(A)表示模糊集的基数,定义为:
4. 结束语
模糊查询与基于内容的图像检索有着密切的联系。本文提出了一种模糊图像数据模型和模糊空间的概念,该模型将可视特征、空间特征、语义特征看作超属性,既充分利用了传统关系数据库的优点,同时又考虑了图像数据以及模糊查询的特点,能对图像特征进行操作,文中提出的模糊空间和模糊相似性度量方法能支持基于模糊特征的图像查询,较好地体现用户图像查询的应用需求。
参考文献
1. 白雪生,徐光佑,史元春,基于内容检索的一种中间表达机制,软件学报,Vol.10(4),400-405
2. Wu,J.K.and A. Desai Narasimhalu, Fuzzy content-based retrieval in image database, Information Processing & Management, Vol. 34, No. 5, 513-534