什么是数据冗余?

数据冗余

  1. 数据冗余:在一个数据集合中重复的数据称为数据冗余

例如在设计数据库时,某一字段属于一个表,但它又同时出现在另一个或多个表,且完全等同于它在其本来所属表的意义表示,那么这个字段就是一个冗余字段。

  1. 关系数据库中的数据冗余主要是指关系数据库中同一信息数据的重复存贮。
  2. 数据冗余浪费了宝贵的资源,应尽量减少。但关系数据库中为实现一些功能有些数据冗余是必需的。必需的数据冗余主要用于以下用途:
  • 数据间建立联系,如两表间通过共同属性建立联系;
  • 数据恢复,如建立备份文件以备正式文件被破坏时恢复;
  • 数据核查,如设立数据校验位可以检查数据在存贮、传输等过程中的改变;
  • 数据使用的便利,如为了查看数据的直观,使用数据的方便、高效。
  • 减少数据通讯开销,如分布式数据库在不同场地重复。

2.    数据冗余的成因

关系数据库由表及附属文件组成,其表由属性定义的结构和元组(记录)组成,其属性值域有多种类型,故关系数据库的数据冗余形成的原因有表的重复、属性的重复、元组的重复、属性值的重复4类。
2.1 表的重复
  为了数据安全的需要制作备份表,当主表被破坏时可用此恢复数据。分布式数据库为减少数据通讯开销也常重复放表,这种数据冗余在这里是必需数据冗余,不能删除。若是因其他原因产生的非必要的重复表则应予以删除。
2.2 属性重复
  有不同表的属性重复和同一表内属性重复2种情况:

  • (1)  不同表中属性重复常用来建立表之间联系,这只需要一个公共属性,这是必需数据冗余,不能删除;各表间的多于一个的属性应当删除。如有以下3个表:
  • T1(A,B,C);T2(A,B,D);T3(A,C,D,E)。
  • 其中属性A为三表所共有;属性B为T1,T2 两张表所共有,属性C为T1,T3 两张表所共有;属性D为T2,T3 二表所共有。如取A为公共属性则,T1,T2 两张表中只能保留一个B属性;T1,T3 两张表中只能保留一个C属性;T2,T3 两张表中只能保留一个D属性。
  • (2)  同一表内有相同属性内容的多个属性,若非数据安全检查的需要,应删除之。

2.3 元组的重复
  表内不同记录内容有时会完全相同,若非必要,应予以删除。
2.4 属性值的重复
  按属性值域集合基的特点可以将其分为有限类和无限类。
  (1)  无限类属性值的重复。无限类属性值是指其属性值域集合的基为无限大或者数据库记录数为同一数量级的属性值,如实数、整数、日期、各种编号。
  无限类属性值偶尔也可能重复,但这只是巧合,而并非数据冗余。
  (2)  有限类属性值的重复。有限类属性值是指其属性值域集合的基小于数据库记录数至少一个数量级的属性值,如产品名,部门名,职称名,课程名。
  有限类属性值的重复实际上是由一对多或多对多的关系引起的,有时可作为必需冗余数据不予以处理,这时不需程序就有较好的查看效果和工作效率。但当重复量很大时,也应当设法对所引起的数据冗余进行压缩,这通常要建立新表和相应的程序。


2.5 不同成因的数据冗余用不同层次上的操作来消除。

                   (1)消除表的重复所引起的数据冗余为磁盘文件级的操作。
                   (2)属性的重复所引起的数据冗余的消除为对数据库结构修改的操作。
                   (3)元组的重复所引起的数据冗余的消除由记录级的操作完成。

3. 数据冗余的缺点:

a)   存储空间的浪费。
b)   数据交互和数据库访问执行效率降低。
但适当的数据冗余又能加快查询
数据冗余究竟是好是坏还是要根据自己所做的项目进行合理的取舍

数据冗余是指在数据中存在无用信息或重复表示了其他已经表示过的信息的情况。在数字图像中,存在以下几种冗余: 1. 空间冗余:图像内部相邻像素之间存在较强的相关性,造成了空间冗余。这种冗余可以通过图像压缩算法中的空间域压缩方法来减少或消除。 2. 时间冗余:视频图像序列中的不同帧之间存在相关性,造成了时间冗余。这种冗余可以通过视频压缩算法中的时间域压缩方法来减少或消除。 3. 视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。由于人眼对某些细节不敏感,因此可以通过减少图像中的细节信息来减少视觉冗余。 4. 信息熵冗余:也称为编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余。这种冗余可以通过图像压缩算法中的编码压缩方法来减少或消除。 5. 结构冗余:是指图像中存在很强的纹理结构或自相似性。由于图像中的纹理结构或自相似性可以通过更简洁的方式来表示,因此可以通过图像压缩算法中的结构域压缩方法来减少或消除。 6. 知识冗余:是指在某些图像中还包含与某些验证知识有关的信息。这种冗余可以通过图像处理算法中的知识提取方法来减少或消除。 为了减少或消除数据冗余,可以使用图像压缩算法来对图像进行压缩。常用的图像压缩算法包括无损压缩算法(如Huffman编码、LZW编码)和有损压缩算法(如JPEG、JPEG2000)。这些算法可以根据不同的冗余类型和特点来选择合适的压缩方法,从而减少图像的冗余度。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值