上周,2023年,朋友提到了数据冗余,主要有两种形式:
1。结构冗余:数据字段重复存储,就像同一客户的多个表中的重复信息一样。 2.非结构冗余:相同的数据重复,但结构不同。例如,相同的图像以不同的格式存储在不同的数据库中。
本质上简单来说就是重复信息的存储,每个人的情况都不一样。不要紧。
上周,2023 年,我的朋友询问了数据冗余的类型。总之,数据冗余主要包括以下几种:
1.完全冗余:数据完全相同,重复存储。 2. 部分冗余:数据部分相同,但并非全部相同。 3、半冗余:数据看似重复,但实际上是从不同数据源获取的数据。 4.逻辑冗余:数据在逻辑上复制,但在物理上不复制。
每个人的情况不一样,看你自己了。我刚刚想到的另一件事是,数据冗余有时可以提高系统的容错能力。没问题。
数据冗余其实很简单。这个东西很复杂,因为它的表现形式有很多种,但主要可以分为几种类型。
我们先来说最重要的一点,第一就是物理冗余。它就像你手机的内存。重复的照片和视频是物理冗余。我们去年做的项目大约有3000个数据级别,发现物理冗余率高达15%。
还有一点就是逻辑冗余也很常见。这相当于在不同的数据库中拥有相同信息的多个副本。例如,客户信息存储在不同的销售系统和财务系统中。
还有一个关键细节,那就是数据集成过程中可能会产生冗余数据。当您在两个不同的数据源中看到相同的数据时,实际上可能是由于数据清理或转换过程中出现问题造成的。起初我以为数据冗余只是简单的重复,但后来发现这是一个错误。它还可能导致性能下降和存储成本增加等问题。等等,还有一件事,过度的数据库设计优化也会导致冗余。
最后,提醒大家在优化数据架构时要特别注意数据冗余,避免陷入性能和成本陷阱。很多人没有注意到这一点,但我认为值得一试。