数据冗余,这个概念需要讨论一下。比如你用手机拍了一张照片,然后保存了一份,然后手机上的APP会自动帮你备份一份。经过计算,该照片有三个版本。这不称为数据冗余。
2022年,在某城市的一个大型数据中心,他们发现自己的服务器上存储着同一个文件的多个版本,占用了大量空间。这称为数据冗余。
,当时我很困惑,心想,这么多重复的数据既浪费空间,又会导致错误。后来我才意识到,啊,可能是为了提高数据的可靠性,或者是为了满足一些特定的要求。
我会更极端地说,这种数据冗余可能是信息化演进过程中的一个阶段性产物。但随着技术的进步,我们需要想办法解决这个问题,减少不必要的存储压力,提高数据管理效率。解决这个问题需要花费多少钱?这可能要视具体情况而定。
数据冗余是指数据库中存在重复数据。 2012年我在一家互联网公司做数据分析师的时候就遇到了这样的情况。在用户信息表中,相同的用户名、电话号码、电子邮件地址等信息存储了三次,消耗了三分之一的存储空间。这就是数据冗余。
数据冗余是指重复记录,例如存储相同信息的多个副本。
这个我自己还在验证,不过一般情况下,同一个客户的电话号码如果在客户信息库中输入了3次,就算是数据冗余了。
自己掂量一下。