数据冗余是指 - 智学轩城

数据冗余是指

户孟香头像

户孟香

2025-12-28 14:06:09

数据冗余就是重复存储相同信息,2023年1月,北京某公司发现,客户数据库里,客户信息重复率高达30%。
刚叔璧头像

刚叔璧

2025-03-20 15:33:04

说起数据冗余,我这心里就有点小堵。记得那年在一家公司做数据清洗,那工作量啊,简直了。我们那会儿负责一个大型电商平台的用户数据,你知道吧,就是那种用户信息、购买记录一堆堆的。
那时候,我负责检查数据有没有重复,结果发现,妈呀,简直了,同一个用户的信息,这里有一份,那里又有一份,简直就像批发市场一样。我算了算,大概有20%的数据是重复的,这得浪费多少存储空间啊,还得花时间清理。
那时候我就想,这数据冗余啊,就像是房间里堆满了不必要的杂物,看着乱七八糟的,还占地方。后来,我们团队就花了大半年时间,把那些重复的数据都给处理了,结果发现,系统运行效率提高了,存储空间也省了不少。
再说说这个场景吧,我记得是2018年,在一家互联网公司,我们团队负责的数据量大概有500GB,处理数据冗余之后,存储空间节省了大概30%,效率提升了20%。这数据冗余啊,真是让人头疼,但也得解决啊。
黄叔雅头像

黄叔雅

2025-10-18 15:42:01

就是同一数据重复存储在多个地方,浪费空间,降低效率。
这就是坑。
及时清理,定期核查。