这取决于数据的大小和清理的复杂性。例如,上次我帮朋友清理了一个有10GB照片和视频的文件夹;我花了一天半的时间扫描并用软件排序。如果是特别复杂的数据;如果特别复杂,比如人工复核或者重复数据处理。可能需要几天时间。无论如何,我还在想。
当谈到数据清理时,这取决于它是什么类型的数据以及你计划清理它的程度。例如,我曾经帮助一家公司清理客户数据,花了几周的时间,因为我必须一项一项地审查,看看哪些是无效的,哪些是过时的。如果我们清理网站上的用户评论,可能需要半天时间,因为都是批量处理的。
老实说,我一直没有找到统一的答案。有时,您可能会想,“为什么这些数据中有这么多垃圾信息?”但当你真正去做的时候,你会发现会花费很多时间。当时我不明白为什么有些数据看起来很容易但清理起来却如此困难。
至于时间,如果数据量较小,可能几个小时就能完成;如果数据量很大,可能需要几天或几周的时间。我自己没有运行过,我记得数据在X左右,但我建议你检查一下真实情况。毕竟每个人的经历都是不同的。
清理1GB数据平均需要30分钟。这是一个陷阱。不相信你可以在一天之内完成它。
那天我坐在电脑前,面对堆积如山的客户信息,突然发现这些数据已经收集了半年了。我随机打开了一个文件夹,里面有两千多个文件。密密麻麻的数据条目让人感觉头大。清理数据需要多长时间?我快速计算了一下,发现如果每个文档平均需要五分钟,那么我需要花费十二个小时来处理它。等等,还有一件事。我突然想到,如果能合并重复的数据,效率应该会大大提高。但这是一个大工程,我需要想办法提高效率。时间、地点、具体数字,这些细节似乎并没有改变数据清洗的本质——它最终是一项耗时耗力的工作。