上周,2023年,我那个朋友在数据质量上这么说:“就像刚从超市买回来的蔬菜,新鲜是新鲜,但叶子有点黄,根部还带土。一言以蔽之,细节有待优化。”
这部分我不确定,但根据我那个朋友的经验,数据质量就像是这样的蔬菜,新鲜但细节不够完美。本质上,每个人情况不同,你看着办。我刚想到另一件事,记得检查数据的一致性和准确性。
2022年那个城市的数据质量啊,我那时候也懵,说起来有点长,得慢慢道来。当时我们那项目,数据量得有几百万条吧,钱也花了不少,可就是感觉不对劲。你看,数据里头,漏掉的信息太多,像是在大海里捞针,关键信息都找不着。我当时也偏激,觉得这数据简直就是在糊弄人。后来我仔细一看,才发现,可能是我太苛刻了,毕竟数据质量嘛,得看具体情况。有的地方,数据确实挺全的,可有的地方,,那叫一个糟糕,错别字、重复数据、甚至还有乱码。我当时也懵,后来才反应过来,数据质量这事儿,还真不能一概而论。