2022年那个blooms活动,我印象中是在某个大城市举办的,当时人山人海,据说参与人数突破了十万。门票嘛,我记得是每人300块,当时觉得还挺贵的,毕竟对于普通人来说,300块不是小数目。我当时也懵,看着那么多人在排队,心里想,这活动到底有什么魅力呢?我后来才反应过来,可能我偏激了,毕竟那么多人愿意花钱去体验,肯定有它的道理。
上周,我去了一家新开的咖啡馆,点了一杯blooms花果茶。味道挺特别的,有点像玫瑰和苹果的混合味,不过价格有点小贵。2023年,感觉这种小资的东西越来越流行了。我那个朋友说她最近也开始喝这个了。算了,你看着办吧,你喜欢就好。
话说回来,blooms这个概念在数据分析领域其实很简单。它就是指数据中出现的异常值或异常点。
先说最重要的,blooms通常出现在数据处理的早期阶段。 比如去年我们跑的那个项目,大概处理了3000量级的数据,就发现了好几个数据点突然爆表,这就是blooms。另外一点,blooms的出现往往和数据的分布有关。 当你看到数据分布图时,那些像小岛一样的点,就是blooms。
我一开始也以为blooms是随机出现的,后来发现不对,它们往往与数据采集过程中的问题有关。 等等,还有个事,blooms可能会导致模型预测出现偏差,用行话说叫雪崩效应,其实就是前面一个小延迟把后面全拖垮了。
所以,提醒一点,处理数据时一定要关注数据的分布,及时发现和处理blooms。 这个点很多人没注意,但我觉得值得试试。
💦 blooms是“开花”或“繁荣”的意思。
这是坑:别将blooms直接用于描述数字或抽象概念,否则会造成混淆。
10年前,我在一家科技公司担任项目经理,曾见过团队因将“blooms”错误地用于项目进度报告而引起误解。
实操提醒:在使用“blooms”时,确保它指的是具体的开花或繁荣现象。