如何控制数据质量

来源:中琛源 浏览次数: 更新时间:2021-01-13 09:12:10

  数据分析是指利用适当的统计分析方法对大量收集到的数据进行分析,提取有用的信息,形成结论,对数据进行详细的研究和总结的过程,数据质量不仅是数据分析结论有效性和准确性的基础,也是最重要的前提和保证。


  那么如何控制数据质量?


  1、明确自己的分析主题


  如你拥有来自不同部门的交易数据,那么此时你想做一件什么事情,变得尤为重要,你是想分析部门的业绩情况,还是想看哪个客户是优质客户?这时我们要明确分析主题。


  2、合理的数据建模


  明确主题后,我们要业务建模,业务模型继而确定技术建模。


  那么要确定优质客户的标准是什么,如收入问题,有联系方式,交易额超过10万。那我们此次建模只需要采集这些拥有的信息字段就好。合理的数据建模可以给分析减负。


  3、去除脏数据


  脏数据可以理解为异常数据,如电话号码中存在汉字,性别中存在其他字符。那这部分我们需要清洗,严格要求。


  中琛魔方大数据平台表示数据标准、元数据是数据质量管理的前提和基础,只有将源数据的字段类型、字段值范围等调查清楚,才能设计出数据质量评估的规划体系。

上一篇:大屏数据可视化设计注意事项
来源:中琛源
更新时间:2021-01-12 09:45:28
下一篇:工业大数据的应用有哪些
来源:中琛源
更新时间:2021-01-13 09:17:27