马哈鱼数据血缘关系分析器介绍

2022-05-13

    随着大数据技术的发展与普及,数据治理和数据质量变得越来越重要,数据血缘分析在业界悄然兴起并得到了广泛流行,马哈鱼是国内少有的一款专业且易用的血缘分析工具。据资料显示,马哈鱼是当前最流行的数据血缘关系(data lineage)管理工具之一,它在全球IT界范围内广泛的流行着,被众多头部元数据服务商所使用,支持超过20个主流数据库。本文主要对马哈鱼用户种类及每种用户的特点进行介绍,希望能给刚接触马哈鱼的朋友提供帮助。

    一、什么是数据血缘关系?

    数据血缘属于数据治理中的一个概念,是在数据溯源的过程中找到相关数据之间的联系,它是一个逻辑概念。数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯。大数据数据血缘是指数据产生的链路,直白点说,就是我们这个数据是怎么来的,经过了哪些过程和阶段。

    二、为什么要为报表中的数据追根溯源?

    在数据的处理过程中,从数据源头到最终的数据生成,每个环节都可能会导致我们出现数据质量的问题。比如我们数据源本身数据质量不高,在后续的处理环节中如果没有进行数据质量的检测和处理,那么这个数据信息最终流转到我们的目标表,它的数据质量也是不高的。也有可能在某个环节的数据处理中,我们对数据进行了一些不恰当的处理,导致后续环节的数据质量变得糟糕。因此,对于数据的血缘关系,我们要确保每个环节都要注意数据质量的检测和处理,那么我们后续数据才会有优良的基因,即有很高的数据质量。

    由于企业中的数据繁多,现实中的数据追溯过程往往比较复杂和困难。马哈鱼就是为我们解决上述问题而诞生的,它能很好的支持此类的不同数据库平台的需求,能够大幅提升你在次类工作上的效率和准确性。

    如果你想了解更多关于马哈鱼的使用及技术资料,请登录马哈鱼官网https://sqlflow.gudusoft.com,你会获得更多的支持与帮助。

    三、马哈鱼的客户有哪些

    数据血缘分析工具 马哈鱼客户来自各行各业。在专业的数据治理行业,下面这张 Gartner’s Metadata Management Solutions Magic Quadrant for 3 consecutive years 的图显示有17家业界领先的元数据管理解决方案提供商,其中有超过一半,多达 9 家公司是 SQLFlow 的客户。

    他们是:

    • Adaptive
    • Alation
    • Alex Solutions
    • Data Advantage Group
    • erwin
    • Infogix
    • Oracle
    • Solidatus
    • SAP

    四、参考

    马哈鱼数据血缘分析器: https://sqlflow.gudusoft.com

    马哈鱼数据血缘分析器中文网站: https://www.sqlflow.cn