马哈鱼血缘分析模型介绍

2022-05-14

    马哈鱼是当前最流行的数据血缘关系(data lineage)管理工具之一,它是一种通过分析SQL脚本来自动发现数据流向的工具。为了满足用户对数据沿袭分析的各种需求,有必要将马哈鱼数据血缘分析模型划分为几个级别,每个级别都适合特定的需求。

    马哈鱼数据血缘分析模型

    马哈鱼目前支持三种数据血缘分析模型,分别是完整的数据血缘分析模型、表级数据血缘分析模型和列级数据血缘分析模型

    1、完整的数据血缘分析模型

    在此模型中,马哈鱼生成的数据血缘分析包括所有详细信息,如SELECT语句期间生成的结果集、用于根据输入列计算新列值的函数调用、用于将数据从一列转换为另一列的大小写表达式等。此数据血缘分析模型是所有其他更高级别沿袭模型的基础,这些模型通过省略或聚合此模型中的某些关系和实体,仅包含此完整模型中的某些沿袭。

    2、表级数据血缘分析模型

    此模型基于SQL语句跟踪表totable中的数据流。换句话说,从这个模型中,您可以看到使用什么SQL语句将数据从一个表移动到另一个表。该模型只包含三种实体:源表、目标表和SQL语句以及它们之间的关系。如果要查看数据在SQL语句中的移动方式,可以使用此SQL语句的完整模型来查找更多信息。

    3、列级数据血缘分析模型

    此模型基于SQL语句跟踪从一列到另一列的数据流。换句话说,从这个模型中,您可以看到使用什么SQL语句将数据从一列移动/影响到另一列,该模型只包含三种实体:源列、目标列和SQL语句以及它们之间的关系;如果希望了解数据在SQL语句中的流向及相互影响,可以使用此SQL语句的完整模型来查找更多信息。

    如果你想了解更多关于马哈鱼的使用及技术资料,请登录马哈鱼官网https://sqlflow.gudusoft.com,你会获得更多的支持与帮助。

    参考

    马哈鱼数据血缘分析器: https://sqlflow.gudusoft.com

    马哈鱼数据血缘分析器中文网站: https://www.sqlflow.cn