使用grabit分析mysql数据库中的数据血缘关系

2022-05-11

    Grabit 是一个辅助工具,用于从数据库、GitHub 等修订系统、bitbucket 和文件系统等各种来源收集 SQL 脚本和存储过程,然后将其推送到 SQLFlow 服务器进行分析并生成元数据和数据沿袭。

    Grabit 官方获取地址:https://www.gudusoft.com/grabit/

    1、Grabit 的主要用途

    连接到数据库

    从Oracle、SQL Server等数据库中提取创建表、创建视图和存储过程等SQL查询,并发送到SQLFlow进行分析。

    连接到SQLFlow系统

    从 Github、Bitbucket 等修订系统中获取 SQL 文件并发送到 SQLFlow 以获取数据沿袭。

    搜索文件系统

    在本地文件系统中找到 SQL 文件并推送它 SQLFlow 以可视化数据沿袭。

    本文介绍如何使用grabit分析mysql数据库中的数据血缘关系。

    2、如何配置grabit环境

    运行grabit的环境需要配置Java 8及以上版本,并需要在系统变量中配置如下信息,部署时请主要java的更换安装路径:

    export JAVA_HOME=/usr/lib/jvm/default-java

    export PATH=$JAVA_HOME/bin:$PATH

    运行grabit

    以windows环境下为例,需要执行grbit安装目录下执行start.bat

    3、如何连接到数据库

    在grabit启动页面有Database、Github、Bitbucket、Single File等多种数据源提供方式,本文重点介绍使用database方式进行获取数据源,想了解其他方式,请参考https://github.com/sqlparser/sqlflow_public/tree/master/grabit

    选择mysql数据库类型,然后点击next

    点击next后来到数据库配置信息页面,其中前四项为必填项,后面的为选填项。关于选填项中各项具体信息请参阅https://github.com/sqlparser/sqlflow_public/tree/master/grabit获取更详细的介绍。

    配置完上述信息后,点击【upload】即可上传至sqlflow服务器并生成相应的job,如下图

    如您使用的是sqlflow的云版本,需要注册一个高级会员。

    可以点击【save config】保存当前的配置文件,随后点击close关闭grabit。

    4、使用sqlflow获取数据血缘关系分析结果

    到sqlflow服务器上查看,您可以看到相应的job已经建立并能轻松获取自动分析的数据血缘关系,如下图:

    至此,使用grabit分析mysql数据库中的血缘关系介绍完毕。

    参考

    马哈鱼数据血缘分析器: https://sqlflow.gudusoft.com

    马哈鱼数据血缘分析器中文网站: https://www.sqlflow.cn