把SqlFlow中的血缘查看功能集成到DataHub

2022-04-27

    我们对DataHub的前端页面进行了改造,使之支持Gudu SQLFlow 血缘关系查看功能,目前匹配的datahub版本为0.8.29。

    如果想让您的DataHub系统支持Gudu SQLFlow,可以下载程序替换到自己的DataHub系统里。

    程序请联系support@sqlflow.cn获取下载链接。

    接下来您只需要以下几步就可以完成集成Gudu SQLFLOW 。

    1、修改Gudu SQLFlow的API服务地址

    打开datahub-frontend-assets.jar内的config.js文件修改GuduSqlFlowUrl参数为自己的GuduSqlFlowUrl服务地址。

    下面以Winows操作系统为例。

    鼠标选中datahub-frontend-assets.jar,右键菜单用解压缩工具打开。

    找到public/config.js 文件,将此文件拖出来。

    用记事本打开config.js,修改GuduSqlFlowUrl值为自己项目的api地址。

    修改保存后,将config.js文件拖入到datahub-frontend-assets.jar内替换掉原文件。

    3、更新程序

    1、将datahub-frontend-assets.jar上传到服务器。

    2、停掉datahub-frontend-react容器

    找到容器ID

    docker ps -a

    停掉容器

    docker stop 容器ID

    3、备份datahub-frontend-assets.jar

    docker cp datahub-frontend-react:/datahub-frontend/lib/datahub-frontend-assets.jar 备份路径

    4、将新的datahub-frontend-assets.jar拷贝到docker容器内并启动docker容器。

    docker cp 新datahub-frontend-assets.jar文件路径 datahub-frontend-react:/datahub-frontend/lib/

    docker start 容器ID

    4、集成后效果

    重新打开DataHub UI,可以看到在表级和字段级都增加了Gudu SQLFlow数据血缘关系查看功能。

    1、在表信息界面,点击Gudu SQLFlow选项卡,会显示表级别的upstream和downstream,如下图所示:

    2、点击 Schema选项卡,可以看到字段信息列表增加了一列Gudu SQLFlow,点击某个字段对应的Lineage可以查看此字段的数据血缘关系。