Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【有奖征文】DSS + Linkis + Qualitis 在哗啦啦数据中台的应用与实践 #21

Open
lihongyu666 opened this issue Nov 19, 2020 · 4 comments

Comments

@lihongyu666
Copy link

lihongyu666 commented Nov 19, 2020

一、应用场景

哗啦啦数据中台项目旨在为餐饮行业提供一站式的数据处理平台。满足数据接入、数据清洗、数据加工、质量校验、数据服务、数据输出的数据应用开发全流程场景需求。
数据中台整体架构如下:
image
其中Qualitis应用于数据质量系统提供规则引擎。linkis为数据质量以及开发系统调试功能提供计算引擎支持

二、解决的问题

1、jdbc引擎如执行运行小时级的hive sql时。元数据库中的任务状态不更新问题
2、jdbc引擎打通数据源管理系统,支持数据源配置
3、打通中台项目统一认证服务
4、支持参数解析(包括时间变量)
5、Qualitis增加告警以及定时调度功能

三:DSS在哗啦啦的最佳实践

1、开发平台系统

开发系统集成了大数据主流工具,通过拖拉拽dag生成数据处理流程,集代码开发、代码审核、任务监控告警、工作流版本、权限控制等功能。能满足用户大部分数据处理场景,开箱即用,简化用户开发流程,降低技术门槛。
在最初,用户写完脚本后,验证脚本正确性需通过提交代码审核之后真正执行任务,或者用第三方开发工具验证如zeppelin。用户反愦验证流程很不便利。在引入Linkis以及DSS后,开发平台基于DSS的前端做了二开,使用了他的脚本运行功能,提交任务到Linkis,并推送任务进度以及运行日志到浏览器,简化了用户的验证流程,优化了用户交互。完善了开发系统之前缺少的调试功能。
image
开发系统部分界面展示
image
image
image
image

2、数据质量系统

在开发系统上经过的 接入、清洗、加工、输出 一系列处理后,用户需要对数据质量进行评估,此时可用到我们的数据质量系统。
我们使用Qualitis作为质量的后端服务。前端重新开发了一套符合中台UI风格的系统。在Qualitis基础上,我们增加了定时调度以及告警,满足用户即时检测或者定时调度检测,并支持配置告警策略,即时通知到用户检测结果。
image
image
image

The End

Linkis是非常优秀的开源项目,很适合应用于业务系统层级提交任务的统一入口,屏蔽底层集群细节。非常期待1.0版本的混算和多集群支持。相信Linkis会走越来越远

@zhaohongfeng
Copy link

it is great

@geosmart
Copy link

@lihongyu666 求出篇文章分享下dolphinscheduler集成的实现思路

@rootljw
Copy link

rootljw commented Nov 25, 2020

+10086 求出篇文章分享下dolphinscheduler集成的实现思路

@alexcd90
Copy link

+10086 求出篇文章分享下dolphinscheduler集成的实现思路

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants