English | 中文
DataSphere Studio(简称DSS)是微众银行自研的数据应用开发管理集成框架。
基于插拔式的集成框架设计,及计算中间件 Linkis ,可轻松接入上层各种数据应用系统,让数据开发变得简洁又易用。
在统一的UI下,DataSphere Studio以工作流式的图形化拖拽开发体验,将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出应用等,数据应用开发全流程场景需求。
DSS通过插拔式的集成框架设计,让用户可以根据需要,简单快速替换DSS已集成的各种功能组件,或新增功能组件。
借助于 Linkis 计算中间件的连接、复用与简化能力,DSS天生便具备了金融级高并发、高可用、多租户隔离和资源管控等执行与调度能力。
请您耐心等待,加载gif需要一些时间。
DSS主要特点:
DSS集成度极高,目前已集成的系统有:
1、数据开发IDE工具——Scriptis
2、数据可视化工具——Visualis(基于宜信Davinci二次开发)
3、数据质量管理工具——Qualitis
4、工作流调度工具——Schedulis
5、数据交换工具——Exchangis (已支持免密跳转,等待Exchangis发版)
6、数据Api服务——DataApiService
7、流式应用开发管理工具——Streamis(即将开源)
DSS插拔式的框架设计模式,允许用户快速替换DSS已集成的各个Web系统。如:将 Scriptis 替换成Zeppelin,将 Schedulis 替换成DolphinScheduler。
AppConn,是DSS可以简单快速集成各种上层Web系统的核心概念。
AppConn——应用连接器,定义了一套统一的前后台接入协议,总共分为三级规范,可让外部数据应用系统快速简单地接入,成为DSS数据应用开发中的一环。
AppConn的三级规范即:一级SSO规范,二级组织结构规范,三级开发流程规范;
DSS通过串联多个 AppConn,编排成一条支持实时执行和定时调度的工作流,用户只需简单拖拽即可完成数据应用的全流程开发。
由于 AppConn 对接了Linkis,外部数据应用系统因此具备了资源管控、并发限流、用户资源管理等能力,且允许上下文信息跨系统级共享,彻底告别应用孤岛。
以 Workspace 为管理单元,组织和管理各数据应用系统的业务应用,定义了一套跨数据应用系统的工作空间协同开发通用标准,并提供了用户角色管理能力。
DSS通过实现多个AppConn,已集成了丰富多样的各种上层数据应用系统,基本可满足用户的数据开发需求。
如果有需要,也可以轻松集成新的数据应用系统,以替换或丰富DSS的数据应用开发流程。 点我了解如何快速集成新的应用系统
应用工具 | 描述 | DSS0.X 版本要求 | DSS1.0 版本要求 | 版本规划 |
---|---|---|---|---|
DataApiService | 数据API服务。可快速将SQL脚本发布为一个Restful接口,对外提供Rest访问能力 | 不支持 | >=1.0.0 | 已发布 |
Airflow | 支持将DSS工作流发布到Airflow进行定时调度 | >=0.9.1,尚未合并 | on going | 待规划 |
Streamis | 流式应用开发管理工具。支持发布Flink Jar 和 Flink SQL ,提供流式应用的开发调试和生产管理能力,如:启停、状态监控、checkpoint等。 | 不支持 | >=1.0.0 | 即将发布 |
UserManager | 自动初始化一个DSS新用户所必须的所有用户环境,包含:创建Linux用户、各种用户路径、目录授权等 | >=0.9.1 | on going | 待规划 |
EventCheck | 提供跨业务、跨工程和跨工作流的信号通信能力。 | >=0.5.0 | >=1.0.0 | 已发布 |
SendEmail | 提供数据发送能力,所有其他工作流节点的结果集,都可以通过邮件进行发送 | >=0.5.0 | >=1.0.0 | 已发布 |
Scriptis | 支持在线写SQL、Pyspark、HiveQL等脚本,提交给Linkis执行的数据分析Web工具。 | >=0.5.0 | >=1.0.0 | 已发布 |
Visualis | 基于宜信开源项目Davinci二次开发的数据可视化BI工具,为用户在数据安全方面提供金融级数据可视化能力。 | >=0.5.0 | >=1.0.0 | 已发布 |
Qualitis | 数据质量校验工具,提供数据完整性、正确性等数据校验能力 | >=0.5.0 | >=1.0.0 | 待发布 |
Schedulis | 基于Azkaban二次开发的工作流任务调度系统,具备高性能,高可用和多租户资源隔离等金融级特性。 | >=0.5.0 | >=1.0.0 | 已发布 |
Exchangis | 支持对结构化及无结构化的异构数据源之间的数据传输的数据交换平台 | 不支持 | >=1.0.0 | 待发布 |
由于 DataSphereStudio 支持执行脚本风险较高,WeDataSphere Demo环境的隔离没有做完,考虑到大家都在咨询Demo环境,决定向社区先定向发放邀请码,接受企业和组织的试用申请。
如果您想试用Demo环境,请加入DataSphere Studio社区用户群(加群方式请翻到本文档末尾处),联系团队成员获取邀请码。
DataSphereStudio Demo环境用户注册页面:点我进入
DataSphereStudio Demo环境登录页面:点我进入
DataSphereStudio1.0 Demo环境将在近期开放,敬请期待。
请前往 DSS releases 页面下载 DSS 的已编译版本或源码包。
请参照 编译指引 来编译 DSS 源码。
请参考 安装部署文档 来部署 DSS。
请到 用户使用文档 ,了解如何快速使用DSS。
DSS1.0的完整文档列表,请参见 DSS-Doc
以下为 DSS 相关 AppConn 插件的安装指南:
DataSphere Studio适用于以下场景:
1. 正在筹建或初步具备大数据平台能力,但无任何数据应用工具的场景。
2. 已具备大数据基础平台能力,且仅有少数数据应用工具的场景。
3. 已具备大数据基础平台能力,且拥有全部数据应用工具,但工具间尚未打通,用户使用隔离感强、学习成本高的场景。
4. 已具备大数据基础平台能力,且拥有全部数据应用工具,部分工具已实现对接,但尚未定义统一规范的场景。
我们非常欢迎和期待更多的贡献者参与共建 DSS, 不论是代码、文档,或是其他能够帮助到社区的贡献形式。
对 DSS 的任何问题和建议,敬请提交issue,以便跟踪处理和经验沉淀共享。
您也可以扫描下面的二维码,加入我们的微信/QQ群,以获得更快速的响应。
我们创建了 Who is using DSS issue 以便用户反馈和记录谁在使用 DSS,欢迎您注册登记.
DSS 自2019年开源发布以来,累计已有700多家试验企业和1000+沙盒试验用户,涉及金融、电信、制造、互联网等多个行业。
DSS is under the Apache 2.0 license. See the License file for details.