现在数据湖越来越热门, 我司使用的是 Hudi, 但是奈何 Hudi 官方维护的文档太差劲了, 很多功能和页面很久没有更新. 并且 Flink 与 Hudi 整合的教程, 官方基本没有维护, 导致新手想系统学习 Hudi 这个组件无从下手. 所以准备出一个专栏, 给新手系统的讲解一些 Hudi 的概念以及使用方法, 包括官方 RFC 提出一些功能的思路和源码实现, 最后会结合遇到的一些生产问题, 加深对 Hudi 的印象
后面预计会有 Flink 和 Hadoop 相关的系列文章, 也会在这里更新