Release-1.4.0
在Angel 1.4.0,我们对进行了一次内核大重构,为后续版本正式引入Distribute Serving打下了基础。此外,该版本支持64位的FeatureId,提升了PS的容灾速度以支持Spark Streaming on Angel,FTRL全面切换到Spark Streaming方式,并进行了优化,该版本为后续升级打下了良好的基础。
Core
- 优化PS容灾方式,新增基于模型分区副本的恢复模式,PS宕机后可以快速恢复
- 支持64位的FeatureId,新增64位Index的训练样本解析接口;
- 引入Distributed Serving,支持基于模型多副本Sharing提供分布式Inference服务(Alpha)
PySpark
- 从Python2迁移到Python3,后续Angel将只支持Python 3
MLLib
- GBDT开始支持离散特征,并加入回归类型,功能进一步对齐XGBoost
- 优化LR算法,提供基于特征索引的模型获取方式,增加对64位稀疏模型支持
Spark on Angel
- 修复Spark On Angel任务异常后,Angel-PS退出问题
- 增加Local Vector,并优化PSVector的接口
- 优化GBDT,并修复预测结果未转换等bug