PaddlePaddle · gongweibao · Mar 8, 2024 · Mar 7, 2024
diff --git a/python/paddle/distributed/communication/reduce.py b/python/paddle/distributed/communication/reduce.py
@@ -123,7 +123,7 @@ def reduce(tensor, dst, op=ReduceOp.SUM, group=None, sync_op=True):
             >>> # [[1, 2, 3], [1, 2, 3]] (2 GPUs, out for rank 1)
     """
     # AVG is only supported when nccl >= 2.10
-    if op == ReduceOp.AVG and paddle.base.core.nccl_version() < 21000:
+    if op == ReduceOp.AVG and (not is_avg_reduce_op_supported()):
         group = (
             paddle.distributed.collective._get_global_group()
             if group is None
@@ -201,3 +201,10 @@ def reduce(tensor, dst, op=ReduceOp.SUM, group=None, sync_op=True):
         )
     else:
         raise ValueError(f"Unknown parameter: {op}.")
+
+
+def is_avg_reduce_op_supported():
+    if paddle.is_compiled_with_cuda():
+        return paddle.base.core.nccl_version() >= 21000
+    else:
+        return False
diff --git a/.../paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/dygraph_sharding_optimizer.py b/.../paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/dygraph_sharding_optimizer.py
@@ -23,7 +23,10 @@
 from paddle.base.dygraph import base as imperative_base
 from paddle.base.framework import EagerParamBase
 from paddle.distributed import fleet
-from paddle.distributed.communication.reduce import ReduceOp
+from paddle.distributed.communication.reduce import (
+    ReduceOp,
+    is_avg_reduce_op_supported,
+)
 
 from ...utils.log_util import logger
 from ...utils.tensor_fusion_helper import (
@@ -101,11 +104,10 @@ def __init__(self, optimizer, hcg):
         self.use_reduce_avg = strategy.hybrid_configs[
             'sharding_configs'
         ].use_reduce_avg
-        if self.use_reduce_avg and paddle.base.core.nccl_version() < 21000:
+        if self.use_reduce_avg and (not is_avg_reduce_op_supported()):
             self.use_reduce_avg = False
             warnings.warn(
-                "nccl reduce_avg requires nccl>=2.10.0, but current version is %s"
-                % paddle.base.core.nccl_version()
+                "nccl reduce_avg requires paddle compiled with cuda and nccl>=2.10.0, please check compilation setups."
             )
 
         pp_overlap = strategy.hybrid_configs['pp_configs'].sharding_comm_overlap