revert jvm changes for future pr

dmlc · Aug 14, 2019 · efc114f · efc114f
1 parent 4f913fd
commit efc114f
Show file tree

Hide file tree

Showing 8 changed files with 24 additions and 56 deletions.
diff --git a/jvm-packages/xgboost4j-spark/src/main/scala/ml/dmlc/xgboost4j/scala/spark/XGBoost.scala b/jvm-packages/xgboost4j-spark/src/main/scala/ml/dmlc/xgboost4j/scala/spark/XGBoost.scala
@@ -445,12 +445,6 @@ object XGBoost extends Serializable {
             val parallelismTracker = new SparkParallelismTracker(sc, timeoutRequestWorkers,
               nWorkers)
             val rabitEnv = tracker.getWorkerEnvs
-
-            // CHEN QIN, overwrite rabit env, read rabit_cache and debug setting
-            for ((k, v) <- params) {
-              if (k.startsWith("rabit_")) rabitEnv.put(k, v.asInstanceOf[String])
-            }
-
             val boostersAndMetrics = if (hasGroup) {
               trainForRanking(transformedTrainingData.left.get, overriddenParams, rabitEnv,
                 checkpointRound, prevBooster, evalSetsMap)
@@ -480,12 +474,11 @@ object XGBoost extends Serializable {
           }
       }.last
     } catch {
-        case t: Throwable =>
-            // if the job was aborted due to an exception
-            logger.error("the job was aborted due to ", t)
-            val v = params.getOrElse("rabit_cache", 0)
-            if (v == 0) trainingData.sparkContext.stop()
-            throw t
+      case t: Throwable =>
+        // if the job was aborted due to an exception
+        logger.error("the job was aborted due to ", t)
+        trainingData.sparkContext.stop()
+        throw t
     } finally {
       uncacheTrainingData(params.getOrElse("cacheTrainingSet", false).asInstanceOf[Boolean],
         transformedTrainingData)

diff --git a/...ages/xgboost4j-spark/src/main/scala/ml/dmlc/xgboost4j/scala/spark/XGBoostClassifier.scala b/...ages/xgboost4j-spark/src/main/scala/ml/dmlc/xgboost4j/scala/spark/XGBoostClassifier.scala
@@ -189,12 +189,7 @@ class XGBoostClassifier (
           weight, baseMargin, None, dataFrame).head)
     }
     transformSchema(dataset.schema, logging = true)
-    var derivedXGBParamMap = MLlib2XGBoostParams
-    for ( (k, v) <- xgboostParams) {
-      if (k.startsWith("rabit_")) {
-        derivedXGBParamMap = derivedXGBParamMap + (k -> v.asInstanceOf[String])
-      }
-    }
+    val derivedXGBParamMap = MLlib2XGBoostParams
     // All non-null param maps in XGBoostClassifier are in derivedXGBParamMap.
     val (_booster, _metrics) = XGBoost.trainDistributed(trainingSet, derivedXGBParamMap,
       hasGroup = false, evalRDDMap)

diff --git a/...kages/xgboost4j-spark/src/main/scala/ml/dmlc/xgboost4j/scala/spark/XGBoostRegressor.scala b/...kages/xgboost4j-spark/src/main/scala/ml/dmlc/xgboost4j/scala/spark/XGBoostRegressor.scala
@@ -185,12 +185,7 @@ class XGBoostRegressor (
           weight, baseMargin, Some(group), dataFrame).head)
     }
     transformSchema(dataset.schema, logging = true)
-    var derivedXGBParamMap = MLlib2XGBoostParams
-    for ( (k, v) <- xgboostParams) {
-      if (k.startsWith("rabit_")) {
-        derivedXGBParamMap = derivedXGBParamMap + (k -> v.asInstanceOf[String])
-      }
-    }
+    val derivedXGBParamMap = MLlib2XGBoostParams
     // All non-null param maps in XGBoostRegressor are in derivedXGBParamMap.
     val (_booster, _metrics) = XGBoost.trainDistributed(trainingSet, derivedXGBParamMap,
       hasGroup = group != lit(-1), evalRDDMap)

diff --git a/...oost4j-spark/src/test/scala/ml/dmlc/xgboost4j/scala/spark/MissingValueHandlingSuite.scala b/...oost4j-spark/src/test/scala/ml/dmlc/xgboost4j/scala/spark/MissingValueHandlingSuite.scala
@@ -149,5 +149,5 @@ class MissingValueHandlingSuite extends FunSuite with PerTest {
     intercept[XGBoostError] {
       new XGBoostClassifier(paramMap).fit(inputDF)
     }
- }
+  }
 }
diff --git a/...ackages/xgboost4j-spark/src/test/scala/ml/dmlc/xgboost4j/scala/spark/ParameterSuite.scala b/...ackages/xgboost4j-spark/src/test/scala/ml/dmlc/xgboost4j/scala/spark/ParameterSuite.scala
@@ -48,6 +48,7 @@ class ParameterSuite extends FunSuite with PerTest with BeforeAndAfterAll {
     }
     assert(ss.sparkContext.isStopped === true)
   }
+
   test("fail training elegantly with unsupported objective function") {
     val paramMap = Map("eta" -> "0.1", "max_depth" -> "6", "silent" -> "1",
       "objective" -> "wrong_objective_function", "num_class" -> "6", "num_round" -> 5,
@@ -62,6 +63,7 @@ class ParameterSuite extends FunSuite with PerTest with BeforeAndAfterAll {
       waitForSparkContextShutdown()
     }
   }
+
   test("fail training elegantly with unsupported eval metrics") {
     val paramMap = Map("eta" -> "0.1", "max_depth" -> "6", "silent" -> "1",
       "objective" -> "multi:softmax", "num_class" -> "6", "num_round" -> 5,

diff --git a/...es/xgboost4j-spark/src/test/scala/ml/dmlc/xgboost4j/scala/spark/XGBoostGeneralSuite.scala b/...es/xgboost4j-spark/src/test/scala/ml/dmlc/xgboost4j/scala/spark/XGBoostGeneralSuite.scala
@@ -233,34 +233,6 @@ class XGBoostGeneralSuite extends FunSuite with TmpFolderPerSuite with PerTest {
     assert(error(nextModel._booster) < 0.1)
   }
 
-  test("training with failure recovery with rabit cache and debug enabled") {
-    val eval = new EvalError()
-    val training = buildDataFrame(Classification.train)
-    val testDM = new DMatrix(Classification.test.iterator)
-
-    val tmpPath = Files.createTempDirectory("model1").toAbsolutePath.toString
-    val paramMap = Map("eta" -> "1", "max_depth" -> 2,
-      "objective" -> "binary:logistic", "checkpoint_path" -> tmpPath,
-      "checkpoint_interval" -> 2, "num_workers" -> numWorkers,
-      "rabit_cache" -> "1", "rabit_debug" -> "1", "cacheTrainingSet" -> true)
-
-    val prevModel = new XGBoostClassifier(paramMap ++ Seq("num_round" -> 5)).fit(training)
-    def error(model: Booster): Float = eval.eval(
-      model.predict(testDM, outPutMargin = true), testDM)
-
-    // Check only one model is kept after training
-    val files = FileSystem.get(sc.hadoopConfiguration).listStatus(new Path(tmpPath))
-    assert(files.length == 1)
-    assert(files.head.getPath.getName == "8.model")
-    val tmpModel = SXGBoost.loadModel(s"$tmpPath/8.model")
-
-    // Train next model based on prev model
-    val nextModel = new XGBoostClassifier(paramMap ++ Seq("num_round" -> 8)).fit(training)
-    assert(error(tmpModel) > error(prevModel._booster))
-    assert(error(prevModel._booster) > error(nextModel._booster))
-    assert(error(nextModel._booster) < 0.1)
-  }
-
   test("repartitionForTrainingGroup with group data") {
     // test different splits to cover the corner cases.
     for (split <- 1 to 20) {
@@ -400,6 +372,7 @@ class XGBoostGeneralSuite extends FunSuite with TmpFolderPerSuite with PerTest {
       "num_workers" -> numWorkers))
         .fit(buildDataFrame(Regression.train))
     val regDF = buildDataFrame(Regression.test)
+
     val regRet1 = regModel.transform(regDF).collect()
     val regRet2 = regModel.setInferBatchSize(1).transform(regDF).collect()
     val regRet3 = regModel.setInferBatchSize(10).transform(regDF).collect()
@@ -415,8 +388,9 @@ class XGBoostGeneralSuite extends FunSuite with TmpFolderPerSuite with PerTest {
       "objective" -> "binary:logistic",
       "num_round" -> 5,
       "num_workers" -> numWorkers))
-      .fit(buildDataFrame(Classification.train))
+        .fit(buildDataFrame(Classification.train))
     val clsDF = buildDataFrame(Classification.test)
+
     val clsRet1 = clsModel.transform(clsDF).collect()
     val clsRet2 = clsModel.setInferBatchSize(1).transform(clsDF).collect()
     val clsRet3 = clsModel.setInferBatchSize(10).transform(clsDF).collect()

diff --git a/src/cli_main.cc b/src/cli_main.cc
@@ -202,7 +202,11 @@ void CLITrain(const CLIParam& param) {
     if (version % 2 == 0) {
       LOG(INFO) << "boosting round " << i << ", " << elapsed << " sec elapsed";
       learner->UpdateOneIter(i, dtrain.get());
-      rabit::CheckPoint(learner.get());
+      if (learner->AllowLazyCheckPoint()) {
+        rabit::LazyCheckPoint(learner.get());
+      } else {
+        rabit::CheckPoint(learner.get());
+      }
       version += 1;
     }
     CHECK_EQ(version, rabit::VersionNumber());
@@ -226,7 +230,11 @@ void CLITrain(const CLIParam& param) {
       learner->Save(fo.get());
     }
 
-    rabit::CheckPoint(learner.get());
+    if (learner->AllowLazyCheckPoint()) {
+      rabit::LazyCheckPoint(learner.get());
+    } else {
+      rabit::CheckPoint(learner.get());
+    }
     version += 1;
     CHECK_EQ(version, rabit::VersionNumber());
   }

diff --git a/src/tree/updater_histmaker.cc b/src/tree/updater_histmaker.cc
@@ -122,6 +122,7 @@ class HistMaker: public BaseMaker {
     for (int i = 0; i < p_tree->param.num_roots; ++i) {
       (*p_tree)[i].SetLeaf(0.0f, 0);
     }
+
     for (int depth = 0; depth < param_.max_depth; ++depth) {
       // reset and propose candidate split
       this->ResetPosAndPropose(gpair, p_fmat, fwork_set_, *p_tree);