deepjavalibrary · stu1130 · Feb 26, 2021 · Feb 24, 2021 · lanking520 · Feb 25, 2021
@@ -62,6 +62,15 @@ protected NDList forwardInternal(
         return block.forward(parameterStore, inputs, training, params);
     }
 
+    @Override
+    protected NDList forwardInternal(
+            ParameterStore parameterStore,
+            NDList data,
+            NDList labels,
+            PairList<String, Object> params) {
+        return super.forwardInternal(parameterStore, data, labels, params);
+    }
+
     /** {@inheritDoc} */
     @Override
     public void initializeChildBlocks(NDManager manager, DataType dataType, Shape... inputShapes) {

@@ -130,12 +130,55 @@ public final NDList forward(
         return forwardInternal(parameterStore, inputs, training, params);
     }
 
+    /** {@inheritDoc} */
+    @Override
+    public NDList forward(
+            ParameterStore parameterStore,
+            NDList data,
+            NDList labels,
+            PairList<String, Object> params) {
+        NDManager paramsManager = parameterStore.getManager();
+        if (!isInitialized()) {
+            initialize(paramsManager, DataType.FLOAT32, data.getShapes());
+        }
+        return forwardInternal(parameterStore, data, labels, params);
+    }
+
+    /**
+     * A helper for {@link Block#forward(ParameterStore, NDList, boolean, PairList)} after
+     * initialization.
+     *
+     * @param parameterStore the parameter store
+     * @param inputs the input NDList
+     * @param training true for a training forward pass
+     * @param params optional parameters
+     * @return the output of the forward pass
+     */
     protected abstract NDList forwardInternal(
             ParameterStore parameterStore,
             NDList inputs,
             boolean training,
             PairList<String, Object> params);
 
+    /**
+     * A helper for {@link Block#forward(ParameterStore, NDList, NDList, PairList)} after
+     * initialization.
+     *
+     * @param parameterStore the parameter store
+     * @param data the input data NDList
+     * @param labels the input labels NDList
+     * @param params optional parameters
+     * @return the output of the forward pass
+     * @see #forward(ParameterStore, NDList, boolean, PairList)
+     */
+    protected NDList forwardInternal(
+            ParameterStore parameterStore,
+            NDList data,
+            NDList labels,
+            PairList<String, Object> params) {
+        return forwardInternal(parameterStore, data, true, params);
+    }
+
     /**
      * Use this to add a child block to this block.
      *

@@ -125,6 +125,20 @@ protected NDList forwardInternal(
                         .collect(Collectors.toList()));
     }
 
+    /** {@inheritDoc} */
+    @Override
+    protected NDList forwardInternal(
+            ParameterStore parameterStore,
+            NDList data,
+            NDList labels,
+            PairList<String, Object> params) {
+        return function.apply(
+                children.values()
+                        .stream()
+                        .map(block -> block.forward(parameterStore, data, labels, params))
+                        .collect(Collectors.toList()));
+    }
+
     /** {@inheritDoc} */
     @Override
     public void initializeChildBlocks(NDManager manager, DataType dataType, Shape... inputShapes) {

@@ -135,6 +135,20 @@ protected NDList forwardInternal(
         return current;
     }
 
+    /** {@inheritDoc} */
+    @Override
+    protected NDList forwardInternal(
+            ParameterStore parameterStore,
+            NDList data,
+            NDList labels,
+            PairList<String, Object> params) {
+        NDList current = data;
+        for (Block block : children.values()) {
+            current = block.forward(parameterStore, current, labels, params);
+        }
+        return current;
+    }
+
     /** {@inheritDoc} */
     @Override
     public void initializeChildBlocks(NDManager manager, DataType dataType, Shape... inputShapes) {

@@ -33,7 +33,6 @@ public class DefaultTrainingConfig implements TrainingConfig {
     private Optimizer optimizer;
     private Device[] devices;
     private Loss loss;
-    private DataManager dataManager;
     private List<Evaluator> evaluators;
     private List<TrainingListener> listeners;
 
@@ -50,7 +49,6 @@ public DefaultTrainingConfig(Loss loss) {
         this.initializer = new XavierInitializer(RandomType.GAUSSIAN, FactorType.IN, 2);
         optimizer = Adam.builder().build();
         this.loss = loss;
-        dataManager = DataManager.DEFAULT_DATA_MANAGER;
         evaluators = new ArrayList<>();
         listeners = new ArrayList<>();
     }
@@ -89,17 +87,6 @@ public DefaultTrainingConfig optOptimizer(Optimizer optimizer) {
         return this;
     }
 
-    /**
-     * Sets the {@link DataManager} to be used during training.
-     *
-     * @param dataManager the {@link DataManager} to be set
-     * @return this {@code DefaultTrainingConfig}
-     */
-    public DefaultTrainingConfig optDataManager(DataManager dataManager) {
-        this.dataManager = dataManager;
-        return this;
-    }
-
     /**
      * Adds an {@link Evaluator} that needs to be computed during training.
      *
@@ -149,12 +136,6 @@ public Loss getLossFunction() {
         return loss;
     }
 
-    /** {@inheritDoc} */
-    @Override
-    public DataManager getDataManager() {
-        return dataManager;
-    }
-
     /** {@inheritDoc} */
     @Override
     public List<Evaluator> getEvaluators() {

@@ -87,8 +87,8 @@ public static void trainBatch(Trainer trainer, Batch batch) {
                 new BatchData(batch, new ConcurrentHashMap<>(), new ConcurrentHashMap<>());
         try (GradientCollector collector = trainer.newGradientCollector()) {
             for (Batch split : splits) {
-                NDList data = trainer.getDataManager().getData(split);
-                NDList labels = trainer.getDataManager().getLabels(split);
+                NDList data = split.getData();
+                NDList labels = split.getLabels();
                 NDList preds = trainer.forward(data, labels);
                 long time = System.nanoTime();
                 NDArray lossValue = trainer.getLoss().evaluate(labels, preds);
@@ -123,8 +123,8 @@ public static void validateBatch(Trainer trainer, Batch batch) {
                 new BatchData(batch, new ConcurrentHashMap<>(), new ConcurrentHashMap<>());
 
         for (Batch split : splits) {
-            NDList data = trainer.getDataManager().getData(split);
-            NDList labels = trainer.getDataManager().getLabels(split);
+            NDList data = split.getData();
+            NDList labels = split.getLabels();
             NDList preds = trainer.evaluate(data);
             batchData.getLabels().put(labels.get(0).getDevice(), labels);
             batchData.getPredictions().put(preds.get(0).getDevice(), preds);

@@ -60,8 +60,8 @@ public void trainBatch(Trainer trainer, Batch batch) {
                     executor.submit(
                             () -> {
                                 try (GradientCollector collector = trainer.newGradientCollector()) {
-                                    NDList data = trainer.getDataManager().getData(split);
-                                    NDList labels = trainer.getDataManager().getLabels(split);
+                                    NDList data = split.getData();
+                                    NDList labels = split.getLabels();
                                     NDList preds = trainer.forward(data);
                                     long time = System.nanoTime();
                                     NDArray lossValue = trainer.getLoss().evaluate(labels, preds);

@@ -72,7 +72,6 @@ public class Trainer implements AutoCloseable {
     private ParameterStore parameterStore;
     private List<Evaluator> evaluators;
     private Loss loss;
-    private DataManager dataManager;
 
     private boolean gradientsChecked;
 
@@ -89,7 +88,6 @@ public Trainer(Model model, TrainingConfig trainingConfig) {
         manager.setName("trainer");
         devices = trainingConfig.getDevices();
         loss = trainingConfig.getLossFunction();
-        dataManager = trainingConfig.getDataManager();
         Objects.requireNonNull(loss, "You must specify a loss for the trainer");
         evaluators = new ArrayList<>(trainingConfig.getEvaluators());
         evaluators.add(loss); // track loss as an evaluator by default
@@ -240,15 +238,6 @@ public Model getModel() {
         return model;
     }
 
-    /**
-     * Returns the {@link DataManager}.
-     *
-     * @return the {@link DataManager}
-     */
-    public DataManager getDataManager() {
-        return dataManager;
-    }
-
     /**
      * Gets all {@link Evaluator}s.
      *

@@ -84,13 +84,6 @@ public interface TrainingConfig {
      */
     Loss getLossFunction();
 
-    /**
-     * Gets the {@link DataManager} that computes data and labels from the output of dataset.
-     *
-     * @return a {@link DataManager}
-     */
-    DataManager getDataManager();
-
     /**
      * Returns the list of {@link Evaluator}s that should be computed during training.
      *

@@ -42,12 +42,10 @@
 import ai.djl.repository.zoo.ModelNotFoundException;
 import ai.djl.repository.zoo.ModelZoo;
 import ai.djl.repository.zoo.ZooModel;
-import ai.djl.training.DataManager;
 import ai.djl.training.DefaultTrainingConfig;
 import ai.djl.training.EasyTrain;
 import ai.djl.training.Trainer;
 import ai.djl.training.TrainingResult;
-import ai.djl.training.dataset.Batch;
 import ai.djl.training.dataset.Dataset;
 import ai.djl.training.evaluator.Accuracy;
 import ai.djl.training.listener.SaveModelTrainingListener;
@@ -111,13 +109,13 @@ public static TrainingResult runExample(String[] args)
                     getDataset(Dataset.Usage.TRAIN, executorService, arguments);
             StanfordMovieReview validateSet =
                     getDataset(Dataset.Usage.TEST, executorService, arguments);
-            model.setBlock(getModel());
+            model.setBlock(getModel(modelZooTextEmbedding));
 
             // setup training configuration
-            DefaultTrainingConfig config = setupTrainingConfig(arguments, modelZooTextEmbedding);
+            DefaultTrainingConfig config = setupTrainingConfig(arguments);
             try (Trainer trainer = model.newTrainer(config)) {
                 trainer.setMetrics(new Metrics());
-                Shape encoderInputShape = new Shape(arguments.getBatchSize(), 10, 50);
+                Shape encoderInputShape = new Shape(arguments.getBatchSize(), 10);
 
                 // initialize trainer with proper input shape
                 trainer.initialize(encoderInputShape);
@@ -143,8 +141,16 @@ public static TrainingResult runExample(String[] args)
         }
     }
 
-    private static Block getModel() {
+    private static Block getModel(ModelZooTextEmbedding embedding) {
         return new SequentialBlock()
+                .addSingleton(
+                        a -> {
+                            try {
+                                return embedding.embedText(a);
+                            } catch (EmbeddingException e) {
+                                throw new IllegalStateException(e);
+                            }
+                        })
                 .add(
                         LSTM.builder()
                                 .setNumLayers(2)
@@ -163,8 +169,7 @@ private static Block getModel() {
                 .add(Linear.builder().setUnits(2).build());
     }
 
-    public static DefaultTrainingConfig setupTrainingConfig(
-            Arguments arguments, ModelZooTextEmbedding embedding) {
+    public static DefaultTrainingConfig setupTrainingConfig(Arguments arguments) {
         String outputDir = arguments.getOutputDir();
         SaveModelTrainingListener listener = new SaveModelTrainingListener(outputDir);
         listener.setSaveModelCallback(
@@ -177,7 +182,6 @@ public static DefaultTrainingConfig setupTrainingConfig(
                 });
 
         return new DefaultTrainingConfig(new SoftmaxCrossEntropyLoss())
-                .optDataManager(new EmbeddingDataManager(embedding))
                 .addEvaluator(new Accuracy())
                 .optDevices(Device.getDevices(arguments.getMaxGpus()))
                 .addTrainingListeners(TrainingListener.Defaults.logging(outputDir))
@@ -243,22 +247,4 @@ public Batchifier getBatchifier() {
                     .build();
         }
     }
-
-    private static final class EmbeddingDataManager extends DataManager {
-
-        private ModelZooTextEmbedding embedding;
-
-        public EmbeddingDataManager(ModelZooTextEmbedding embedding) {
-            this.embedding = embedding;
-        }
-
-        @Override
-        public NDList getData(Batch batch) {
-            try {
-                return new NDList(embedding.embedText(batch.getData().head()));
-            } catch (EmbeddingException e) {
-                throw new IllegalArgumentException(e.getMessage(), e);
-            }
-        }
-    }
 }