[FEA] Adding Benchmarking classes to evaluate core tools performance #1169

bilalbari · 2024-07-05T19:54:30Z

Fixes #1120

This PR solves for adding benchmarking for tools.

Classes -

Benchmark - The utility class for Benchmarking
BenchmarkBase - The base class for extending and writing a benchmarker
BenchmarkArgs - Argument parsing class for benchmarking
SingleThreadedQualToolBenchmark - A template benchmark class for gathering metrics for qual tool

Writing a benchmark -

Extend BenchmarkBase and override the runBenchmarkSuite function
Write logically similar benchmarks inside the runBenchmark which will add a header to the output with the name provided.
Now for each case to be tested, use the Benchmark class addCase to write various cases of the same Benchmark. Included example benchmarks using the --per-sql tag with the qualification tool

Running the benchmark -

Use the java command to run the created Benchmark class with the following supported params -

-i : total number of iterations to run to calculate average metrics
-w : total number of warmup iterations to run before calculating the final metrics ( warmup is relavant so that final results are not skewed by the initial java classloading times )
-o : output directory where to store the final result file. Default to the directory rapids-tools-benchmark in the root directory
-f : output format of the stored result. Currently supports text. Json to be added in future iterations
-a : input arguments to pass the underlying benchmark classes

Eg-

java -cp $CLASSPATH \
  com.nvidia.spark.rapids.tool.benchmarks.SingleThreadedQualToolBenchmark \
  -i 3 -w 3 -a " --output-directory output eventlogs"

Sample Output -

================================================================================================
Benchmark_Per_SQL_Arg_Qualification
================================================================================================

JVM Name                   :   OpenJDK 64-Bit Server VM 
Java Version               :   1.8.0_412 
OS Name                    :   Linux 
OS Version                 :   6.5.0-41-generic 
MaxHeapMemory              :   14219 MB 
Total Warm Up Iterations   :   0 
Total Runtime Iterations   :   1 
 
Benchmarker:                              Best Time(ms)   Avg Time(ms)   Stdev(ms)      Avg GC Time(ms)       Avg GC Count     Stdev GC Count    Max GC Time(ms)       Max GC Count   Relative
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Enable_Per_SQL_Arg_Qualification                  22963          22963           0                812.0               28.0                  0                812                 28      1.00X
Disable_Per_SQL_Arg_Qualification                 20886          20886           0                434.0                9.0                  0                434                  9      1.10X

Output metrics -

Best Time(ms) - best runtime over i iterations
Avg Time(ms) - Avg runtime calculated over i iterations
Stdev(ms) - standard deviation of the runtime to realise variance in runtime
Avg GC Time - Average time spend doing garbage collection over i iterations
Avg GC Count - average time garbage collection is triggered
Max GC Time - max time spend doing GC during various iterations
Max GC Count - maximum GC triggered during any one of the runs
Stdec GC Count - standard deviation of GC counts over GC iterations
Relative - this takes the first case as a baseline and gives a metric of how much faster the next cases are ( 1.2x, 1.5x etc. )

These changes are subject to be extended in future iterations

Signed-off-by: Ahmed Hussein (amahussein) <a@ahussein.me>

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Spark rapids tools 1120 fea args

* Adding GC Metrics Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com> * Review comment changes Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com> * Correcting output format + refactoring Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com> * Output Formatting Changes Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com> * Formatting + Making qual bench single threaded Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com> --------- Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com> Co-authored-by: Sayed Bilal Bari <sbari@nvidia.com>

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/BenchmarkBase.scala

...src/main/scala/org/apache/spark/rapids/tool/benchmarks/SingleThreadedQualToolBenchmark.scala

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/BenchmarkArgs.scala

parthosa

Thanks @bilalbari for the PR. Made some initial comments.

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/Benchmark.scala

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/BenchmarkArgs.scala

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

parthosa

Thanks @bilalbari. The refactoring has simplified a lot. Made some minor comments.

...src/main/scala/org/apache/spark/rapids/tool/benchmarks/SingleThreadedQualToolBenchmark.scala

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/Benchmark.scala

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/BenchmarkBase.scala

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

cindyyuanjiang · 2024-07-11T18:36:44Z

Are we planning to include any documentation on how to run the benchmarks?

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

cindyyuanjiang

Thanks @bilalbari for this feature! Some comments on the README.

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/README.md

…-rapids-tools-1120

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/README.md

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

parthosa

Thank you @bilalbari for this. This feature will be really helpful for tools 🎉

amahussein

LGTME!
Thanks @bilalbari for great effort working on that feature.

core/src/main/scala/org/apache/spark/sql/rapids/tool/util/MemoryMetricsTracker.scala

…-rapids-tools-1120

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

amahussein

Thanks @bilalbari !
LGTME

cindyyuanjiang

Thank you @bilalbari! LGTM.

amahussein and others added 10 commits July 1, 2024 12:31

Add Benchmarking to evaluate the core tools performance

5fa3fff

Signed-off-by: Ahmed Hussein (amahussein) <a@ahussein.me>

Adding changes for argument parsing

cf099b6

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

changing warmup time to warmup iterations

1f5155d

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Removing unsed imports

ad4e562

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Adding Qualification Benchmark

303ee60

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Changes for review comments

6137021

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Changes for review comments

4f85b8d

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

removing name param from scallop options

0131c71

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Merge pull request #11 from amahussein/spark-rapids-tools-1120-FEA_ARGS

8e3b18b

Spark rapids tools 1120 fea args

bilalbari requested a review from amahussein July 5, 2024 19:55

bilalbari added the feature request New feature or request label Jul 5, 2024

amahussein assigned bilalbari Jul 5, 2024

amahussein added the core_tools Scope the core module (scala) label Jul 5, 2024

amahussein requested review from parthosa and nartal1 July 5, 2024 20:00

nartal1 reviewed Jul 5, 2024

View reviewed changes

parthosa reviewed Jul 9, 2024

View reviewed changes

bilalbari added 6 commits July 9, 2024 10:03

Review changes

d9a8be1

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Correcting scalastyle failure

9033c82

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Correcting passed argument name for semantic clarity

9199881

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Short flag + desc - update

3001cb3

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Updating short flag usage

118a505

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Refactor for correcting structure

eaa6a2c

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

parthosa reviewed Jul 10, 2024

View reviewed changes

bilalbari added 3 commits July 11, 2024 09:54

Review comments changes

b6e7b3f

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Review comment changes

73d3992

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Adding separator as a val

3d9290f

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Adding README for benchmark

d6bc2da

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

cindyyuanjiang requested changes Jul 11, 2024

View reviewed changes

parthosa reviewed Jul 11, 2024

View reviewed changes

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/README.md Outdated Show resolved Hide resolved

parthosa mentioned this pull request Jul 11, 2024

[BUG] Accessing closed FileSystem while copying UI folders #1183

Closed

bilalbari added 2 commits July 12, 2024 09:26

Merge branch 'dev' of github.com:NVIDIA/spark-rapids-tools into spark…

3a8d4c5

…-rapids-tools-1120

Review changes for README

25a4d80

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

parthosa reviewed Jul 12, 2024

View reviewed changes

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/README.md Outdated Show resolved Hide resolved

core/src/main/scala/org/apache/spark/rapids/tool/benchmarks/README.md Show resolved Hide resolved

bilalbari added 5 commits July 12, 2024 15:03

Corrected wording in README

9b59546

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Updated README review changes

2000e28

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Correcting README typo

f4d3293

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

Correcting README typo

a7db0dd

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

README typo - RAPIDS_TOOLs -> SPARK_RAPIDS..

c424cc9

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

parthosa previously approved these changes Jul 12, 2024

View reviewed changes

amahussein previously approved these changes Jul 12, 2024

View reviewed changes

cindyyuanjiang reviewed Jul 12, 2024

View reviewed changes

core/src/main/scala/org/apache/spark/sql/rapids/tool/util/MemoryMetricsTracker.scala Show resolved Hide resolved

bilalbari added 2 commits July 15, 2024 09:52

Merge branch 'dev' of github.com:NVIDIA/spark-rapids-tools into spark…

9fe291e

…-rapids-tools-1120

Adding license header + README changes

17c2a05

Signed-off-by: Sayed Bilal Bari <sbari@nvidia.com>

bilalbari dismissed stale reviews from amahussein and parthosa via 17c2a05 July 15, 2024 15:03

amahussein approved these changes Jul 15, 2024

View reviewed changes

amahussein requested a review from cindyyuanjiang July 15, 2024 16:28

cindyyuanjiang approved these changes Jul 15, 2024

View reviewed changes

amahussein merged commit 8cc3fe0 into NVIDIA:dev Jul 15, 2024
14 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[FEA] Adding Benchmarking classes to evaluate core tools performance #1169

[FEA] Adding Benchmarking classes to evaluate core tools performance #1169

bilalbari commented Jul 5, 2024 •

edited

Loading

parthosa left a comment

parthosa left a comment

cindyyuanjiang commented Jul 11, 2024

cindyyuanjiang left a comment

parthosa left a comment

amahussein left a comment

amahussein left a comment

cindyyuanjiang left a comment

[FEA] Adding Benchmarking classes to evaluate core tools performance #1169

[FEA] Adding Benchmarking classes to evaluate core tools performance #1169

Conversation

bilalbari commented Jul 5, 2024 • edited Loading

Classes -

Writing a benchmark -

Running the benchmark -

Sample Output -

Output metrics -

parthosa left a comment

Choose a reason for hiding this comment

parthosa left a comment

Choose a reason for hiding this comment

cindyyuanjiang commented Jul 11, 2024

cindyyuanjiang left a comment

Choose a reason for hiding this comment

parthosa left a comment

Choose a reason for hiding this comment

amahussein left a comment

Choose a reason for hiding this comment

amahussein left a comment

Choose a reason for hiding this comment

cindyyuanjiang left a comment

Choose a reason for hiding this comment

bilalbari commented Jul 5, 2024 •

edited

Loading