Tera Sort benchmarking

How to run the code:

SM_Terasort.java: compile:

javac SM_Terasort.java

run:

java -Xms8192m -Xmx10240m SM_Terasort

note: here the size for xms and xmx means the size of initial heap size and maximum heap size for jvm. This should be determined according to the configure file. If you configure larger chunk size, then this number should be increased to make sure one chunk can be sucessfully loaded into memory.

Hadoop_Terasort.java: compile:

/home/ubuntu/hadoop/bin/hadoop com.sun.tools.javac.Main Hadoop_Terasort.java
jar cf Hadoop_Terasort.jar *.class

run:

/home/ubuntu/hadoop/bin/hadoop jar Hadoop_Terasort.jar Hadoop_Terasort /sortdata/sorttxt /sortdata/output

Spark_Terasort.scala: compile: directly run Spark Shell, no need to compile

run:

/home/ubuntu/spark/bin/spark-shell

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
Hadoop_Terasort.java		Hadoop_Terasort.java
README.md		README.md
SM_Terasort.java		SM_Terasort.java
SM_config.properties		SM_config.properties
Spark_Terasort.scala		Spark_Terasort.scala
Spark_Terasort_app.scala		Spark_Terasort_app.scala

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Tera Sort benchmarking

About

Releases

Packages

Languages

llgeek/TeraSort-banchmark

Folders and files

Latest commit

History

Repository files navigation

Tera Sort benchmarking

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages