Note: For run instructions check the RUN-INSTRUCTIONS file.
git clone https://github.com/akshithg/bot599.git && cd bot599
Files:
. ├── README.md ├── data │ ├── 3prime.fasta │ ├── 5prime.fasta │ └── human_exon.fasta ├── feature_calculator.py ├── file_splitter.py ├── merge_feature_file.py └── process_fasta.py
Usage: python process_fasta.py <fasta_file>
Example:
python process_fasta.py ./data/3prime.fasta python process_fasta.py ./data/5prime.fasta
. ├── README.md ├── data │ ├── 3prime.fasta │ ├── 3prime.fasta.clean │ ├── 5prime.fasta │ ├── 5prime.fasta.clean │ └── human_exon.fasta ├── feature_calculator.py ├── file_splitter.py ├── merge_feature_file.py └── process_fasta.py
Usage: python file_splitter.py <clean_fasta_file> <pieces>
Example:
python file_splitter.py data/3prime.fasta.clean 5 python file_splitter.py data/5prime.fasta.clean 5
Files:
. ├── README.md ├── data │ ├── 3prime.fasta │ ├── 3prime.fasta.clean │ ├── 3prime.fasta.clean.splits │ │ ├── part1 │ │ ├── part2 │ │ ├── part3 │ │ ├── part4 │ │ └── part5 │ ├── 5prime.fasta │ ├── 5prime.fasta.clean │ ├── 5prime.fasta.clean.splits │ │ ├── part1 │ │ ├── part2 │ │ ├── part3 │ │ ├── part4 │ │ └── part5 │ └── human_exon.fasta ├── feature_calculator.py ├── file_splitter.py ├── merge_feature_file.py └── process_fasta.py
All the features are defined in feature_calculator.py
, if you don't need something, comment it.
... # features feature_calculator.gc_content() feature_calculator.tataaa_box_present() feature_calculator.gc_box() feature_calculator.poly_a_tail() feature_calculator.stop_codon_present() feature_calculator.sequence_length() # save features to file feature_calculator.save_features(feature_calculator.feature_columns()) ...
Usage: python feature_calculator.py <clean_fasta_file> [output_file]
Usage: qsub ./sun_grid_engine/job.q <input> <output>
Example:
mkdir data/class1 mkdir data/class2 qsub ./sun_grid_engine/job.q data/5prime.fasta.clean.splits/part data/class1/feature qsub ./sun_grid_engine/job.q data/3prime.fasta.clean.splits/part data/class2/feature
. ├── README.md ├── data │ ├── 3prime.fasta │ ├── 3prime.fasta.clean │ ├── 3prime.fasta.clean.splits │ │ ├── part1 │ │ ├── part2 │ │ ├── part3 │ │ ├── part4 │ │ └── part5 │ ├── 5prime.fasta │ ├── 5prime.fasta.clean │ ├── 5prime.fasta.clean.splits │ │ ├── part1 │ │ ├── part2 │ │ ├── part3 │ │ ├── part4 │ │ └── part5 │ ├── class1 │ │ ├── feature1 │ │ ├── feature2 │ │ ├── feature3 │ │ ├── feature4 │ │ └── feature5 │ ├── class2 │ │ ├── feature1 │ │ ├── feature2 │ │ ├── feature3 │ │ ├── feature4 │ │ └── feature5 │ └── human_exon.fasta ├── feature_calculator.py ├── file_splitter.py ├── merge_feature_file.py └── process_fasta.py
Usage: python merge_features.py <directory> <output_file>
Example:
python merge_feature_file.py data/class1 data/class1_features python merge_feature_file.py data/class2 data/class2_features
. ├── README.md ├── data │ ├── 3prime.fasta │ ├── 3prime.fasta.clean │ ├── 3prime.fasta.clean.splits │ │ ├── part1 │ │ ├── part2 │ │ ├── part3 │ │ ├── part4 │ │ └── part5 │ ├── 5prime.fasta │ ├── 5prime.fasta.clean │ ├── 5prime.fasta.clean.splits │ │ ├── part1 │ │ ├── part2 │ │ ├── part3 │ │ ├── part4 │ │ └── part5 │ ├── class1 │ │ ├── feature1 │ │ ├── feature2 │ │ ├── feature3 │ │ ├── feature4 │ │ └── feature5 │ ├── class1_features │ ├── class2 │ │ ├── feature1 │ │ ├── feature2 │ │ ├── feature3 │ │ ├── feature4 │ │ └── feature5 │ ├── class2_features │ └── human_exon.fasta ├── feature_calculator.py ├── file_splitter.py ├── merge_feature_file.py └── process_fasta.py
cd svm ./run_svm.sh ../data/class1_features ../data/class2_features