Particle Swarm Optimization with CUDA

Testing several implementations of particle swarm optimization with different CUDA features.

Conclusion: Minimize the number of reads and writes to device and host memory, prioritizing use of thread block memory for updating local variables. CUDA's unified memory features with memory hints can also provide additional performance in speed.

Implementation	Avg Runtime w/ 5000 particles
C++ (sequential)	180ms
CUDA (Naive)	730ms
CUDA (Unified Memory + thread memory usage)	98ms

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
pso-cpu.cpp		pso-cpu.cpp
pso-gpu-v1.cu		pso-gpu-v1.cu
pso-gpu-v2-shared.cu		pso-gpu-v2-shared.cu
pso-gpu-v3-um.cu		pso-gpu-v3-um.cu

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Particle Swarm Optimization with CUDA

About

Releases

Packages

Languages

kailin-lu/CUDA-PSO

Folders and files

Latest commit

History

Repository files navigation

Particle Swarm Optimization with CUDA

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages