nanowell

Follow

🎯

Focusing

nanowell nanowell

🎯

Focusing

Follow

optimizer.step() carefully

32 followers · 5 following

World

Achievements

Achievements

Highlights

Developer Program Member

Pinned Loading

Q-Sparse-LLM Q-Sparse-LLM Public

My Implementation of Q-Sparse: All Large Language Models can be Fully Sparsely-Activated

Python 30 1
AdEMAMix-Optimizer-Pytorch AdEMAMix-Optimizer-Pytorch Public

The AdEMAMix Optimizer: Better, Faster, Older.

Python 169 10