数据科学是一项艺术
- 可以帮企业赚更多的钱
- 个人而言,工作充满了挑战,同时也很有意思
那么对于数据科学来说,应该掌握的软硬技能有哪些呢?这个 repo 记录了值得推荐的在线书籍或视频地址。
- 数据科学中的 R 语言:四川师范大学研究生公选课《数据科学中的R语言》的课程内容,对初学者,非常友善,包含了基础性介绍、统计图形、探索性数据分析、模型初步、网络分析等。作者王敏杰
- shiny 工业级别的开发指南:很多分析师在开发 shiny 的过程中因为自身的背景原因还是相对较为松散,这本指南给出了完整的工业级 shiny 开发指引,作者为 Colin Fay, Vincent Guyader, Cervan Girard, Sébastien Rochette
- 现代统计图形:针对于 R 图形的全面讲解,对 R 传统绘图方式感兴趣的同学建议阅读,谢益辉早期著作。
- What They Forgot to Teach You About R:一些 R 工程化的技巧,可以一看。
- Hands-On Machine Learning with R:介绍了在 R 中如何实现常见的机器学习方法。
- Awesome R-shiny:Shiny 相关的汇总,很值得经常浏览。
- R 语言教程:北京大学李东风老师的《R语言教程》的草稿,
- 可解释性机器学习故事(XAI Stories):University of Warsaw 和 the Warsaw University of Technology 的案例课程。R 和 Python 为主要工具。
- 使用 R 做空间计算:空间数据分析、可视化和建模。
- Introduction to Modern Statistics (2nd Ed):经典的内容能读老外的就读老外的。
- Data Science: Theories, Models, Algorithms, and Analytics:使用 R 语言完成数据科学项目的课程资料,较为全面。
- Introduction to Data Science:哈佛大学的同名课程,适用于没有 R 基础的入门小白。
对于非统计系背景的同学稍有些难度的:
- 数理统计讲义:华南理工大学数学学院何志坚老师的作品,已经是能找到最通俗易懂的讲义了
- 现代科研指北:于淼博士大作,很神奇的关于如何做科研的系统思考。
- Supervised Machine Learning for Text Analysis in R:作者 EMIL HVITFELDT AND JULIA SILGE,原书的线上版。
- High-Dimensional Probability:An Introduction with Applications in Data Science:一本 trick 合集,实用。