记录多元统计分析的数据、代码、结果。
《应用多元统计分析》, 高慧璇, 北京大学出版社.
配套资料:课程网站上有ppt、例题SAS代码和部分习题解答。
推荐阅读:
- An Introduction to Statistical Learning with Applications in R, Gareth James
- R语言实战(第二版), Robert I. Kabacoff.
- 实用多元统计分析(第六版), Richard A. Johnson.
说明:教材例题只给了SAS代码, R语言实战是很好的补充, 而且讲得比这本书更偏向于应用;
-
第四章 回归分析
- 我跳过了第四章, 回归分析是另一门课程的内容.
平时作业已全部上传到我的博客里 在这个页面:https://lucajiang.github.io/2020/11/27/Multivariate-Statistics-HW/
可以在此处围观大作业的pdf文件:https://lucajiang.github.io/2020/11/16/Kaggle-Mushroom-Dataset/
很有意思的是, 2017级多元统计课程并没有选用这本书作为教材, 而是选用了Modern Multivariate Statistical Techniques-- 一本介绍现代多元统计的英文书作为教材. 课程内容包括: 主成分分析 线性判别分析 决策树 聚类分析 支持向量机 集成学习等.
以及, 感谢star本项目的同学给我的支持. 欢迎大家顺手去逛逛我的个人博客.
大作业使用的模型包括: 主成分回归、线性判别分析、LASSO 回归、逐步回归、决策树(CART、C4.5、C5.0)、 随机森林、XGBoost、kNN、SVM 、NN、RIPPER 和 PART(两个类似决策树的模型,虽然很多教材都没涉及,但尤其适合我选择的数据集). 涉及了数据的探索性分析,预处理,建模等内容. 如果感兴趣, 可以看看.
附 Modern Multivariate Statistical Techniques 教材主页的网址: https://astro.temple.edu/~alan/MMST/
最近MMST主页崩了, 数据可以从 https://github.com/cran/MMST 下载.