From c0b99877b55f792751aa9ce9e2f124ba9684a2c0 Mon Sep 17 00:00:00 2001
From: "Daniel J. McDonald" <daniel@stat.ubc.ca>
Date: Tue, 19 Sep 2023 17:08:55 -0700
Subject: [PATCH] cv for many models

---
 .../execute-results/html.json                 |  20 ++
 schedule/slides/00-cv-for-many-models.html    | 314 ------------------
 ...y-models.Rmd => 00-cv-for-many-models.qmd} |  69 ++--
 3 files changed, 47 insertions(+), 356 deletions(-)
 create mode 100644 _freeze/schedule/slides/00-cv-for-many-models/execute-results/html.json
 delete mode 100644 schedule/slides/00-cv-for-many-models.html
 rename schedule/slides/{00-cv-for-many-models.Rmd => 00-cv-for-many-models.qmd} (51%)

diff --git a/_freeze/schedule/slides/00-cv-for-many-models/execute-results/html.json b/_freeze/schedule/slides/00-cv-for-many-models/execute-results/html.json
new file mode 100644
index 0000000..eb0f1bc
--- /dev/null
+++ b/_freeze/schedule/slides/00-cv-for-many-models/execute-results/html.json
@@ -0,0 +1,20 @@
+{
+  "hash": "ce81d559001112d6fd73786eb2f4d192",
+  "result": {
+    "markdown": "---\nlecture: \"00 CV for many models\"\nformat: revealjs\nmetadata-files: \n  - _metadata.yml\n---\n---\n---\n\n## {{< meta lecture >}} {.large background-image=\"gfx/smooths.svg\" background-opacity=\"0.3\"}\n\n[Stat 406]{.secondary}\n\n[{{< meta author >}}]{.secondary}\n\nLast modified -- 19 September 2023\n\n\n\n$$\n\\DeclareMathOperator*{\\argmin}{argmin}\n\\DeclareMathOperator*{\\argmax}{argmax}\n\\DeclareMathOperator*{\\minimize}{minimize}\n\\DeclareMathOperator*{\\maximize}{maximize}\n\\DeclareMathOperator*{\\find}{find}\n\\DeclareMathOperator{\\st}{subject\\,\\,to}\n\\newcommand{\\E}{E}\n\\newcommand{\\Expect}[1]{\\E\\left[ #1 \\right]}\n\\newcommand{\\Var}[1]{\\mathrm{Var}\\left[ #1 \\right]}\n\\newcommand{\\Cov}[2]{\\mathrm{Cov}\\left[#1,\\ #2\\right]}\n\\newcommand{\\given}{\\ \\vert\\ }\n\\newcommand{\\X}{\\mathbf{X}}\n\\newcommand{\\x}{\\mathbf{x}}\n\\newcommand{\\y}{\\mathbf{y}}\n\\newcommand{\\P}{\\mathcal{P}}\n\\newcommand{\\R}{\\mathbb{R}}\n\\newcommand{\\norm}[1]{\\left\\lVert #1 \\right\\rVert}\n\\newcommand{\\snorm}[1]{\\lVert #1 \\rVert}\n\\newcommand{\\tr}[1]{\\mbox{tr}(#1)}\n\\newcommand{\\brt}{\\widehat{\\beta}^R_{s}}\n\\newcommand{\\brl}{\\widehat{\\beta}^R_{\\lambda}}\n\\newcommand{\\bls}{\\widehat{\\beta}_{ols}}\n\\newcommand{\\blt}{\\widehat{\\beta}^L_{s}}\n\\newcommand{\\bll}{\\widehat{\\beta}^L_{\\lambda}}\n$$\n\n\n\n\n\n## Some data and 4 models\n\n\n::: {.cell layout-align=\"center\"}\n\n```{.r .cell-code}\ndata(\"mobility\", package = \"Stat406\")\n```\n:::\n\n\n**Model 1:** Lasso on all predictors, use CV min\n\n**Model 2:** Ridge on all predictors, use CV min\n\n**Model 3:** OLS on all predictors (no tuning parameters)\n\n**Model 4:** (1) Lasso on all predictors, then (2) OLS on those chosen at CV min\n\n\n> How do I decide between these 4 models?\n\n\n## CV functions\n\n\n::: {.cell layout-align=\"center\"}\n\n```{.r .cell-code}\nkfold_cv <- function(data, estimator, predictor, error_fun, kfolds = 5) {\n  fold_labels <- sample(rep(seq_len(kfolds), length.out = nrow(data)))\n  errors <- double(kfolds)\n  for (fold in seq_len(kfolds)) {\n    test_rows <- fold_labels == fold\n    train <- data[!test_rows, ]\n    test <- data[test_rows, ]\n    current_model <- estimator(train)\n    test$.preds <- predictor(current_model, test)\n    errors[fold] <- error_fun(test)\n  }\n  mean(errors)\n}\n\nloo_cv <- function(dat) {\n  mdl <- lm(Mobility ~ ., data = dat)\n  mean( abs(residuals(mdl)) / abs(1 - hatvalues(mdl)) ) # MAE version\n}\n```\n:::\n\n\n\n## Experiment setup\n\n\n::: {.cell layout-align=\"center\"}\n\n```{.r .cell-code}\n# prepare our data\n# note that mob has only continuous predictors, otherwise could be trouble\nmob <- mobility[complete.cases(mobility), ] |> select(-ID, -State, -Name)\n# avoid doing this same operation a bunch\nxmat <- function(dat) dat |> select(!Mobility) |> as.matrix()\n\n# set up our model functions\nlibrary(glmnet)\nmod1 <- function(dat, ...) cv.glmnet(xmat(dat), dat$Mobility, type.measure = \"mae\", ...)\nmod2 <- function(dat, ...) cv.glmnet(xmat(dat), dat$Mobility, alpha = 0, type.measure = \"mae\", ...)\nmod3 <- function(dat, ...) glmnet(xmat(dat), dat$Mobility, lambda = 0, ...) # just does lm()\nmod4 <- function(dat, ...) cv.glmnet(xmat(dat), dat$Mobility, relax = TRUE, gamma = 1, type.measure = \"mae\", ...)\n\n# this will still \"work\" on mod3, because there's only 1 s\npredictor <- function(mod, dat) drop(predict(mod, newx = xmat(dat), s = \"lambda.min\"))\n\n# chose mean absolute error just 'cause\nerror_fun <- function(testdata) mean(abs(testdata$Mobility - testdata$.preds))\n```\n:::\n\n\n\n## Run the experiment\n\n\n\n::: {.cell layout-align=\"center\"}\n\n```{.r .cell-code}\nall_model_funs <- lst(mod1, mod2, mod3, mod4)\nall_fits <- map(all_model_funs, .f = exec, dat = mob)\n\n# unfortunately, does different splits for each method, so we use 10, \n# it would be better to use the _SAME_ splits\nten_fold_cv <- map_dbl(all_model_funs, ~ kfold_cv(mob, .x, predictor, error_fun, 10)) \n\nin_sample_cv <- c(\n  mod1 = min(all_fits[[1]]$cvm),\n  mod2 = min(all_fits[[2]]$cvm),\n  mod3 = loo_cv(mob),\n  mod4 = min(all_fits[[4]]$cvm)\n)\n\ntib <- bind_rows(in_sample_cv, ten_fold_cv)\ntib$method = c(\"in_sample\", \"out_of_sample\")\ntib\n```\n\n::: {.cell-output .cell-output-stdout}\n```\n# A tibble: 2 × 5\n    mod1   mod2   mod3   mod4 method       \n   <dbl>  <dbl>  <dbl>  <dbl> <chr>        \n1 0.0159 0.0161 0.0164 0.0156 in_sample    \n2 0.0158 0.0161 0.0165 0.0161 out_of_sample\n```\n:::\n:::\n",
+    "supporting": [
+      "00-cv-for-many-models_files"
+    ],
+    "filters": [
+      "rmarkdown/pagebreak.lua"
+    ],
+    "includes": {
+      "include-after-body": [
+        "\n<script>\n  // htmlwidgets need to know to resize themselves when slides are shown/hidden.\n  // Fire the \"slideenter\" event (handled by htmlwidgets.js) when the current\n  // slide changes (different for each slide format).\n  (function () {\n    // dispatch for htmlwidgets\n    function fireSlideEnter() {\n      const event = window.document.createEvent(\"Event\");\n      event.initEvent(\"slideenter\", true, true);\n      window.document.dispatchEvent(event);\n    }\n\n    function fireSlideChanged(previousSlide, currentSlide) {\n      fireSlideEnter();\n\n      // dispatch for shiny\n      if (window.jQuery) {\n        if (previousSlide) {\n          window.jQuery(previousSlide).trigger(\"hidden\");\n        }\n        if (currentSlide) {\n          window.jQuery(currentSlide).trigger(\"shown\");\n        }\n      }\n    }\n\n    // hookup for slidy\n    if (window.w3c_slidy) {\n      window.w3c_slidy.add_observer(function (slide_num) {\n        // slide_num starts at position 1\n        fireSlideChanged(null, w3c_slidy.slides[slide_num - 1]);\n      });\n    }\n\n  })();\n</script>\n\n"
+      ]
+    },
+    "engineDependencies": {},
+    "preserve": {},
+    "postProcess": true
+  }
+}
\ No newline at end of file
diff --git a/schedule/slides/00-cv-for-many-models.html b/schedule/slides/00-cv-for-many-models.html
deleted file mode 100644
index b08314f..0000000
--- a/schedule/slides/00-cv-for-many-models.html
+++ /dev/null
@@ -1,314 +0,0 @@
-<!DOCTYPE html>
-<html lang="" xml:lang="">
-  <head>
-    <title>00 CV for many models</title>
-    <meta charset="utf-8" />
-    <meta name="author" content="STAT 406" />
-    <meta name="author" content="Daniel J. McDonald" />
-    <script src="materials/libs/header-attrs/header-attrs.js"></script>
-    <script src="materials/libs/fabric/fabric.min.js"></script>
-    <link href="materials/libs/xaringanExtra-scribble/scribble.css" rel="stylesheet" />
-    <script src="materials/libs/xaringanExtra-scribble/scribble.js"></script>
-    <script>document.addEventListener('DOMContentLoaded', function() { window.xeScribble = new Scribble({"pen_color":["#e98a15"],"pen_size":3,"eraser_size":30,"palette":["#2c365e","#e98a15","#0a8754","#a8201a","#E41A1C","#377EB8","#4DAF4A","#984EA3","#FF7F00","#FFFF33"]}) })</script>
-    <link href="materials/libs/panelset/panelset.css" rel="stylesheet" />
-    <script src="materials/libs/panelset/panelset.js"></script>
-    <script src="materials/libs/clipboard/clipboard.min.js"></script>
-    <link href="materials/libs/xaringanExtra-clipboard/xaringanExtra-clipboard.css" rel="stylesheet" />
-    <script src="materials/libs/xaringanExtra-clipboard/xaringanExtra-clipboard.js"></script>
-    <script>window.xaringanExtraClipboard(null, {"button":"<i class=\"fa fa-clipboard\"><\/i>","success":"<i class=\"fa fa-check\" style=\"color: #90BE6D\"><\/i>","error":"Press Ctrl+C to Copy"})</script>
-    <link href="materials/libs/font-awesome/css/all.css" rel="stylesheet" />
-    <link href="materials/libs/font-awesome/css/v4-shims.css" rel="stylesheet" />
-    <script src="https://kit.fontawesome.com/ae71192e04.js" crossorigin="anonymous"></script>
-    <link rel="stylesheet" href="materials/xaringan-themer.css" type="text/css" />
-    <link rel="stylesheet" href="materials/slides-style.css" type="text/css" />
-  </head>
-  <body>
-    <textarea id="source">
-class: center, middle, inverse, title-slide
-
-.title[
-# 00 CV for many models
-]
-.author[
-### STAT 406
-]
-.author[
-### Daniel J. McDonald
-]
-.date[
-### Last modified - 2022-10-12
-]
-
----
-
-
-
-
-
-<style>.panelset{--panel-tab-active-foreground: #2c365e;--panel-tab-hover-foreground: #e98a15;}</style>
-
-
-
-## Some data and 4 models
-
-
-```r
-data(mobility, package = "Stat406")
-```
-
-**Model 1:** Lasso on all predictors, use CV min
-
-**Model 2:** Ridge on all predictors, use CV min
-
-**Model 3:** OLS on all predictors (no tuning parameters)
-
-**Model 4:** (1) Lasso on all predictors, then (2) OLS on those chosen at CV min
-
-.emphasis[
-How do I decide between these 4 models?
-]
-
---
-
-
-```r
-kfold_cv &lt;- function(data, estimator, predictor, error_fun, kfolds = 5) {
-  fold_labels &lt;- sample(rep(seq(kfolds), length.out = nrow(data)))
-  errors &lt;- double(kfolds)
-  for (fold in seq_len(kfolds)) {
-    test_rows &lt;- fold_labels == fold
-    train &lt;- data[!test_rows, ]
-    test &lt;- data[test_rows, ]
-    current_model &lt;- estimator(train)
-    test$.preds &lt;- predictor(current_model, test)
-    errors[fold] &lt;- error_fun(test)
-  }
-  mean(errors)
-}
-```
-
----
-
-## Experiment setup
-
-
-```r
-# prepare our data
-# note that mob has only continuous predictors, otherwise could be trouble
-mob &lt;- mobility[complete.cases(mobility), ] %&gt;% select(-ID, -State, -Name)
-# avoid doing this same operation a bunch
-xmat &lt;- function(dataset) as.matrix(select(dataset, !Mobility))
-
-# set up our model functions
-library(glmnet)
-mod1 &lt;- function(dataset, ...) cv.glmnet(xmat(dataset), dataset$Mobility, type.measure = "mae", ...)
-mod2 &lt;- function(dataset, ...) cv.glmnet(xmat(dataset), dataset$Mobility, alpha = 0, type.measure = "mae", ...)
-mod3 &lt;- function(dataset, ...) glmnet(xmat(dataset), dataset$Mobility, lambda = 0, ...) # just does lm()
-mod4 &lt;- function(dataset, ...) cv.glmnet(xmat(dataset), dataset$Mobility, relax = TRUE, gamma = 1, 
-                                         type.measure = "mae", ...)
-
-# this will still "work" on mod3, because there's only 1 s
-predictor &lt;- function(modle, dataset) drop(predict(modle, newx = xmat(dataset), s = "lambda.min"))
-
-# chose mean absolute error just 'cause
-error_fun &lt;- function(testdata) mean(abs(testdata$Mobility - testdata$.preds))
-
-# not necessarily useful for choosing in this context, but good for illustration
-loo_cv &lt;- function(dataset) {
-  mdl &lt;- lm(Mobility ~ ., data = dataset)
-  mean( abs(residuals(mdl)) / abs(1 - hatvalues(mdl)) ) # MAE version
-}
-```
-
----
-
-## Run the experiment
-
-* I'm using `purrr` functions to do this without loops, 'cause it's prettier
-
-
-```r
-library(purrr)
-all_model_funs &lt;- list(mod1 = mod1, mod2 = mod2, mod3 = mod3, mod4 = mod4)
-all_fits &lt;- map(all_model_funs, ~ do.call(.x, list(dataset = mob)))
-
-# unfortunately, does different splits for each method, so we use 10, 
-# it would be better to use the _SAME_ splits
-ten_fold_cv &lt;- map_dbl(all_model_funs, ~ kfold_cv(mob, .x, predictor, error_fun, 10)) 
-
-in_sample_cv &lt;- c(
-  mod1 = min(all_fits[[1]]$cvm),
-  mod2 = min(all_fits[[2]]$cvm),
-  mod3 = loo_cv(mob),
-  mod4 = min(all_fits[[4]]$cvm)
-)
-
-tib &lt;- bind_rows(in_sample_cv, ten_fold_cv)
-tib$method = c("in_sample", "out_of_sample")
-kableExtra::kable(tib, booktabs = TRUE)
-```
-
-&lt;table&gt;
- &lt;thead&gt;
-  &lt;tr&gt;
-   &lt;th style="text-align:right;"&gt; mod1 &lt;/th&gt;
-   &lt;th style="text-align:right;"&gt; mod2 &lt;/th&gt;
-   &lt;th style="text-align:right;"&gt; mod3 &lt;/th&gt;
-   &lt;th style="text-align:right;"&gt; mod4 &lt;/th&gt;
-   &lt;th style="text-align:left;"&gt; method &lt;/th&gt;
-  &lt;/tr&gt;
- &lt;/thead&gt;
-&lt;tbody&gt;
-  &lt;tr&gt;
-   &lt;td style="text-align:right;"&gt; 0.0158509 &lt;/td&gt;
-   &lt;td style="text-align:right;"&gt; 0.0160802 &lt;/td&gt;
-   &lt;td style="text-align:right;"&gt; 0.0163659 &lt;/td&gt;
-   &lt;td style="text-align:right;"&gt; 0.0155659 &lt;/td&gt;
-   &lt;td style="text-align:left;"&gt; in_sample &lt;/td&gt;
-  &lt;/tr&gt;
-  &lt;tr&gt;
-   &lt;td style="text-align:right;"&gt; 0.0157503 &lt;/td&gt;
-   &lt;td style="text-align:right;"&gt; 0.0161216 &lt;/td&gt;
-   &lt;td style="text-align:right;"&gt; 0.0165424 &lt;/td&gt;
-   &lt;td style="text-align:right;"&gt; 0.0160729 &lt;/td&gt;
-   &lt;td style="text-align:left;"&gt; out_of_sample &lt;/td&gt;
-  &lt;/tr&gt;
-&lt;/tbody&gt;
-&lt;/table&gt;
-    </textarea>
-<style data-target="print-only">@media screen {.remark-slide-container{display:block;}.remark-slide-scaler{box-shadow:none;}}</style>
-<script src="https://remarkjs.com/downloads/remark-latest.min.js"></script>
-<script src="materials/macros.js"></script>
-<script>var slideshow = remark.create({
-"highlightLines": true,
-"countIncrementalSlides": false,
-"ratio": "16:9"
-});
-if (window.HTMLWidgets) slideshow.on('afterShowSlide', function (slide) {
-  window.dispatchEvent(new Event('resize'));
-});
-(function(d) {
-  var s = d.createElement("style"), r = d.querySelector(".remark-slide-scaler");
-  if (!r) return;
-  s.type = "text/css"; s.innerHTML = "@page {size: " + r.style.width + " " + r.style.height +"; }";
-  d.head.appendChild(s);
-})(document);
-
-(function(d) {
-  var el = d.getElementsByClassName("remark-slides-area");
-  if (!el) return;
-  var slide, slides = slideshow.getSlides(), els = el[0].children;
-  for (var i = 1; i < slides.length; i++) {
-    slide = slides[i];
-    if (slide.properties.continued === "true" || slide.properties.count === "false") {
-      els[i - 1].className += ' has-continuation';
-    }
-  }
-  var s = d.createElement("style");
-  s.type = "text/css"; s.innerHTML = "@media print { .has-continuation { display: none; } }";
-  d.head.appendChild(s);
-})(document);
-// delete the temporary CSS (for displaying all slides initially) when the user
-// starts to view slides
-(function() {
-  var deleted = false;
-  slideshow.on('beforeShowSlide', function(slide) {
-    if (deleted) return;
-    var sheets = document.styleSheets, node;
-    for (var i = 0; i < sheets.length; i++) {
-      node = sheets[i].ownerNode;
-      if (node.dataset["target"] !== "print-only") continue;
-      node.parentNode.removeChild(node);
-    }
-    deleted = true;
-  });
-})();
-// add `data-at-shortcutkeys` attribute to <body> to resolve conflicts with JAWS
-// screen reader (see PR #262)
-(function(d) {
-  let res = {};
-  d.querySelectorAll('.remark-help-content table tr').forEach(tr => {
-    const t = tr.querySelector('td:nth-child(2)').innerText;
-    tr.querySelectorAll('td:first-child .key').forEach(key => {
-      const k = key.innerText;
-      if (/^[a-z]$/.test(k)) res[k] = t;  // must be a single letter (key)
-    });
-  });
-  d.body.setAttribute('data-at-shortcutkeys', JSON.stringify(res));
-})(document);
-(function() {
-  "use strict"
-  // Replace <script> tags in slides area to make them executable
-  var scripts = document.querySelectorAll(
-    '.remark-slides-area .remark-slide-container script'
-  );
-  if (!scripts.length) return;
-  for (var i = 0; i < scripts.length; i++) {
-    var s = document.createElement('script');
-    var code = document.createTextNode(scripts[i].textContent);
-    s.appendChild(code);
-    var scriptAttrs = scripts[i].attributes;
-    for (var j = 0; j < scriptAttrs.length; j++) {
-      s.setAttribute(scriptAttrs[j].name, scriptAttrs[j].value);
-    }
-    scripts[i].parentElement.replaceChild(s, scripts[i]);
-  }
-})();
-(function() {
-  var links = document.getElementsByTagName('a');
-  for (var i = 0; i < links.length; i++) {
-    if (/^(https?:)?\/\//.test(links[i].getAttribute('href'))) {
-      links[i].target = '_blank';
-    }
-  }
-})();
-// adds .remark-code-has-line-highlighted class to <pre> parent elements
-// of code chunks containing highlighted lines with class .remark-code-line-highlighted
-(function(d) {
-  const hlines = d.querySelectorAll('.remark-code-line-highlighted');
-  const preParents = [];
-  const findPreParent = function(line, p = 0) {
-    if (p > 1) return null; // traverse up no further than grandparent
-    const el = line.parentElement;
-    return el.tagName === "PRE" ? el : findPreParent(el, ++p);
-  };
-
-  for (let line of hlines) {
-    let pre = findPreParent(line);
-    if (pre && !preParents.includes(pre)) preParents.push(pre);
-  }
-  preParents.forEach(p => p.classList.add("remark-code-has-line-highlighted"));
-})(document);</script>
-
-<script>
-slideshow._releaseMath = function(el) {
-  var i, text, code, codes = el.getElementsByTagName('code');
-  for (i = 0; i < codes.length;) {
-    code = codes[i];
-    if (code.parentNode.tagName !== 'PRE' && code.childElementCount === 0) {
-      text = code.textContent;
-      if (/^\\\((.|\s)+\\\)$/.test(text) || /^\\\[(.|\s)+\\\]$/.test(text) ||
-          /^\$\$(.|\s)+\$\$$/.test(text) ||
-          /^\\begin\{([^}]+)\}(.|\s)+\\end\{[^}]+\}$/.test(text)) {
-        code.outerHTML = code.innerHTML;  // remove <code></code>
-        continue;
-      }
-    }
-    i++;
-  }
-};
-slideshow._releaseMath(document);
-</script>
-<!-- dynamically load mathjax for compatibility with self-contained -->
-<script>
-(function () {
-  var script = document.createElement('script');
-  script.type = 'text/javascript';
-  script.src  = 'https://mathjax.rstudio.com/latest/MathJax.js?config=TeX-MML-AM_CHTML';
-  if (location.protocol !== 'file:' && /^https?:/.test(script.src))
-    script.src  = script.src.replace(/^https?:/, '');
-  document.getElementsByTagName('head')[0].appendChild(script);
-})();
-</script>
-  </body>
-</html>
diff --git a/schedule/slides/00-cv-for-many-models.Rmd b/schedule/slides/00-cv-for-many-models.qmd
similarity index 51%
rename from schedule/slides/00-cv-for-many-models.Rmd
rename to schedule/slides/00-cv-for-many-models.qmd
index f5ab349..fc844c2 100644
--- a/schedule/slides/00-cv-for-many-models.Rmd
+++ b/schedule/slides/00-cv-for-many-models.qmd
@@ -1,26 +1,17 @@
 ---
-title: "00 CV for many models"
-author: 
-  - "STAT 406"
-  - "Daniel J. McDonald"
-date: 'Last modified - `r Sys.Date()`'
+lecture: "00 CV for many models"
+format: revealjs
+metadata-files: 
+  - _metadata.yml
 ---
 
-
-```{r setup, include=FALSE}
-source("rmd_config.R")
-library(magrittr)
-```
-
-```{r css-extras, file="css-extras.R", echo=FALSE}
-```
-
+{{< include _titleslide.qmd >}}
 
 
 ## Some data and 4 models
 
 ```{r}
-data(mobility, package = "Stat406")
+data("mobility", package = "Stat406")
 ```
 
 **Model 1:** Lasso on all predictors, use CV min
@@ -31,15 +22,15 @@ data(mobility, package = "Stat406")
 
 **Model 4:** (1) Lasso on all predictors, then (2) OLS on those chosen at CV min
 
-.emphasis[
-How do I decide between these 4 models?
-]
 
---
+> How do I decide between these 4 models?
+
+
+## CV functions
 
 ```{r stuff-i-need}
 kfold_cv <- function(data, estimator, predictor, error_fun, kfolds = 5) {
-  fold_labels <- sample(rep(seq(kfolds), length.out = nrow(data)))
+  fold_labels <- sample(rep(seq_len(kfolds), length.out = nrow(data)))
   errors <- double(kfolds)
   for (fold in seq_len(kfolds)) {
     test_rows <- fold_labels == fold
@@ -51,50 +42,44 @@ kfold_cv <- function(data, estimator, predictor, error_fun, kfolds = 5) {
   }
   mean(errors)
 }
+
+loo_cv <- function(dat) {
+  mdl <- lm(Mobility ~ ., data = dat)
+  mean( abs(residuals(mdl)) / abs(1 - hatvalues(mdl)) ) # MAE version
+}
 ```
 
----
 
 ## Experiment setup
 
 ```{r}
 # prepare our data
 # note that mob has only continuous predictors, otherwise could be trouble
-mob <- mobility[complete.cases(mobility), ] %>% select(-ID, -State, -Name)
+mob <- mobility[complete.cases(mobility), ] |> select(-ID, -State, -Name)
 # avoid doing this same operation a bunch
-xmat <- function(dataset) as.matrix(select(dataset, !Mobility))
+xmat <- function(dat) dat |> select(!Mobility) |> as.matrix()
 
 # set up our model functions
 library(glmnet)
-mod1 <- function(dataset, ...) cv.glmnet(xmat(dataset), dataset$Mobility, type.measure = "mae", ...)
-mod2 <- function(dataset, ...) cv.glmnet(xmat(dataset), dataset$Mobility, alpha = 0, type.measure = "mae", ...)
-mod3 <- function(dataset, ...) glmnet(xmat(dataset), dataset$Mobility, lambda = 0, ...) # just does lm()
-mod4 <- function(dataset, ...) cv.glmnet(xmat(dataset), dataset$Mobility, relax = TRUE, gamma = 1, 
-                                         type.measure = "mae", ...)
+mod1 <- function(dat, ...) cv.glmnet(xmat(dat), dat$Mobility, type.measure = "mae", ...)
+mod2 <- function(dat, ...) cv.glmnet(xmat(dat), dat$Mobility, alpha = 0, type.measure = "mae", ...)
+mod3 <- function(dat, ...) glmnet(xmat(dat), dat$Mobility, lambda = 0, ...) # just does lm()
+mod4 <- function(dat, ...) cv.glmnet(xmat(dat), dat$Mobility, relax = TRUE, gamma = 1, type.measure = "mae", ...)
 
 # this will still "work" on mod3, because there's only 1 s
-predictor <- function(modle, dataset) drop(predict(modle, newx = xmat(dataset), s = "lambda.min"))
+predictor <- function(mod, dat) drop(predict(mod, newx = xmat(dat), s = "lambda.min"))
 
 # chose mean absolute error just 'cause
 error_fun <- function(testdata) mean(abs(testdata$Mobility - testdata$.preds))
-
-# not necessarily useful for choosing in this context, but good for illustration
-loo_cv <- function(dataset) {
-  mdl <- lm(Mobility ~ ., data = dataset)
-  mean( abs(residuals(mdl)) / abs(1 - hatvalues(mdl)) ) # MAE version
-}
 ```
 
----
 
 ## Run the experiment
 
-* I'm using `purrr` functions to do this without loops, 'cause it's prettier
 
 ```{r}
-library(purrr)
-all_model_funs <- list(mod1 = mod1, mod2 = mod2, mod3 = mod3, mod4 = mod4)
-all_fits <- map(all_model_funs, ~ do.call(.x, list(dataset = mob)))
+all_model_funs <- lst(mod1, mod2, mod3, mod4)
+all_fits <- map(all_model_funs, .f = exec, dat = mob)
 
 # unfortunately, does different splits for each method, so we use 10, 
 # it would be better to use the _SAME_ splits
@@ -109,5 +94,5 @@ in_sample_cv <- c(
 
 tib <- bind_rows(in_sample_cv, ten_fold_cv)
 tib$method = c("in_sample", "out_of_sample")
-kableExtra::kable(tib, booktabs = TRUE)
-```
\ No newline at end of file
+tib
+```