Significantly slower running node-llama-cpp compared to llama.cpp on M1 Max #397

lzimm · 2024-12-10T20:29:20Z

lzimm
Dec 10, 2024

If I try to run a 4bit quantized llama3.3 70b (https://huggingface.co/bartowski/Llama-3.3-70B-Instruct-GGUF/resolve/main/Llama-3.3-70B-Instruct-Q4_K_M.gguf), it seems to run MUCH slower through node-llama-cpp than it does through llama.cpp directly.

If you try:

npx node-llama-cpp chat Llama-3.3-70B-Instruct-Q4_K_M.gguf

Compared to:

./llama-cli -m Llama-3.3-70B-Instruct-Q4_K_M.gguf

The token generating speed doesn't necessarily seem that far off between the two, but the node version seems to lag my system significantly (with noticeable delay in finder, etc.).

Does anyone know why that is?

giladgd · 2024-12-11T00:22:49Z

giladgd
Dec 11, 2024
Maintainer

Can you please run npx -y node-llama-cpp inspect gpu and share the output here?
Also, run npx -y node-llama-cpp inspect estimate <model path> as well.
It'll help me find out what may be the cause of this.

0 replies

lzimm · 2024-12-11T00:48:59Z

lzimm
Dec 11, 2024
Author

Thanks @giladgd!

npx -y node-llama-cpp inspect gpu
OS: macOS 24.1.0 (arm64)
Node: 20.11.0 (arm64)
TypeScript: 5.5.4
node-llama-cpp: 3.3.1

Metal: available

Metal device: Apple M1 Max
Metal used VRAM: 0% (64KB/48GB)
Metal free VRAM: 99.99% (48GB/48GB)
Metal unified memory: 48GB (100%)

CPU model: Apple M1 Max
Math cores: 8
Used RAM: 56.06% (35.88GB/64GB)
Free RAM: 43.93% (28.12GB/64GB)
Used swap: 84.44% (6.76GB/8GB)
Max swap size: dynamic

npx -y node-llama-cpp inspect estimate Llama-3.3-70B-Instruct-Q4_K_M.gguf
File: ~/Llama-3.3-70B-Instruct-Q4_K_M.gguf
GPU info               Type: Metal   VRAM: 48GB   Name: Apple M1 Max 
Model info             Type: llama 70B MOSTLY_Q4_K_M   Size: 39.59GB   Train context size: 131K 

Resolved config        100% compatibility   Context size: 17K   GPU layers: 81/81 (100%) 
                       VRAM usage: 47GB   RAM usage: 0B 
With flash attention   100% compatibility   Context size: 23K   GPU layers: 81/81 (100%) 
                       VRAM usage: 47GB   RAM usage: 0B   Flash attention: enabled

2 replies

giladgd Dec 11, 2024
Maintainer

Try running with a smaller context size and see whether it runs better on your machine:

npx node-llama-cpp chat Llama-3.3-70B-Instruct-Q4_K_M.gguf --contextSize 10000

Also, try running with fewer threads:

npx node-llama-cpp chat Llama-3.3-70B-Instruct-Q4_K_M.gguf --threads 4

Please let me know whether any of these helped you.

It would also help me investigate this issue if you can run this command and share its output:

npx -y node-llama-cpp inspect measure Llama-3.3-70B-Instruct-Q4_K_M.gguf

lzimm Dec 11, 2024
Author

Ahhh! Thanks so much @giladgd! The context size change fixed it :)

I should have noticed that llama.cpp has a default context length of 4096, but even with 10000 it's already feeling much better. Thanks again :)

Here's the output requested as well:

npx -y node-llama-cpp inspect measure Llama-3.3-70B-Instruct-Q4_K_M.gguf
File: Llama-3.3-70B-Instruct-Q4_K_M.gguf
GPU: Metal (last build)

  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
* | Model   | 81     |              | 39.59GB              | 40.4GB     | -821.98MB  (-1.99%) |                        |              |                     | 84.16% (40.4GB/48GB)      
  | Context | 81     | 14716        | 39.59GB              | 40.4GB     | -821.98MB  (-1.99%) | 6.6GB                  | 6.39GB       | 224.17MB   (03.43%) | 97.46% (46.78GB/48GB)     
  | Context | 81     | 4096         | 39.59GB              | 40.4GB     | -821.98MB  (-1.99%) | 2.03GB                 | 1.83GB       | 201.84MB   (10.78%) | 87.97% (42.23GB/48GB)     
  | Context | 81     | 2048         | 39.59GB              | 40.4GB     | -821.98MB  (-1.99%) | 1.14GB                 | 984.02MB     | 186.81MB   (18.98%) | 86.16% (41.36GB/48GB)     
  | Context | 81     | 1024         | 39.59GB              | 40.4GB     | -821.98MB  (-1.99%) | 718.81MB               | 610.5MB      | 108.31MB   (17.74%) | 85.40% (40.99GB/48GB)     
  | Context | 81     | 512          | 39.59GB              | 40.4GB     | -821.98MB  (-1.99%) | 492.8MB                | 458.5MB      | 34.3MB     (07.48%) | 85.09% (40.84GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 80     |              | 39.59GB              | 38.97GB    | 638.2MB    (01.60%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 80     | 18023        | 39.59GB              | 38.97GB    | 638.2MB    (01.60%) | 8.03GB                 | 7.84GB       | 195.26MB   (02.43%) | 97.52% (46.81GB/48GB)     
  | Context | 80     | 4096         | 39.59GB              | 38.97GB    | 638.2MB    (01.60%) | 2.03GB                 | 1.85GB       | 178.84MB   (09.43%) | 85.04% (40.82GB/48GB)     
  | Context | 80     | 2048         | 39.59GB              | 38.97GB    | 638.2MB    (01.60%) | 1.14GB                 | 996.02MB     | 174.8MB    (17.55%) | 83.21% (39.94GB/48GB)     
  | Context | 80     | 1024         | 39.59GB              | 38.97GB    | 638.2MB    (01.60%) | 718.8MB                | 546.02MB     | 172.79MB   (31.65%) | 82.30% (39.5GB/48GB)      
  | Context | 80     | 512          | 39.59GB              | 38.97GB    | 638.2MB    (01.60%) | 492.8MB                | 353.02MB     | 139.78MB   (39.60%) | 81.91% (39.31GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 79     |              | 39.09GB              | 38.97GB    | 119.33MB   (00.30%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 79     | 18184        | 39.09GB              | 38.97GB    | 119.33MB   (00.30%) | 8.03GB                 | 7.84GB       | 196.11MB   (02.44%) | 97.52% (46.81GB/48GB)     
  | Context | 79     | 4096         | 39.09GB              | 38.97GB    | 119.33MB   (00.30%) | 2.01GB                 | 1.84GB       | 178.83MB   (09.51%) | 85.01% (40.81GB/48GB)     
  | Context | 79     | 2048         | 39.09GB              | 38.97GB    | 119.33MB   (00.30%) | 1.14GB                 | 988.02MB     | 174.8MB    (17.69%) | 83.20% (39.93GB/48GB)     
  | Context | 79     | 1024         | 39.09GB              | 38.97GB    | 119.33MB   (00.30%) | 714.8MB                | 542.02MB     | 172.79MB   (31.88%) | 82.29% (39.5GB/48GB)      
  | Context | 79     | 512          | 39.09GB              | 38.97GB    | 119.33MB   (00.30%) | 490.79MB               | 351.02MB     | 139.78MB   (39.82%) | 81.90% (39.31GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 78     |              | 38.58GB              | 38.97GB    | -399.55MB  (-1.00%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 78     | 18348        | 38.58GB              | 38.97GB    | -399.55MB  (-1.00%) | 8.03GB                 | 7.84GB       | 198.25MB   (02.47%) | 97.51% (46.81GB/48GB)     
  | Context | 78     | 4096         | 38.58GB              | 38.97GB    | -399.55MB  (-1.00%) | 1.99GB                 | 1.82GB       | 178.83MB   (09.59%) | 84.98% (40.79GB/48GB)     
  | Context | 78     | 2048         | 38.58GB              | 38.97GB    | -399.55MB  (-1.00%) | 1.13GB                 | 980.02MB     | 174.8MB    (17.84%) | 83.18% (39.93GB/48GB)     
  | Context | 78     | 1024         | 38.58GB              | 38.97GB    | -399.55MB  (-1.00%) | 710.8MB                | 538.02MB     | 172.78MB   (32.11%) | 82.28% (39.5GB/48GB)      
  | Context | 78     | 512          | 38.58GB              | 38.97GB    | -399.55MB  (-1.00%) | 488.79MB               | 349.02MB     | 139.78MB   (40.05%) | 81.90% (39.31GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 77     |              | 38.07GB              | 38.97GB    | -918.42MB  (-2.30%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 77     | 18514        | 38.07GB              | 38.97GB    | -918.42MB  (-2.30%) | 8.03GB                 | 7.83GB       | 201.22MB   (02.51%) | 97.51% (46.8GB/48GB)      
  | Context | 77     | 4096         | 38.07GB              | 38.97GB    | -918.42MB  (-2.30%) | 1.98GB                 | 1.8GB        | 178.83MB   (09.68%) | 84.95% (40.77GB/48GB)     
  | Context | 77     | 2048         | 38.07GB              | 38.97GB    | -918.42MB  (-2.30%) | 1.12GB                 | 972.02MB     | 174.8MB    (17.98%) | 83.17% (39.92GB/48GB)     
  | Context | 77     | 1024         | 38.07GB              | 38.97GB    | -918.42MB  (-2.30%) | 706.8MB                | 534.02MB     | 172.78MB   (32.35%) | 82.27% (39.49GB/48GB)     
  | Context | 77     | 512          | 38.07GB              | 38.97GB    | -918.42MB  (-2.30%) | 486.79MB               | 347.02MB     | 139.77MB   (40.28%) | 81.89% (39.31GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 76     |              | 37.57GB              | 38.97GB    | -1.4GB     (-3.60%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 76     | 18684        | 37.57GB              | 38.97GB    | -1.4GB     (-3.60%) | 8.03GB                 | 7.83GB       | 205.84MB   (02.57%) | 97.50% (46.8GB/48GB)      
  | Context | 76     | 4096         | 37.57GB              | 38.97GB    | -1.4GB     (-3.60%) | 1.96GB                 | 1.79GB       | 178.82MB   (09.76%) | 84.91% (40.76GB/48GB)     
  | Context | 76     | 2048         | 37.57GB              | 38.97GB    | -1.4GB     (-3.60%) | 1.11GB                 | 964.02MB     | 174.79MB   (18.13%) | 83.15% (39.91GB/48GB)     
  | Context | 76     | 1024         | 37.57GB              | 38.97GB    | -1.4GB     (-3.60%) | 702.79MB               | 530.02MB     | 172.78MB   (32.60%) | 82.27% (39.49GB/48GB)     
  | Context | 76     | 512          | 37.57GB              | 38.97GB    | -1.4GB     (-3.60%) | 484.79MB               | 345.02MB     | 139.77MB   (40.51%) | 81.89% (39.31GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 75     |              | 37.06GB              | 38.97GB    | -1.91GB    (-4.90%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 75     | 18857        | 37.06GB              | 38.97GB    | -1.91GB    (-4.90%) | 8.03GB                 | 7.84GB       | 198.22MB   (02.47%) | 97.51% (46.81GB/48GB)     
  | Context | 75     | 4096         | 37.06GB              | 38.97GB    | -1.91GB    (-4.90%) | 1.95GB                 | 1.77GB       | 178.82MB   (09.85%) | 84.88% (40.74GB/48GB)     
  | Context | 75     | 2048         | 37.06GB              | 38.97GB    | -1.91GB    (-4.90%) | 1.1GB                  | 956.02MB     | 174.79MB   (18.28%) | 83.13% (39.9GB/48GB)      
  | Context | 75     | 1024         | 37.06GB              | 38.97GB    | -1.91GB    (-4.90%) | 698.79MB               | 526.02MB     | 172.78MB   (32.85%) | 82.26% (39.48GB/48GB)     
  | Context | 75     | 512          | 37.06GB              | 38.97GB    | -1.91GB    (-4.90%) | 482.78MB               | 343.02MB     | 139.77MB   (40.75%) | 81.89% (39.3GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 74     |              | 36.55GB              | 38.97GB    | -2.42GB    (-6.20%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 74     | 19034        | 36.55GB              | 38.97GB    | -2.42GB    (-6.20%) | 8.03GB                 | 7.83GB       | 205.73MB   (02.57%) | 97.50% (46.8GB/48GB)      
  | Context | 74     | 4096         | 36.55GB              | 38.97GB    | -2.42GB    (-6.20%) | 1.93GB                 | 1.76GB       | 178.82MB   (09.93%) | 84.85% (40.73GB/48GB)     
  | Context | 74     | 2048         | 36.55GB              | 38.97GB    | -2.42GB    (-6.20%) | 1.1GB                  | 948.02MB     | 174.79MB   (18.44%) | 83.12% (39.9GB/48GB)      
  | Context | 74     | 1024         | 36.55GB              | 38.97GB    | -2.42GB    (-6.20%) | 694.79MB               | 522.02MB     | 172.77MB   (33.10%) | 82.25% (39.48GB/48GB)     
  | Context | 74     | 512          | 36.55GB              | 38.97GB    | -2.42GB    (-6.20%) | 480.78MB               | 341.02MB     | 139.76MB   (40.98%) | 81.88% (39.3GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 73     |              | 36.05GB              | 38.97GB    | -2.92GB    (-7.50%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 73     | 19213        | 36.05GB              | 38.97GB    | -2.92GB    (-7.50%) | 8.03GB                 | 7.83GB       | 200.74MB   (02.50%) | 97.51% (46.8GB/48GB)      
  | Context | 73     | 4096         | 36.05GB              | 38.97GB    | -2.92GB    (-7.50%) | 1.92GB                 | 1.74GB       | 178.82MB   (10.02%) | 84.82% (40.71GB/48GB)     
  | Context | 73     | 2048         | 36.05GB              | 38.97GB    | -2.92GB    (-7.50%) | 1.09GB                 | 940.02MB     | 174.79MB   (18.59%) | 83.10% (39.89GB/48GB)     
  | Context | 73     | 1024         | 36.05GB              | 38.97GB    | -2.92GB    (-7.50%) | 690.79MB               | 518.02MB     | 172.77MB   (33.35%) | 82.24% (39.48GB/48GB)     
  | Context | 73     | 512          | 36.05GB              | 38.97GB    | -2.92GB    (-7.50%) | 478.78MB               | 339.02MB     | 139.76MB   (41.23%) | 81.88% (39.3GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 72     |              | 35.54GB              | 38.97GB    | -3.43GB    (-8.80%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 72     | 19396        | 35.54GB              | 38.97GB    | -3.43GB    (-8.80%) | 8.03GB                 | 7.84GB       | 197.5MB    (02.46%) | 97.51% (46.81GB/48GB)     
  | Context | 72     | 4096         | 35.54GB              | 38.97GB    | -3.43GB    (-8.80%) | 1.9GB                  | 1.73GB       | 178.81MB   (10.11%) | 84.78% (40.7GB/48GB)      
  | Context | 72     | 2048         | 35.54GB              | 38.97GB    | -3.43GB    (-8.80%) | 1.08GB                 | 932.02MB     | 174.78MB   (18.75%) | 83.08% (39.88GB/48GB)     
  | Context | 72     | 1024         | 35.54GB              | 38.97GB    | -3.43GB    (-8.80%) | 686.78MB               | 514.02MB     | 172.77MB   (33.61%) | 82.23% (39.47GB/48GB)     
  | Context | 72     | 512          | 35.54GB              | 38.97GB    | -3.43GB    (-8.80%) | 476.77MB               | 337.02MB     | 139.76MB   (41.47%) | 81.87% (39.3GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 71     |              | 35.03GB              | 38.97GB    | -3.94GB   (-10.10%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 71     | 19583        | 35.03GB              | 38.97GB    | -3.94GB   (-10.10%) | 8.03GB                 | 7.83GB       | 208.89MB   (02.61%) | 97.49% (46.8GB/48GB)      
  | Context | 71     | 4096         | 35.03GB              | 38.97GB    | -3.94GB   (-10.10%) | 1.89GB                 | 1.71GB       | 178.81MB   (10.21%) | 84.75% (40.68GB/48GB)     
  | Context | 71     | 2048         | 35.03GB              | 38.97GB    | -3.94GB   (-10.10%) | 1.07GB                 | 924.02MB     | 174.78MB   (18.92%) | 83.07% (39.87GB/48GB)     
  | Context | 71     | 1024         | 35.03GB              | 38.97GB    | -3.94GB   (-10.10%) | 682.78MB               | 510.02MB     | 172.76MB   (33.87%) | 82.23% (39.47GB/48GB)     
  | Context | 71     | 512          | 35.03GB              | 38.97GB    | -3.94GB   (-10.10%) | 474.77MB               | 335.02MB     | 139.76MB   (41.72%) | 81.87% (39.3GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 70     |              | 34.53GB              | 38.97GB    | -4.44GB   (-11.40%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 70     | 19773        | 34.53GB              | 38.97GB    | -4.44GB   (-11.40%) | 8.03GB                 | 7.83GB       | 208.47MB   (02.60%) | 97.49% (46.8GB/48GB)      
  | Context | 70     | 4096         | 34.53GB              | 38.97GB    | -4.44GB   (-11.40%) | 1.87GB                 | 1.7GB        | 178.81MB   (10.30%) | 84.72% (40.67GB/48GB)     
  | Context | 70     | 2048         | 34.53GB              | 38.97GB    | -4.44GB   (-11.40%) | 1.07GB                 | 916.02MB     | 174.78MB   (19.08%) | 83.05% (39.86GB/48GB)     
  | Context | 70     | 1024         | 34.53GB              | 38.97GB    | -4.44GB   (-11.40%) | 678.78MB               | 506.02MB     | 172.76MB   (34.14%) | 82.22% (39.46GB/48GB)     
  | Context | 70     | 512          | 34.53GB              | 38.97GB    | -4.44GB   (-11.40%) | 472.77MB               | 333.02MB     | 139.75MB   (41.97%) | 81.87% (39.3GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 69     |              | 34.08GB              | 38.97GB    | -4.89GB   (-12.56%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 69     | 19967        | 34.08GB              | 38.97GB    | -4.89GB   (-12.56%) | 8.03GB                 | 7.83GB       | 209.65MB   (02.62%) | 97.49% (46.8GB/48GB)      
  | Context | 69     | 4096         | 34.08GB              | 38.97GB    | -4.89GB   (-12.56%) | 1.85GB                 | 1.68GB       | 178.81MB   (10.40%) | 84.69% (40.65GB/48GB)     
  | Context | 69     | 2048         | 34.08GB              | 38.97GB    | -4.89GB   (-12.56%) | 1.06GB                 | 908.02MB     | 174.77MB   (19.25%) | 83.03% (39.86GB/48GB)     
  | Context | 69     | 1024         | 34.08GB              | 38.97GB    | -4.89GB   (-12.56%) | 674.77MB               | 502.02MB     | 172.76MB   (34.41%) | 82.21% (39.46GB/48GB)     
  | Context | 69     | 512          | 34.08GB              | 38.97GB    | -4.89GB   (-12.56%) | 470.77MB               | 331.02MB     | 139.75MB   (42.22%) | 81.86% (39.29GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 68     |              | 33.63GB              | 38.97GB    | -5.34GB   (-13.71%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 68     | 20164        | 33.63GB              | 38.97GB    | -5.34GB   (-13.71%) | 8.03GB                 | 7.83GB       | 199.44MB   (02.49%) | 97.51% (46.8GB/48GB)      
  | Context | 68     | 4096         | 33.63GB              | 38.97GB    | -5.34GB   (-13.71%) | 1.84GB                 | 1.66GB       | 178.8MB    (10.49%) | 84.65% (40.63GB/48GB)     
  | Context | 68     | 2048         | 33.63GB              | 38.97GB    | -5.34GB   (-13.71%) | 1.05GB                 | 900.02MB     | 174.77MB   (19.42%) | 83.02% (39.85GB/48GB)     
  | Context | 68     | 1024         | 33.63GB              | 38.97GB    | -5.34GB   (-13.71%) | 670.77MB               | 498.02MB     | 172.76MB   (34.69%) | 82.20% (39.46GB/48GB)     
  | Context | 68     | 512          | 33.63GB              | 38.97GB    | -5.34GB   (-13.71%) | 468.76MB               | 329.02MB     | 139.75MB   (42.47%) | 81.86% (39.29GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 67     |              | 33.12GB              | 38.97GB    | -5.85GB   (-15.01%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 67     | 20366        | 33.12GB              | 38.97GB    | -5.85GB   (-15.01%) | 8.03GB                 | 7.83GB       | 203.83MB   (02.54%) | 97.50% (46.8GB/48GB)      
  | Context | 67     | 4096         | 33.12GB              | 38.97GB    | -5.85GB   (-15.01%) | 1.82GB                 | 1.65GB       | 178.8MB    (10.59%) | 84.62% (40.62GB/48GB)     
  | Context | 67     | 2048         | 33.12GB              | 38.97GB    | -5.85GB   (-15.01%) | 1.04GB                 | 892.02MB     | 174.77MB   (19.59%) | 83.00% (39.84GB/48GB)     
  | Context | 67     | 1024         | 33.12GB              | 38.97GB    | -5.85GB   (-15.01%) | 666.77MB               | 494.02MB     | 172.75MB   (34.97%) | 82.19% (39.45GB/48GB)     
  | Context | 67     | 512          | 33.12GB              | 38.97GB    | -5.85GB   (-15.01%) | 466.76MB               | 327.02MB     | 139.74MB   (42.73%) | 81.85% (39.29GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 66     |              | 32.67GB              | 38.97GB    | -6.3GB    (-16.16%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 66     | 20572        | 32.67GB              | 38.97GB    | -6.3GB    (-16.16%) | 8.03GB                 | 7.83GB       | 209.69MB   (02.62%) | 97.49% (46.8GB/48GB)      
  | Context | 66     | 4096         | 32.67GB              | 38.97GB    | -6.3GB    (-16.16%) | 1.81GB                 | 1.63GB       | 178.8MB    (10.69%) | 84.59% (40.6GB/48GB)      
  | Context | 66     | 2048         | 32.67GB              | 38.97GB    | -6.3GB    (-16.16%) | 1.03GB                 | 884.02MB     | 174.77MB   (19.77%) | 82.99% (39.83GB/48GB)     
  | Context | 66     | 1024         | 32.67GB              | 38.97GB    | -6.3GB    (-16.16%) | 662.77MB               | 490.02MB     | 172.75MB   (35.25%) | 82.18% (39.45GB/48GB)     
  | Context | 66     | 512          | 32.67GB              | 38.97GB    | -6.3GB    (-16.16%) | 464.76MB               | 325.02MB     | 139.74MB   (43.00%) | 81.85% (39.29GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 65     |              | 32.22GB              | 38.97GB    | -6.75GB   (-17.32%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 65     | 20782        | 32.22GB              | 38.97GB    | -6.75GB   (-17.32%) | 8.03GB                 | 7.83GB       | 204.78MB   (02.55%) | 97.50% (46.8GB/48GB)      
  | Context | 65     | 4096         | 32.22GB              | 38.97GB    | -6.75GB   (-17.32%) | 1.79GB                 | 1.62GB       | 178.79MB   (10.80%) | 84.56% (40.59GB/48GB)     
  | Context | 65     | 2048         | 32.22GB              | 38.97GB    | -6.75GB   (-17.32%) | 1.03GB                 | 876.02MB     | 174.76MB   (19.95%) | 82.97% (39.83GB/48GB)     
  | Context | 65     | 1024         | 32.22GB              | 38.97GB    | -6.75GB   (-17.32%) | 658.76MB               | 486.02MB     | 172.75MB   (35.54%) | 82.18% (39.44GB/48GB)     
  | Context | 65     | 512          | 32.22GB              | 38.97GB    | -6.75GB   (-17.32%) | 462.75MB               | 323.02MB     | 139.74MB   (43.26%) | 81.84% (39.29GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 64     |              | 31.72GB              | 38.97GB    | -7.25GB   (-18.62%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 64     | 20996        | 31.72GB              | 38.97GB    | -7.25GB   (-18.62%) | 8.03GB                 | 7.83GB       | 201.5MB    (02.51%) | 97.51% (46.8GB/48GB)      
  | Context | 64     | 4096         | 31.72GB              | 38.97GB    | -7.25GB   (-18.62%) | 1.78GB                 | 1.6GB        | 178.79MB   (10.90%) | 84.52% (40.57GB/48GB)     
  | Context | 64     | 2048         | 31.72GB              | 38.97GB    | -7.25GB   (-18.62%) | 1.02GB                 | 868.02MB     | 174.76MB   (20.13%) | 82.95% (39.82GB/48GB)     
  | Context | 64     | 1024         | 31.72GB              | 38.97GB    | -7.25GB   (-18.62%) | 654.76MB               | 482.02MB     | 172.74MB   (35.84%) | 82.17% (39.44GB/48GB)     
  | Context | 64     | 512          | 31.72GB              | 38.97GB    | -7.25GB   (-18.62%) | 460.75MB               | 321.02MB     | 139.74MB   (43.53%) | 81.84% (39.28GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 63     |              | 31.27GB              | 38.97GB    | -7.7GB    (-19.77%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 63     | 21215        | 31.27GB              | 38.97GB    | -7.7GB    (-19.77%) | 8.03GB                 | 7.82GB       | 212.11MB   (02.65%) | 97.49% (46.79GB/48GB)     
  | Context | 63     | 4096         | 31.27GB              | 38.97GB    | -7.7GB    (-19.77%) | 1.76GB                 | 1.59GB       | 178.79MB   (11.01%) | 84.49% (40.56GB/48GB)     
  | Context | 63     | 2048         | 31.27GB              | 38.97GB    | -7.7GB    (-19.77%) | 1.01GB                 | 860.02MB     | 174.76MB   (20.32%) | 82.94% (39.81GB/48GB)     
  | Context | 63     | 1024         | 31.27GB              | 38.97GB    | -7.7GB    (-19.77%) | 650.76MB               | 478.02MB     | 172.74MB   (36.14%) | 82.16% (39.44GB/48GB)     
  | Context | 63     | 512          | 31.27GB              | 38.97GB    | -7.7GB    (-19.77%) | 458.75MB               | 319.02MB     | 139.73MB   (43.80%) | 81.84% (39.28GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 62     |              | 30.82GB              | 38.97GB    | -8.15GB   (-20.92%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 62     | 21438        | 30.82GB              | 38.97GB    | -8.15GB   (-20.92%) | 8.03GB                 | 7.82GB       | 212.18MB   (02.65%) | 97.48% (46.79GB/48GB)     
  | Context | 62     | 4096         | 30.82GB              | 38.97GB    | -8.15GB   (-20.92%) | 1.74GB                 | 1.57GB       | 178.79MB   (11.12%) | 84.46% (40.54GB/48GB)     
  | Context | 62     | 2048         | 30.82GB              | 38.97GB    | -8.15GB   (-20.92%) | 1GB                    | 852.02MB     | 174.75MB   (20.51%) | 82.92% (39.8GB/48GB)      
  | Context | 62     | 1024         | 30.82GB              | 38.97GB    | -8.15GB   (-20.92%) | 646.75MB               | 474.02MB     | 172.74MB   (36.44%) | 82.15% (39.43GB/48GB)     
  | Context | 62     | 512          | 30.82GB              | 38.97GB    | -8.15GB   (-20.92%) | 456.75MB               | 317.02MB     | 139.73MB   (44.08%) | 81.83% (39.28GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 61     |              | 30.31GB              | 38.97GB    | -8.66GB   (-22.22%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 61     | 21666        | 30.31GB              | 38.97GB    | -8.66GB   (-22.22%) | 8.03GB                 | 7.83GB       | 202.41MB   (02.52%) | 97.50% (46.8GB/48GB)      
  | Context | 61     | 4096         | 30.31GB              | 38.97GB    | -8.66GB   (-22.22%) | 1.73GB                 | 1.55GB       | 178.78MB   (11.23%) | 84.43% (40.52GB/48GB)     
  | Context | 61     | 2048         | 30.31GB              | 38.97GB    | -8.66GB   (-22.22%) | 1018.77MB              | 844.02MB     | 174.75MB   (20.70%) | 82.90% (39.79GB/48GB)     
  | Context | 61     | 1024         | 30.31GB              | 38.97GB    | -8.66GB   (-22.22%) | 642.75MB               | 470.02MB     | 172.74MB   (36.75%) | 82.14% (39.43GB/48GB)     
  | Context | 61     | 512          | 30.31GB              | 38.97GB    | -8.66GB   (-22.22%) | 454.74MB               | 315.02MB     | 139.73MB   (44.36%) | 81.83% (39.28GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 60     |              | 29.86GB              | 38.97GB    | -9.11GB   (-23.37%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 60     | 21899        | 29.86GB              | 38.97GB    | -9.11GB   (-23.37%) | 8.03GB                 | 7.83GB       | 206.24MB   (02.57%) | 97.50% (46.8GB/48GB)      
  | Context | 60     | 4096         | 29.86GB              | 38.97GB    | -9.11GB   (-23.37%) | 1.71GB                 | 1.54GB       | 178.78MB   (11.34%) | 84.39% (40.51GB/48GB)     
  | Context | 60     | 2048         | 29.86GB              | 38.97GB    | -9.11GB   (-23.37%) | 1010.76MB              | 836.02MB     | 174.75MB   (20.90%) | 82.89% (39.79GB/48GB)     
  | Context | 60     | 1024         | 29.86GB              | 38.97GB    | -9.11GB   (-23.37%) | 638.75MB               | 466.02MB     | 172.73MB   (37.07%) | 82.14% (39.43GB/48GB)     
  | Context | 60     | 512          | 29.86GB              | 38.97GB    | -9.11GB   (-23.37%) | 452.74MB               | 313.02MB     | 139.73MB   (44.64%) | 81.82% (39.28GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 59     |              | 29.41GB              | 38.97GB    | -9.56GB   (-24.53%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 59     | 22137        | 29.41GB              | 38.97GB    | -9.56GB   (-24.53%) | 8.03GB                 | 7.82GB       | 211.79MB   (02.64%) | 97.49% (46.79GB/48GB)     
  | Context | 59     | 4096         | 29.41GB              | 38.97GB    | -9.56GB   (-24.53%) | 1.7GB                  | 1.52GB       | 178.78MB   (11.46%) | 84.36% (40.49GB/48GB)     
  | Context | 59     | 2048         | 29.41GB              | 38.97GB    | -9.56GB   (-24.53%) | 1002.76MB              | 828.02MB     | 174.75MB   (21.10%) | 82.87% (39.78GB/48GB)     
  | Context | 59     | 1024         | 29.41GB              | 38.97GB    | -9.56GB   (-24.53%) | 634.75MB               | 462.02MB     | 172.73MB   (37.39%) | 82.13% (39.42GB/48GB)     
  | Context | 59     | 512          | 29.41GB              | 38.97GB    | -9.56GB   (-24.53%) | 450.74MB               | 311.02MB     | 139.72MB   (44.92%) | 81.82% (39.27GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 58     |              | 28.9GB               | 38.97GB    | -10.06GB  (-25.83%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 58     | 22380        | 28.9GB               | 38.97GB    | -10.06GB  (-25.83%) | 8.03GB                 | 7.83GB       | 207.69MB   (02.59%) | 97.49% (46.8GB/48GB)      
  | Context | 58     | 4096         | 28.9GB               | 38.97GB    | -10.06GB  (-25.83%) | 1.68GB                 | 1.51GB       | 178.77MB   (11.58%) | 84.33% (40.48GB/48GB)     
  | Context | 58     | 2048         | 28.9GB               | 38.97GB    | -10.06GB  (-25.83%) | 994.76MB               | 820.02MB     | 174.74MB   (21.31%) | 82.86% (39.77GB/48GB)     
  | Context | 58     | 1024         | 28.9GB               | 38.97GB    | -10.06GB  (-25.83%) | 630.74MB               | 458.02MB     | 172.73MB   (37.71%) | 82.12% (39.42GB/48GB)     
  | Context | 58     | 512          | 28.9GB               | 38.97GB    | -10.06GB  (-25.83%) | 448.74MB               | 309.02MB     | 139.72MB   (45.21%) | 81.82% (39.27GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 57     |              | 28.46GB              | 38.97GB    | -10.51GB  (-26.98%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 57     | 22629        | 28.46GB              | 38.97GB    | -10.51GB  (-26.98%) | 8.03GB                 | 7.83GB       | 205.81MB   (02.57%) | 97.50% (46.8GB/48GB)      
  | Context | 57     | 4096         | 28.46GB              | 38.97GB    | -10.51GB  (-26.98%) | 1.67GB                 | 1.49GB       | 178.77MB   (11.70%) | 84.30% (40.46GB/48GB)     
  | Context | 57     | 2048         | 28.46GB              | 38.97GB    | -10.51GB  (-26.98%) | 986.76MB               | 812.02MB     | 174.74MB   (21.52%) | 82.84% (39.76GB/48GB)     
  | Context | 57     | 1024         | 28.46GB              | 38.97GB    | -10.51GB  (-26.98%) | 626.74MB               | 454.02MB     | 172.72MB   (38.04%) | 82.11% (39.41GB/48GB)     
  | Context | 57     | 512          | 28.46GB              | 38.97GB    | -10.51GB  (-26.98%) | 446.73MB               | 307.02MB     | 139.72MB   (45.51%) | 81.81% (39.27GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 56     |              | 28.01GB              | 38.97GB    | -10.96GB  (-28.13%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 56     | 22883        | 28.01GB              | 38.97GB    | -10.96GB  (-28.13%) | 8.03GB                 | 7.83GB       | 205.72MB   (02.57%) | 97.50% (46.8GB/48GB)      
  | Context | 56     | 4096         | 28.01GB              | 38.97GB    | -10.96GB  (-28.13%) | 1.65GB                 | 1.48GB       | 178.77MB   (11.82%) | 84.26% (40.45GB/48GB)     
  | Context | 56     | 2048         | 28.01GB              | 38.97GB    | -10.96GB  (-28.13%) | 978.75MB               | 804.02MB     | 174.74MB   (21.73%) | 82.82% (39.76GB/48GB)     
  | Context | 56     | 1024         | 28.01GB              | 38.97GB    | -10.96GB  (-28.13%) | 622.74MB               | 450.02MB     | 172.72MB   (38.38%) | 82.10% (39.41GB/48GB)     
  | Context | 56     | 512          | 28.01GB              | 38.97GB    | -10.96GB  (-28.13%) | 444.73MB               | 305.02MB     | 139.71MB   (45.81%) | 81.81% (39.27GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 55     |              | 27.5GB               | 38.97GB    | -11.47GB  (-29.43%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 55     | 23143        | 27.5GB               | 38.97GB    | -11.47GB  (-29.43%) | 8.03GB                 | 7.83GB       | 207.71MB   (02.59%) | 97.49% (46.8GB/48GB)      
  | Context | 55     | 4096         | 27.5GB               | 38.97GB    | -11.47GB  (-29.43%) | 1.64GB                 | 1.46GB       | 178.77MB   (11.95%) | 84.23% (40.43GB/48GB)     
  | Context | 55     | 2048         | 27.5GB               | 38.97GB    | -11.47GB  (-29.43%) | 970.75MB               | 796.02MB     | 174.73MB   (21.95%) | 82.81% (39.75GB/48GB)     
  | Context | 55     | 1024         | 27.5GB               | 38.97GB    | -11.47GB  (-29.43%) | 618.73MB               | 446.02MB     | 172.72MB   (38.72%) | 82.09% (39.41GB/48GB)     
  | Context | 55     | 512          | 27.5GB               | 38.97GB    | -11.47GB  (-29.43%) | 442.73MB               | 303.02MB     | 139.71MB   (46.11%) | 81.80% (39.27GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 54     |              | 27.05GB              | 38.97GB    | -11.92GB  (-30.59%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 54     | 23409        | 27.05GB              | 38.97GB    | -11.92GB  (-30.59%) | 8.03GB                 | 7.82GB       | 211.71MB   (02.64%) | 97.49% (46.79GB/48GB)     
  | Context | 54     | 4096         | 27.05GB              | 38.97GB    | -11.92GB  (-30.59%) | 1.62GB                 | 1.45GB       | 178.76MB   (12.08%) | 84.20% (40.42GB/48GB)     
  | Context | 54     | 2048         | 27.05GB              | 38.97GB    | -11.92GB  (-30.59%) | 962.75MB               | 788.02MB     | 174.73MB   (22.17%) | 82.79% (39.74GB/48GB)     
  | Context | 54     | 1024         | 27.05GB              | 38.97GB    | -11.92GB  (-30.59%) | 614.73MB               | 442.02MB     | 172.72MB   (39.07%) | 82.09% (39.4GB/48GB)      
  | Context | 54     | 512          | 27.05GB              | 38.97GB    | -11.92GB  (-30.59%) | 440.72MB               | 301.02MB     | 139.71MB   (46.41%) | 81.80% (39.26GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 53     |              | 26.6GB               | 38.97GB    | -12.37GB  (-31.74%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 53     | 23681        | 26.6GB               | 38.97GB    | -12.37GB  (-31.74%) | 8.03GB                 | 7.83GB       | 206.96MB   (02.58%) | 97.49% (46.8GB/48GB)      
  | Context | 53     | 4096         | 26.6GB               | 38.97GB    | -12.37GB  (-31.74%) | 1.6GB                  | 1.43GB       | 178.76MB   (12.21%) | 84.17% (40.4GB/48GB)      
  | Context | 53     | 2048         | 26.6GB               | 38.97GB    | -12.37GB  (-31.74%) | 954.74MB               | 780.02MB     | 174.73MB   (22.40%) | 82.77% (39.73GB/48GB)     
  | Context | 53     | 1024         | 26.6GB               | 38.97GB    | -12.37GB  (-31.74%) | 610.73MB               | 438.02MB     | 172.71MB   (39.43%) | 82.08% (39.4GB/48GB)      
  | Context | 53     | 512          | 26.6GB               | 38.97GB    | -12.37GB  (-31.74%) | 438.72MB               | 299.02MB     | 139.71MB   (46.72%) | 81.80% (39.26GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 52     |              | 26.09GB              | 38.97GB    | -12.88GB  (-33.04%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 52     | 23960        | 26.09GB              | 38.97GB    | -12.88GB  (-33.04%) | 8.03GB                 | 7.82GB       | 215.22MB   (02.69%) | 97.48% (46.79GB/48GB)     
  | Context | 52     | 4096         | 26.09GB              | 38.97GB    | -12.88GB  (-33.04%) | 1.59GB                 | 1.41GB       | 178.76MB   (12.34%) | 84.13% (40.38GB/48GB)     
  | Context | 52     | 2048         | 26.09GB              | 38.97GB    | -12.88GB  (-33.04%) | 946.74MB               | 772.02MB     | 174.73MB   (22.63%) | 82.76% (39.72GB/48GB)     
  | Context | 52     | 1024         | 26.09GB              | 38.97GB    | -12.88GB  (-33.04%) | 606.73MB               | 434.02MB     | 172.71MB   (39.79%) | 82.07% (39.39GB/48GB)     
  | Context | 52     | 512          | 26.09GB              | 38.97GB    | -12.88GB  (-33.04%) | 436.72MB               | 297.02MB     | 139.7MB    (47.04%) | 81.79% (39.26GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 51     |              | 25.64GB              | 38.97GB    | -13.32GB  (-34.19%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 51     | 24245        | 25.64GB              | 38.97GB    | -13.32GB  (-34.19%) | 8.03GB                 | 7.82GB       | 214.83MB   (02.68%) | 97.48% (46.79GB/48GB)     
  | Context | 51     | 4096         | 25.64GB              | 38.97GB    | -13.32GB  (-34.19%) | 1.57GB                 | 1.4GB        | 178.75MB   (12.48%) | 84.10% (40.37GB/48GB)     
  | Context | 51     | 2048         | 25.64GB              | 38.97GB    | -13.32GB  (-34.19%) | 938.74MB               | 764.02MB     | 174.72MB   (22.87%) | 82.74% (39.72GB/48GB)     
  | Context | 51     | 1024         | 25.64GB              | 38.97GB    | -13.32GB  (-34.19%) | 602.72MB               | 430.02MB     | 172.71MB   (40.16%) | 82.06% (39.39GB/48GB)     
  | Context | 51     | 512          | 25.64GB              | 38.97GB    | -13.32GB  (-34.19%) | 434.72MB               | 295.02MB     | 139.7MB    (47.35%) | 81.79% (39.26GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 50     |              | 25.2GB               | 38.97GB    | -13.77GB  (-35.35%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 50     | 24537        | 25.2GB               | 38.97GB    | -13.77GB  (-35.35%) | 8.03GB                 | 7.82GB       | 216.73MB   (02.71%) | 97.48% (46.79GB/48GB)     
  | Context | 50     | 4096         | 25.2GB               | 38.97GB    | -13.77GB  (-35.35%) | 1.56GB                 | 1.38GB       | 178.75MB   (12.62%) | 84.07% (40.35GB/48GB)     
  | Context | 50     | 2048         | 25.2GB               | 38.97GB    | -13.77GB  (-35.35%) | 930.74MB               | 756.02MB     | 174.72MB   (23.11%) | 82.73% (39.71GB/48GB)     
  | Context | 50     | 1024         | 25.2GB               | 38.97GB    | -13.77GB  (-35.35%) | 598.72MB               | 426.02MB     | 172.7MB    (40.54%) | 82.05% (39.39GB/48GB)     
  | Context | 50     | 512          | 25.2GB               | 38.97GB    | -13.77GB  (-35.35%) | 432.71MB               | 293.02MB     | 139.7MB    (47.68%) | 81.78% (39.26GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 49     |              | 24.69GB              | 38.97GB    | -14.28GB  (-36.65%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 49     | 24837        | 24.69GB              | 38.97GB    | -14.28GB  (-36.65%) | 8.03GB                 | 7.82GB       | 210.98MB   (02.63%) | 97.49% (46.79GB/48GB)     
  | Context | 49     | 4096         | 24.69GB              | 38.97GB    | -14.28GB  (-36.65%) | 1.54GB                 | 1.37GB       | 178.75MB   (12.77%) | 84.04% (40.34GB/48GB)     
  | Context | 49     | 2048         | 24.69GB              | 38.97GB    | -14.28GB  (-36.65%) | 922.73MB               | 748.02MB     | 174.72MB   (23.36%) | 82.71% (39.7GB/48GB)      
  | Context | 49     | 1024         | 24.69GB              | 38.97GB    | -14.28GB  (-36.65%) | 594.72MB               | 422.02MB     | 172.7MB    (40.92%) | 82.05% (39.38GB/48GB)     
  | Context | 49     | 512          | 24.69GB              | 38.97GB    | -14.28GB  (-36.65%) | 430.71MB               | 291.02MB     | 139.69MB   (48.00%) | 81.78% (39.25GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 48     |              | 24.24GB              | 38.97GB    | -14.73GB  (-37.80%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 48     | 25143        | 24.24GB              | 38.97GB    | -14.73GB  (-37.80%) | 8.03GB                 | 7.82GB       | 217.34MB   (02.72%) | 97.47% (46.79GB/48GB)     
  | Context | 48     | 4096         | 24.24GB              | 38.97GB    | -14.73GB  (-37.80%) | 1.53GB                 | 1.35GB       | 178.75MB   (12.92%) | 84.00% (40.32GB/48GB)     
  | Context | 48     | 2048         | 24.24GB              | 38.97GB    | -14.73GB  (-37.80%) | 914.73MB               | 740.02MB     | 174.71MB   (23.61%) | 82.69% (39.69GB/48GB)     
  | Context | 48     | 1024         | 24.24GB              | 38.97GB    | -14.73GB  (-37.80%) | 590.71MB               | 418.02MB     | 172.7MB    (41.31%) | 82.04% (39.38GB/48GB)     
  | Context | 48     | 512          | 24.24GB              | 38.97GB    | -14.73GB  (-37.80%) | 428.71MB               | 289.02MB     | 139.69MB   (48.33%) | 81.78% (39.25GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 47     |              | 23.79GB              | 38.97GB    | -15.18GB  (-38.95%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 47     | 25458        | 23.79GB              | 38.97GB    | -15.18GB  (-38.95%) | 8.03GB                 | 7.82GB       | 216.44MB   (02.70%) | 97.48% (46.79GB/48GB)     
  | Context | 47     | 25258        | 23.79GB              | 38.97GB    | -15.18GB  (-38.95%) | 7.97GB                 | 7.76GB       | 213.57MB   (02.69%) | 97.35% (46.73GB/48GB)     
  | Context | 47     | 4096         | 23.79GB              | 38.97GB    | -15.18GB  (-38.95%) | 1.51GB                 | 1.34GB       | 178.74MB   (13.07%) | 83.97% (40.31GB/48GB)     
  | Context | 47     | 2048         | 23.79GB              | 38.97GB    | -15.18GB  (-38.95%) | 906.73MB               | 732.02MB     | 174.71MB   (23.87%) | 82.68% (39.68GB/48GB)     
  | Context | 47     | 1024         | 23.79GB              | 38.97GB    | -15.18GB  (-38.95%) | 586.71MB               | 414.02MB     | 172.7MB    (41.71%) | 82.03% (39.37GB/48GB)     
  | Context | 47     | 512          | 23.79GB              | 38.97GB    | -15.18GB  (-38.95%) | 426.7MB                | 287.02MB     | 139.69MB   (48.67%) | 81.77% (39.25GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 46     |              | 23.28GB              | 38.97GB    | -15.69GB  (-40.25%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 46     | 25780        | 23.28GB              | 38.97GB    | -15.69GB  (-40.25%) | 8.03GB                 | 7.82GB       | 217.74MB   (02.72%) | 97.47% (46.79GB/48GB)     
  | Context | 46     | 25258        | 23.28GB              | 38.97GB    | -15.69GB  (-40.25%) | 7.87GB                 | 7.66GB       | 213.65MB   (02.72%) | 97.15% (46.63GB/48GB)     
  | Context | 46     | 4096         | 23.28GB              | 38.97GB    | -15.69GB  (-40.25%) | 1.49GB                 | 1.32GB       | 178.74MB   (13.22%) | 83.94% (40.29GB/48GB)     
  | Context | 46     | 2048         | 23.28GB              | 38.97GB    | -15.69GB  (-40.25%) | 898.72MB               | 724.02MB     | 174.71MB   (24.13%) | 82.66% (39.68GB/48GB)     
  | Context | 46     | 1024         | 23.28GB              | 38.97GB    | -15.69GB  (-40.25%) | 582.71MB               | 410.02MB     | 172.69MB   (42.12%) | 82.02% (39.37GB/48GB)     
  | Context | 46     | 512          | 23.28GB              | 38.97GB    | -15.69GB  (-40.25%) | 424.7MB                | 285.02MB     | 139.69MB   (49.01%) | 81.77% (39.25GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 45     |              | 22.83GB              | 38.97GB    | -16.14GB  (-41.40%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 45     | 26110        | 22.83GB              | 38.97GB    | -16.14GB  (-41.40%) | 8.03GB                 | 7.81GB       | 221.46MB   (02.77%) | 97.47% (46.78GB/48GB)     
  | Context | 45     | 25258        | 22.83GB              | 38.97GB    | -16.14GB  (-41.40%) | 7.78GB                 | 7.57GB       | 213.73MB   (02.76%) | 96.95% (46.54GB/48GB)     
  | Context | 45     | 4096         | 22.83GB              | 38.97GB    | -16.14GB  (-41.40%) | 1.48GB                 | 1.3GB        | 178.74MB   (13.38%) | 83.91% (40.27GB/48GB)     
  | Context | 45     | 2048         | 22.83GB              | 38.97GB    | -16.14GB  (-41.40%) | 890.72MB               | 716.02MB     | 174.71MB   (24.40%) | 82.64% (39.67GB/48GB)     
  | Context | 45     | 1024         | 22.83GB              | 38.97GB    | -16.14GB  (-41.40%) | 578.71MB               | 406.02MB     | 172.69MB   (42.53%) | 82.01% (39.37GB/48GB)     
  | Context | 45     | 512          | 22.83GB              | 38.97GB    | -16.14GB  (-41.40%) | 422.7MB                | 283.02MB     | 139.68MB   (49.36%) | 81.76% (39.25GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 44     |              | 22.38GB              | 38.97GB    | -16.58GB  (-42.56%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 44     | 26449        | 22.38GB              | 38.97GB    | -16.58GB  (-42.56%) | 8.03GB                 | 7.82GB       | 218.25MB   (02.73%) | 97.47% (46.79GB/48GB)     
  | Context | 44     | 25258        | 22.38GB              | 38.97GB    | -16.58GB  (-42.56%) | 7.68GB                 | 7.47GB       | 213.82MB   (02.79%) | 96.75% (46.44GB/48GB)     
  | Context | 44     | 4096         | 22.38GB              | 38.97GB    | -16.58GB  (-42.56%) | 1.46GB                 | 1.29GB       | 178.73MB   (13.54%) | 83.87% (40.26GB/48GB)     
  | Context | 44     | 2048         | 22.38GB              | 38.97GB    | -16.58GB  (-42.56%) | 882.72MB               | 708.02MB     | 174.7MB    (24.68%) | 82.63% (39.66GB/48GB)     
  | Context | 44     | 1024         | 22.38GB              | 38.97GB    | -16.58GB  (-42.56%) | 574.7MB                | 402.02MB     | 172.69MB   (42.96%) | 82.01% (39.36GB/48GB)     
  | Context | 44     | 512          | 22.38GB              | 38.97GB    | -16.58GB  (-42.56%) | 420.7MB                | 281.02MB     | 139.68MB   (49.71%) | 81.76% (39.24GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 43     |              | 21.88GB              | 38.97GB    | -17.09GB  (-43.86%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 43     | 26797        | 21.88GB              | 38.97GB    | -17.09GB  (-43.86%) | 8.03GB                 | 7.82GB       | 217.81MB   (02.72%) | 97.47% (46.79GB/48GB)     
  | Context | 43     | 25258        | 21.88GB              | 38.97GB    | -17.09GB  (-43.86%) | 7.58GB                 | 7.37GB       | 213.9MB    (02.83%) | 96.55% (46.34GB/48GB)     
  | Context | 43     | 4096         | 21.88GB              | 38.97GB    | -17.09GB  (-43.86%) | 1.45GB                 | 1.27GB       | 178.73MB   (13.71%) | 83.84% (40.24GB/48GB)     
  | Context | 43     | 2048         | 21.88GB              | 38.97GB    | -17.09GB  (-43.86%) | 874.72MB               | 700.02MB     | 174.7MB    (24.96%) | 82.61% (39.65GB/48GB)     
  | Context | 43     | 1024         | 21.88GB              | 38.97GB    | -17.09GB  (-43.86%) | 570.7MB                | 398.02MB     | 172.69MB   (43.39%) | 82.00% (39.36GB/48GB)     
  | Context | 43     | 512          | 21.88GB              | 38.97GB    | -17.09GB  (-43.86%) | 418.69MB               | 279.02MB     | 139.68MB   (50.06%) | 81.76% (39.24GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 42     |              | 21.43GB              | 38.97GB    | -17.54GB  (-45.01%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 42     | 27155        | 21.43GB              | 38.97GB    | -17.54GB  (-45.01%) | 8.03GB                 | 7.81GB       | 220.34MB   (02.75%) | 97.47% (46.78GB/48GB)     
  | Context | 42     | 25258        | 21.43GB              | 38.97GB    | -17.54GB  (-45.01%) | 7.49GB                 | 7.28GB       | 213.98MB   (02.87%) | 96.35% (46.25GB/48GB)     
  | Context | 42     | 4096         | 21.43GB              | 38.97GB    | -17.54GB  (-45.01%) | 1.43GB                 | 1.26GB       | 178.73MB   (13.88%) | 83.81% (40.23GB/48GB)     
  | Context | 42     | 2048         | 21.43GB              | 38.97GB    | -17.54GB  (-45.01%) | 866.71MB               | 692.02MB     | 174.7MB    (25.24%) | 82.60% (39.65GB/48GB)     
  | Context | 42     | 1024         | 21.43GB              | 38.97GB    | -17.54GB  (-45.01%) | 566.7MB                | 394.02MB     | 172.68MB   (43.83%) | 81.99% (39.35GB/48GB)     
  | Context | 42     | 512          | 21.43GB              | 38.97GB    | -17.54GB  (-45.01%) | 416.69MB               | 277.02MB     | 139.67MB   (50.42%) | 81.75% (39.24GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 41     |              | 20.98GB              | 38.97GB    | -17.99GB  (-46.16%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 41     | 27522        | 20.98GB              | 38.97GB    | -17.99GB  (-46.16%) | 8.03GB                 | 7.82GB       | 216.22MB   (02.70%) | 97.48% (46.79GB/48GB)     
  | Context | 41     | 25258        | 20.98GB              | 38.97GB    | -17.99GB  (-46.16%) | 7.39GB                 | 7.18GB       | 214.07MB   (02.91%) | 96.15% (46.15GB/48GB)     
  | Context | 41     | 4096         | 20.98GB              | 38.97GB    | -17.99GB  (-46.16%) | 1.42GB                 | 1.24GB       | 178.73MB   (14.05%) | 83.78% (40.21GB/48GB)     
  | Context | 41     | 2048         | 20.98GB              | 38.97GB    | -17.99GB  (-46.16%) | 858.71MB               | 684.02MB     | 174.7MB    (25.54%) | 82.58% (39.64GB/48GB)     
  | Context | 41     | 1024         | 20.98GB              | 38.97GB    | -17.99GB  (-46.16%) | 562.7MB                | 390.02MB     | 172.68MB   (44.28%) | 81.98% (39.35GB/48GB)     
  | Context | 41     | 512          | 20.98GB              | 38.97GB    | -17.99GB  (-46.16%) | 414.69MB               | 275.02MB     | 139.67MB   (50.79%) | 81.75% (39.24GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 40     |              | 20.47GB              | 38.97GB    | -18.5GB   (-47.46%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 40     | 27899        | 20.47GB              | 38.97GB    | -18.5GB   (-47.46%) | 8.03GB                 | 7.81GB       | 224.16MB   (02.80%) | 97.46% (46.78GB/48GB)     
  | Context | 40     | 25258        | 20.47GB              | 38.97GB    | -18.5GB   (-47.46%) | 7.29GB                 | 7.09GB       | 214.15MB   (02.95%) | 95.95% (46.06GB/48GB)     
  | Context | 40     | 4096         | 20.47GB              | 38.97GB    | -18.5GB   (-47.46%) | 1.4GB                  | 1.23GB       | 178.72MB   (14.23%) | 83.74% (40.2GB/48GB)      
  | Context | 40     | 2048         | 20.47GB              | 38.97GB    | -18.5GB   (-47.46%) | 850.71MB               | 676.02MB     | 174.69MB   (25.84%) | 82.56% (39.63GB/48GB)     
  | Context | 40     | 1024         | 20.47GB              | 38.97GB    | -18.5GB   (-47.46%) | 558.69MB               | 386.02MB     | 172.68MB   (44.73%) | 81.97% (39.35GB/48GB)     
  | Context | 40     | 512          | 20.47GB              | 38.97GB    | -18.5GB   (-47.46%) | 412.68MB               | 273.02MB     | 139.67MB   (51.16%) | 81.74% (39.24GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 39     |              | 20.02GB              | 38.97GB    | -18.95GB  (-48.62%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 39     | 28286        | 20.02GB              | 38.97GB    | -18.95GB  (-48.62%) | 8.03GB                 | 7.81GB       | 225.78MB   (02.82%) | 97.46% (46.78GB/48GB)     
  | Context | 39     | 25258        | 20.02GB              | 38.97GB    | -18.95GB  (-48.62%) | 7.2GB                  | 6.99GB       | 214.23MB   (02.99%) | 95.75% (45.96GB/48GB)     
  | Context | 39     | 4096         | 20.02GB              | 38.97GB    | -18.95GB  (-48.62%) | 1.39GB                 | 1.21GB       | 178.72MB   (14.41%) | 83.71% (40.18GB/48GB)     
  | Context | 39     | 2048         | 20.02GB              | 38.97GB    | -18.95GB  (-48.62%) | 842.71MB               | 668.02MB     | 174.69MB   (26.15%) | 82.55% (39.62GB/48GB)     
  | Context | 39     | 1024         | 20.02GB              | 38.97GB    | -18.95GB  (-48.62%) | 554.69MB               | 382.02MB     | 172.67MB   (45.20%) | 81.96% (39.34GB/48GB)     
  | Context | 39     | 512          | 20.02GB              | 38.97GB    | -18.95GB  (-48.62%) | 410.68MB               | 271.02MB     | 139.67MB   (51.53%) | 81.74% (39.23GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 38     |              | 19.57GB              | 38.97GB    | -19.4GB   (-49.77%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 38     | 28685        | 19.57GB              | 38.97GB    | -19.4GB   (-49.77%) | 8.03GB                 | 7.81GB       | 221.89MB   (02.77%) | 97.47% (46.78GB/48GB)     
  | Context | 38     | 25258        | 19.57GB              | 38.97GB    | -19.4GB   (-49.77%) | 7.1GB                  | 6.89GB       | 214.31MB   (03.04%) | 95.55% (45.86GB/48GB)     
  | Context | 38     | 4096         | 19.57GB              | 38.97GB    | -19.4GB   (-49.77%) | 1.37GB                 | 1.2GB        | 178.72MB   (14.60%) | 83.68% (40.17GB/48GB)     
  | Context | 38     | 2048         | 19.57GB              | 38.97GB    | -19.4GB   (-49.77%) | 834.7MB                | 660.02MB     | 174.69MB   (26.47%) | 82.53% (39.61GB/48GB)     
  | Context | 38     | 1024         | 19.57GB              | 38.97GB    | -19.4GB   (-49.77%) | 550.69MB               | 378.02MB     | 172.67MB   (45.68%) | 81.96% (39.34GB/48GB)     
  | Context | 38     | 512          | 19.57GB              | 38.97GB    | -19.4GB   (-49.77%) | 408.68MB               | 269.02MB     | 139.66MB   (51.92%) | 81.73% (39.23GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 37     |              | 19.07GB              | 38.97GB    | -19.9GB   (-51.07%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 37     | 29094        | 19.07GB              | 38.97GB    | -19.9GB   (-51.07%) | 8.03GB                 | 7.81GB       | 220.86MB   (02.76%) | 97.47% (46.78GB/48GB)     
  | Context | 37     | 25258        | 19.07GB              | 38.97GB    | -19.9GB   (-51.07%) | 7.01GB                 | 6.8GB        | 214.4MB    (03.08%) | 95.35% (45.77GB/48GB)     
  | Context | 37     | 4096         | 19.07GB              | 38.97GB    | -19.9GB   (-51.07%) | 1.35GB                 | 1.18GB       | 178.72MB   (14.79%) | 83.65% (40.15GB/48GB)     
  | Context | 37     | 2048         | 19.07GB              | 38.97GB    | -19.9GB   (-51.07%) | 826.7MB                | 652.02MB     | 174.68MB   (26.79%) | 82.51% (39.61GB/48GB)     
  | Context | 37     | 1024         | 19.07GB              | 38.97GB    | -19.9GB   (-51.07%) | 546.68MB               | 374.02MB     | 172.67MB   (46.17%) | 81.95% (39.34GB/48GB)     
  | Context | 37     | 512          | 19.07GB              | 38.97GB    | -19.9GB   (-51.07%) | 406.68MB               | 267.02MB     | 139.66MB   (52.30%) | 81.73% (39.23GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 36     |              | 18.62GB              | 38.97GB    | -20.35GB  (-52.22%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 36     | 29516        | 18.62GB              | 38.97GB    | -20.35GB  (-52.22%) | 8.03GB                 | 7.81GB       | 223.4MB    (02.79%) | 97.46% (46.78GB/48GB)     
  | Context | 36     | 25258        | 18.62GB              | 38.97GB    | -20.35GB  (-52.22%) | 6.91GB                 | 6.7GB        | 214.48MB   (03.13%) | 95.15% (45.67GB/48GB)     
  | Context | 36     | 4096         | 18.62GB              | 38.97GB    | -20.35GB  (-52.22%) | 1.34GB                 | 1.16GB       | 178.71MB   (14.99%) | 83.61% (40.13GB/48GB)     
  | Context | 36     | 2048         | 18.62GB              | 38.97GB    | -20.35GB  (-52.22%) | 818.7MB                | 644.02MB     | 174.68MB   (27.12%) | 82.50% (39.6GB/48GB)      
  | Context | 36     | 1024         | 18.62GB              | 38.97GB    | -20.35GB  (-52.22%) | 542.68MB               | 370.02MB     | 172.67MB   (46.66%) | 81.94% (39.33GB/48GB)     
  | Context | 36     | 512          | 18.62GB              | 38.97GB    | -20.35GB  (-52.22%) | 404.67MB               | 265.02MB     | 139.66MB   (52.70%) | 81.73% (39.23GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 35     |              | 18.17GB              | 38.97GB    | -20.8GB   (-53.38%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 35     | 29950        | 18.17GB              | 38.97GB    | -20.8GB   (-53.38%) | 8.03GB                 | 7.81GB       | 229.07MB   (02.87%) | 97.45% (46.78GB/48GB)     
  | Context | 35     | 25258        | 18.17GB              | 38.97GB    | -20.8GB   (-53.38%) | 6.81GB                 | 6.6GB        | 214.56MB   (03.17%) | 94.94% (45.57GB/48GB)     
  | Context | 35     | 4096         | 18.17GB              | 38.97GB    | -20.8GB   (-53.38%) | 1.32GB                 | 1.15GB       | 178.71MB   (15.20%) | 83.58% (40.12GB/48GB)     
  | Context | 35     | 2048         | 18.17GB              | 38.97GB    | -20.8GB   (-53.38%) | 810.69MB               | 636.02MB     | 174.68MB   (27.46%) | 82.48% (39.59GB/48GB)     
  | Context | 35     | 1024         | 18.17GB              | 38.97GB    | -20.8GB   (-53.38%) | 538.68MB               | 366.02MB     | 172.66MB   (47.17%) | 81.93% (39.33GB/48GB)     
  | Context | 35     | 512          | 18.17GB              | 38.97GB    | -20.8GB   (-53.38%) | 402.67MB               | 263.02MB     | 139.65MB   (53.10%) | 81.72% (39.23GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 34     |              | 17.66GB              | 38.97GB    | -21.31GB  (-54.68%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 34     | 30397        | 17.66GB              | 38.97GB    | -21.31GB  (-54.68%) | 8.03GB                 | 7.81GB       | 229.7MB    (02.87%) | 97.45% (46.78GB/48GB)     
  | Context | 34     | 25258        | 17.66GB              | 38.97GB    | -21.31GB  (-54.68%) | 6.72GB                 | 6.51GB       | 214.65MB   (03.22%) | 94.74% (45.48GB/48GB)     
  | Context | 34     | 4096         | 17.66GB              | 38.97GB    | -21.31GB  (-54.68%) | 1.31GB                 | 1.13GB       | 178.71MB   (15.41%) | 83.55% (40.1GB/48GB)      
  | Context | 34     | 2048         | 17.66GB              | 38.97GB    | -21.31GB  (-54.68%) | 802.69MB               | 628.02MB     | 174.68MB   (27.81%) | 82.47% (39.58GB/48GB)     
  | Context | 34     | 1024         | 17.66GB              | 38.97GB    | -21.31GB  (-54.68%) | 534.68MB               | 362.02MB     | 172.66MB   (47.69%) | 81.92% (39.32GB/48GB)     
  | Context | 34     | 512          | 17.66GB              | 38.97GB    | -21.31GB  (-54.68%) | 400.67MB               | 261.02MB     | 139.65MB   (53.50%) | 81.72% (39.22GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 33     |              | 17.21GB              | 38.97GB    | -21.76GB  (-55.83%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 33     | 30858        | 17.21GB              | 38.97GB    | -21.76GB  (-55.83%) | 8.03GB                 | 7.81GB       | 225.75MB   (02.82%) | 97.46% (46.78GB/48GB)     
  | Context | 33     | 25258        | 17.21GB              | 38.97GB    | -21.76GB  (-55.83%) | 6.62GB                 | 6.41GB       | 214.73MB   (03.27%) | 94.54% (45.38GB/48GB)     
  | Context | 33     | 4096         | 17.21GB              | 38.97GB    | -21.76GB  (-55.83%) | 1.29GB                 | 1.12GB       | 178.7MB    (15.62%) | 83.52% (40.09GB/48GB)     
  | Context | 33     | 2048         | 17.21GB              | 38.97GB    | -21.76GB  (-55.83%) | 794.69MB               | 620.02MB     | 174.67MB   (28.17%) | 82.45% (39.58GB/48GB)     
  | Context | 33     | 1024         | 17.21GB              | 38.97GB    | -21.76GB  (-55.83%) | 530.67MB               | 358.02MB     | 172.66MB   (48.23%) | 81.92% (39.32GB/48GB)     
  | Context | 33     | 512          | 17.21GB              | 38.97GB    | -21.76GB  (-55.83%) | 398.66MB               | 259.02MB     | 139.65MB   (53.92%) | 81.71% (39.22GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 32     |              | 16.76GB              | 38.97GB    | -22.21GB  (-56.98%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 32     | 31332        | 16.76GB              | 38.97GB    | -22.21GB  (-56.98%) | 8.03GB                 | 7.81GB       | 225.26MB   (02.82%) | 97.46% (46.78GB/48GB)     
  | Context | 32     | 25258        | 16.76GB              | 38.97GB    | -22.21GB  (-56.98%) | 6.52GB                 | 6.31GB       | 214.81MB   (03.32%) | 94.34% (45.28GB/48GB)     
  | Context | 32     | 4096         | 16.76GB              | 38.97GB    | -22.21GB  (-56.98%) | 1.28GB                 | 1.1GB        | 178.7MB    (15.84%) | 83.48% (40.07GB/48GB)     
  | Context | 32     | 2048         | 16.76GB              | 38.97GB    | -22.21GB  (-56.98%) | 786.69MB               | 612.02MB     | 174.67MB   (28.54%) | 82.43% (39.57GB/48GB)     
  | Context | 32     | 1024         | 16.76GB              | 38.97GB    | -22.21GB  (-56.98%) | 526.67MB               | 354.02MB     | 172.65MB   (48.77%) | 81.91% (39.32GB/48GB)     
  | Context | 32     | 512          | 16.76GB              | 38.97GB    | -22.21GB  (-56.98%) | 396.66MB               | 257.02MB     | 139.65MB   (54.33%) | 81.71% (39.22GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 31     |              | 16.26GB              | 38.97GB    | -22.71GB  (-58.28%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 31     | 31822        | 16.26GB              | 38.97GB    | -22.71GB  (-58.28%) | 8.03GB                 | 7.81GB       | 228.81MB   (02.86%) | 97.45% (46.78GB/48GB)     
  | Context | 31     | 25258        | 16.26GB              | 38.97GB    | -22.71GB  (-58.28%) | 6.43GB                 | 6.22GB       | 214.9MB    (03.38%) | 94.14% (45.19GB/48GB)     
  | Context | 31     | 4096         | 16.26GB              | 38.97GB    | -22.71GB  (-58.28%) | 1.26GB                 | 1.09GB       | 178.7MB    (16.07%) | 83.45% (40.06GB/48GB)     
  | Context | 31     | 2048         | 16.26GB              | 38.97GB    | -22.71GB  (-58.28%) | 778.68MB               | 604.02MB     | 174.67MB   (28.92%) | 82.42% (39.56GB/48GB)     
  | Context | 31     | 1024         | 16.26GB              | 38.97GB    | -22.71GB  (-58.28%) | 522.67MB               | 350.02MB     | 172.65MB   (49.33%) | 81.90% (39.31GB/48GB)     
  | Context | 31     | 512          | 16.26GB              | 38.97GB    | -22.71GB  (-58.28%) | 394.66MB               | 255.02MB     | 139.64MB   (54.76%) | 81.71% (39.22GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 30     |              | 15.81GB              | 38.97GB    | -23.16GB  (-59.44%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 30     | 32327        | 15.81GB              | 38.97GB    | -23.16GB  (-59.44%) | 8.03GB                 | 7.81GB       | 228.16MB   (02.85%) | 97.45% (46.78GB/48GB)     
  | Context | 30     | 25258        | 15.81GB              | 38.97GB    | -23.16GB  (-59.44%) | 6.33GB                 | 6.12GB       | 214.98MB   (03.43%) | 93.94% (45.09GB/48GB)     
  | Context | 30     | 4096         | 15.81GB              | 38.97GB    | -23.16GB  (-59.44%) | 1.24GB                 | 1.07GB       | 178.7MB    (16.30%) | 83.42% (40.04GB/48GB)     
  | Context | 30     | 2048         | 15.81GB              | 38.97GB    | -23.16GB  (-59.44%) | 770.68MB               | 596.02MB     | 174.66MB   (29.31%) | 82.40% (39.55GB/48GB)     
  | Context | 30     | 1024         | 15.81GB              | 38.97GB    | -23.16GB  (-59.44%) | 518.66MB               | 346.02MB     | 172.65MB   (49.90%) | 81.89% (39.31GB/48GB)     
  | Context | 30     | 512          | 15.81GB              | 38.97GB    | -23.16GB  (-59.44%) | 392.66MB               | 253.02MB     | 139.64MB   (55.19%) | 81.70% (39.22GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 29     |              | 15.36GB              | 38.97GB    | -23.61GB  (-60.59%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 29     | 32848        | 15.36GB              | 38.97GB    | -23.61GB  (-60.59%) | 8.03GB                 | 7.8GB        | 231.44MB   (02.90%) | 97.45% (46.77GB/48GB)     
  | Context | 29     | 25258        | 15.36GB              | 38.97GB    | -23.61GB  (-60.59%) | 6.23GB                 | 6.02GB       | 215.06MB   (03.49%) | 93.74% (44.99GB/48GB)     
  | Context | 29     | 4096         | 15.36GB              | 38.97GB    | -23.61GB  (-60.59%) | 1.23GB                 | 1.05GB       | 178.69MB   (16.55%) | 83.38% (40.02GB/48GB)     
  | Context | 29     | 2048         | 15.36GB              | 38.97GB    | -23.61GB  (-60.59%) | 762.68MB               | 588.02MB     | 174.66MB   (29.70%) | 82.38% (39.54GB/48GB)     
  | Context | 29     | 1024         | 15.36GB              | 38.97GB    | -23.61GB  (-60.59%) | 514.66MB               | 342.02MB     | 172.65MB   (50.48%) | 81.88% (39.3GB/48GB)      
  | Context | 29     | 512          | 15.36GB              | 38.97GB    | -23.61GB  (-60.59%) | 390.65MB               | 251.02MB     | 139.64MB   (55.63%) | 81.70% (39.22GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 28     |              | 14.85GB              | 38.97GB    | -24.12GB  (-61.89%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 28     | 33387        | 14.85GB              | 38.97GB    | -24.12GB  (-61.89%) | 8.03GB                 | 7.8GB        | 231.38MB   (02.90%) | 97.45% (46.77GB/48GB)     
  | Context | 28     | 25258        | 14.85GB              | 38.97GB    | -24.12GB  (-61.89%) | 6.14GB                 | 5.93GB       | 215.15MB   (03.54%) | 93.54% (44.9GB/48GB)      
  | Context | 28     | 4096         | 14.85GB              | 38.97GB    | -24.12GB  (-61.89%) | 1.21GB                 | 1.04GB       | 178.69MB   (16.79%) | 83.35% (40.01GB/48GB)     
  | Context | 28     | 2048         | 14.85GB              | 38.97GB    | -24.12GB  (-61.89%) | 754.67MB               | 580.02MB     | 174.66MB   (30.11%) | 82.37% (39.54GB/48GB)     
  | Context | 28     | 1024         | 14.85GB              | 38.97GB    | -24.12GB  (-61.89%) | 510.66MB               | 338.02MB     | 172.64MB   (51.08%) | 81.88% (39.3GB/48GB)      
  | Context | 28     | 512          | 14.85GB              | 38.97GB    | -24.12GB  (-61.89%) | 388.65MB               | 249.02MB     | 139.64MB   (56.07%) | 81.69% (39.21GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 27     |              | 14.4GB               | 38.97GB    | -24.57GB  (-63.04%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 27     | 33943        | 14.4GB               | 38.97GB    | -24.57GB  (-63.04%) | 8.03GB                 | 7.8GB        | 235.35MB   (02.95%) | 97.44% (46.77GB/48GB)     
  | Context | 27     | 25258        | 14.4GB               | 38.97GB    | -24.57GB  (-63.04%) | 6.04GB                 | 5.83GB       | 215.23MB   (03.60%) | 93.34% (44.8GB/48GB)      
  | Context | 27     | 4096         | 14.4GB               | 38.97GB    | -24.57GB  (-63.04%) | 1.2GB                  | 1.02GB       | 178.69MB   (17.05%) | 83.32% (39.99GB/48GB)     
  | Context | 27     | 2048         | 14.4GB               | 38.97GB    | -24.57GB  (-63.04%) | 746.67MB               | 572.02MB     | 174.66MB   (30.53%) | 82.35% (39.53GB/48GB)     
  | Context | 27     | 1024         | 14.4GB               | 38.97GB    | -24.57GB  (-63.04%) | 506.66MB               | 334.02MB     | 172.64MB   (51.69%) | 81.87% (39.3GB/48GB)      
  | Context | 27     | 512          | 14.4GB               | 38.97GB    | -24.57GB  (-63.04%) | 386.65MB               | 247.02MB     | 139.63MB   (56.53%) | 81.69% (39.21GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 26     |              | 13.95GB              | 38.97GB    | -25.02GB  (-64.19%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 26     | 34519        | 13.95GB              | 38.97GB    | -25.02GB  (-64.19%) | 8.03GB                 | 7.8GB        | 236.51MB   (02.96%) | 97.44% (46.77GB/48GB)     
  | Context | 26     | 25258        | 13.95GB              | 38.97GB    | -25.02GB  (-64.19%) | 5.95GB                 | 5.74GB       | 215.31MB   (03.67%) | 93.14% (44.71GB/48GB)     
  | Context | 26     | 4096         | 13.95GB              | 38.97GB    | -25.02GB  (-64.19%) | 1.18GB                 | 1.01GB       | 178.68MB   (17.31%) | 83.29% (39.98GB/48GB)     
  | Context | 26     | 2048         | 13.95GB              | 38.97GB    | -25.02GB  (-64.19%) | 738.67MB               | 564.02MB     | 174.65MB   (30.97%) | 82.33% (39.52GB/48GB)     
  | Context | 26     | 1024         | 13.95GB              | 38.97GB    | -25.02GB  (-64.19%) | 502.65MB               | 330.02MB     | 172.64MB   (52.31%) | 81.86% (39.29GB/48GB)     
  | Context | 26     | 512          | 13.95GB              | 38.97GB    | -25.02GB  (-64.19%) | 384.65MB               | 245.02MB     | 139.63MB   (56.99%) | 81.69% (39.21GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 25     |              | 13.45GB              | 38.97GB    | -25.52GB  (-65.49%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 25     | 35114        | 13.45GB              | 38.97GB    | -25.52GB  (-65.49%) | 8.03GB                 | 7.8GB        | 234.8MB    (02.94%) | 97.44% (46.77GB/48GB)     
  | Context | 25     | 25258        | 13.45GB              | 38.97GB    | -25.52GB  (-65.49%) | 5.85GB                 | 5.64GB       | 215.4MB    (03.73%) | 92.94% (44.61GB/48GB)     
  | Context | 25     | 4096         | 13.45GB              | 38.97GB    | -25.52GB  (-65.49%) | 1.17GB                 | 1016.02MB    | 178.68MB   (17.59%) | 83.25% (39.96GB/48GB)     
  | Context | 25     | 2048         | 13.45GB              | 38.97GB    | -25.52GB  (-65.49%) | 730.67MB               | 556.02MB     | 174.65MB   (31.41%) | 82.32% (39.51GB/48GB)     
  | Context | 25     | 1024         | 13.45GB              | 38.97GB    | -25.52GB  (-65.49%) | 498.65MB               | 326.02MB     | 172.63MB   (52.95%) | 81.85% (39.29GB/48GB)     
  | Context | 25     | 512          | 13.45GB              | 38.97GB    | -25.52GB  (-65.49%) | 382.64MB               | 243.02MB     | 139.63MB   (57.46%) | 81.68% (39.21GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 24     |              | 13GB                 | 38.97GB    | -25.97GB  (-66.65%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 24     | 35730        | 13GB                 | 38.97GB    | -25.97GB  (-66.65%) | 8.03GB                 | 7.8GB        | 237.86MB   (02.98%) | 97.43% (46.77GB/48GB)     
  | Context | 24     | 25258        | 13GB                 | 38.97GB    | -25.97GB  (-66.65%) | 5.75GB                 | 5.54GB       | 215.48MB   (03.80%) | 92.73% (44.51GB/48GB)     
  | Context | 24     | 4096         | 13GB                 | 38.97GB    | -25.97GB  (-66.65%) | 1.15GB                 | 1000.02MB    | 178.68MB   (17.87%) | 83.22% (39.95GB/48GB)     
  | Context | 24     | 2048         | 13GB                 | 38.97GB    | -25.97GB  (-66.65%) | 722.66MB               | 548.02MB     | 174.65MB   (31.87%) | 82.30% (39.51GB/48GB)     
  | Context | 24     | 1024         | 13GB                 | 38.97GB    | -25.97GB  (-66.65%) | 494.65MB               | 322.02MB     | 172.63MB   (53.61%) | 81.84% (39.28GB/48GB)     
  | Context | 24     | 512          | 13GB                 | 38.97GB    | -25.97GB  (-66.65%) | 380.64MB               | 241.02MB     | 139.62MB   (57.93%) | 81.68% (39.21GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 23     |              | 12.55GB              | 38.97GB    | -26.42GB  (-67.80%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 23     | 36368        | 12.55GB              | 38.97GB    | -26.42GB  (-67.80%) | 8.03GB                 | 7.8GB        | 238.73MB   (02.99%) | 97.43% (46.77GB/48GB)     
  | Context | 23     | 25258        | 12.55GB              | 38.97GB    | -26.42GB  (-67.80%) | 5.66GB                 | 5.45GB       | 215.56MB   (03.87%) | 92.53% (44.42GB/48GB)     
  | Context | 23     | 4096         | 12.55GB              | 38.97GB    | -26.42GB  (-67.80%) | 1.14GB                 | 984.02MB     | 178.68MB   (18.16%) | 83.19% (39.93GB/48GB)     
  | Context | 23     | 2048         | 12.55GB              | 38.97GB    | -26.42GB  (-67.80%) | 714.66MB               | 540.02MB     | 174.64MB   (32.34%) | 82.29% (39.5GB/48GB)      
  | Context | 23     | 1024         | 12.55GB              | 38.97GB    | -26.42GB  (-67.80%) | 490.64MB               | 318.02MB     | 172.63MB   (54.28%) | 81.83% (39.28GB/48GB)     
  | Context | 23     | 512          | 12.55GB              | 38.97GB    | -26.42GB  (-67.80%) | 378.64MB               | 239.02MB     | 139.62MB   (58.42%) | 81.67% (39.2GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 22     |              | 12.04GB              | 38.97GB    | -26.93GB  (-69.10%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 22     | 37029        | 12.04GB              | 38.97GB    | -26.93GB  (-69.10%) | 8.03GB                 | 7.8GB        | 237.75MB   (02.98%) | 97.43% (46.77GB/48GB)     
  | Context | 22     | 25258        | 12.04GB              | 38.97GB    | -26.93GB  (-69.10%) | 5.56GB                 | 5.35GB       | 215.64MB   (03.94%) | 92.33% (44.32GB/48GB)     
  | Context | 22     | 4096         | 12.04GB              | 38.97GB    | -26.93GB  (-69.10%) | 1.12GB                 | 968.02MB     | 178.67MB   (18.46%) | 83.16% (39.92GB/48GB)     
  | Context | 22     | 2048         | 12.04GB              | 38.97GB    | -26.93GB  (-69.10%) | 706.66MB               | 532.02MB     | 174.64MB   (32.83%) | 82.27% (39.49GB/48GB)     
  | Context | 22     | 1024         | 12.04GB              | 38.97GB    | -26.93GB  (-69.10%) | 486.64MB               | 314.02MB     | 172.63MB   (54.97%) | 81.83% (39.28GB/48GB)     
  | Context | 22     | 512          | 12.04GB              | 38.97GB    | -26.93GB  (-69.10%) | 376.63MB               | 237.02MB     | 139.62MB   (58.91%) | 81.67% (39.2GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 21     |              | 11.59GB              | 38.97GB    | -27.38GB  (-70.25%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 21     | 37715        | 11.59GB              | 38.97GB    | -27.38GB  (-70.25%) | 8.03GB                 | 7.79GB       | 242.13MB   (03.03%) | 97.42% (46.76GB/48GB)     
  | Context | 21     | 25258        | 11.59GB              | 38.97GB    | -27.38GB  (-70.25%) | 5.46GB                 | 5.25GB       | 215.73MB   (04.01%) | 92.13% (44.22GB/48GB)     
  | Context | 21     | 4096         | 11.59GB              | 38.97GB    | -27.38GB  (-70.25%) | 1.1GB                  | 952.02MB     | 178.67MB   (18.77%) | 83.12% (39.9GB/48GB)      
  | Context | 21     | 2048         | 11.59GB              | 38.97GB    | -27.38GB  (-70.25%) | 698.65MB               | 524.02MB     | 174.64MB   (33.33%) | 82.25% (39.48GB/48GB)     
  | Context | 21     | 1024         | 11.59GB              | 38.97GB    | -27.38GB  (-70.25%) | 482.64MB               | 310.02MB     | 172.62MB   (55.68%) | 81.82% (39.27GB/48GB)     
  | Context | 21     | 512          | 11.59GB              | 38.97GB    | -27.38GB  (-70.25%) | 374.63MB               | 235.02MB     | 139.62MB   (59.41%) | 81.67% (39.2GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 20     |              | 11.14GB              | 38.97GB    | -27.83GB  (-71.41%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 20     | 38426        | 11.14GB              | 38.97GB    | -27.83GB  (-71.41%) | 8.03GB                 | 7.79GB       | 245.01MB   (03.07%) | 97.42% (46.76GB/48GB)     
  | Context | 20     | 25258        | 11.14GB              | 38.97GB    | -27.83GB  (-71.41%) | 5.37GB                 | 5.16GB       | 215.81MB   (04.09%) | 91.93% (44.13GB/48GB)     
  | Context | 20     | 4096         | 11.14GB              | 38.97GB    | -27.83GB  (-71.41%) | 1.09GB                 | 936.02MB     | 178.67MB   (19.09%) | 83.09% (39.88GB/48GB)     
  | Context | 20     | 2048         | 11.14GB              | 38.97GB    | -27.83GB  (-71.41%) | 690.65MB               | 516.02MB     | 174.64MB   (33.84%) | 82.24% (39.47GB/48GB)     
  | Context | 20     | 1024         | 11.14GB              | 38.97GB    | -27.83GB  (-71.41%) | 478.64MB               | 306.02MB     | 172.62MB   (56.41%) | 81.81% (39.27GB/48GB)     
  | Context | 20     | 512          | 11.14GB              | 38.97GB    | -27.83GB  (-71.41%) | 372.63MB               | 233.02MB     | 139.61MB   (59.92%) | 81.66% (39.2GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 19     |              | 10.64GB              | 38.97GB    | -28.33GB  (-72.71%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 19     | 39165        | 10.64GB              | 38.97GB    | -28.33GB  (-72.71%) | 8.03GB                 | 7.79GB       | 247.09MB   (03.10%) | 97.41% (46.76GB/48GB)     
  | Context | 19     | 25258        | 10.64GB              | 38.97GB    | -28.33GB  (-72.71%) | 5.27GB                 | 5.06GB       | 215.89MB   (04.17%) | 91.73% (44.03GB/48GB)     
  | Context | 19     | 4096         | 10.64GB              | 38.97GB    | -28.33GB  (-72.71%) | 1.07GB                 | 920.02MB     | 178.66MB   (19.42%) | 83.06% (39.87GB/48GB)     
  | Context | 19     | 2048         | 10.64GB              | 38.97GB    | -28.33GB  (-72.71%) | 682.65MB               | 508.02MB     | 174.63MB   (34.38%) | 82.22% (39.47GB/48GB)     
  | Context | 19     | 1024         | 10.64GB              | 38.97GB    | -28.33GB  (-72.71%) | 474.63MB               | 302.02MB     | 172.62MB   (57.16%) | 81.80% (39.26GB/48GB)     
  | Context | 19     | 512          | 10.64GB              | 38.97GB    | -28.33GB  (-72.71%) | 370.63MB               | 231.02MB     | 139.61MB   (60.43%) | 81.66% (39.2GB/48GB)      
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 18     |              | 10.19GB              | 38.97GB    | -28.78GB  (-73.86%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 18     | 39933        | 10.19GB              | 38.97GB    | -28.78GB  (-73.86%) | 8.03GB                 | 7.79GB       | 248.61MB   (03.12%) | 97.41% (46.76GB/48GB)     
  | Context | 18     | 25258        | 10.19GB              | 38.97GB    | -28.78GB  (-73.86%) | 5.17GB                 | 4.96GB       | 215.98MB   (04.25%) | 91.53% (43.93GB/48GB)     
  | Context | 18     | 4096         | 10.19GB              | 38.97GB    | -28.78GB  (-73.86%) | 1.06GB                 | 904.02MB     | 178.66MB   (19.76%) | 83.03% (39.85GB/48GB)     
  | Context | 18     | 2048         | 10.19GB              | 38.97GB    | -28.78GB  (-73.86%) | 674.65MB               | 500.02MB     | 174.63MB   (34.93%) | 82.20% (39.46GB/48GB)     
  | Context | 18     | 1024         | 10.19GB              | 38.97GB    | -28.78GB  (-73.86%) | 470.63MB               | 298.02MB     | 172.62MB   (57.92%) | 81.79% (39.26GB/48GB)     
  | Context | 18     | 512          | 10.19GB              | 38.97GB    | -28.78GB  (-73.86%) | 368.62MB               | 229.02MB     | 139.61MB   (60.96%) | 81.65% (39.19GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 17     |              | 9.74GB               | 38.97GB    | -29.23GB  (-75.01%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 17     | 40732        | 9.74GB               | 38.97GB    | -29.23GB  (-75.01%) | 8.03GB                 | 7.79GB       | 250MB      (03.14%) | 97.41% (46.76GB/48GB)     
  | Context | 17     | 25258        | 9.74GB               | 38.97GB    | -29.23GB  (-75.01%) | 5.08GB                 | 4.87GB       | 216.06MB   (04.33%) | 91.33% (43.84GB/48GB)     
  | Context | 17     | 4096         | 9.74GB               | 38.97GB    | -29.23GB  (-75.01%) | 1.04GB                 | 888.02MB     | 178.66MB   (20.12%) | 82.99% (39.84GB/48GB)     
  | Context | 17     | 2048         | 9.74GB               | 38.97GB    | -29.23GB  (-75.01%) | 666.64MB               | 492.02MB     | 174.63MB   (35.49%) | 82.19% (39.45GB/48GB)     
  | Context | 17     | 1024         | 9.74GB               | 38.97GB    | -29.23GB  (-75.01%) | 466.63MB               | 294.02MB     | 172.61MB   (58.71%) | 81.79% (39.26GB/48GB)     
  | Context | 17     | 512          | 9.74GB               | 38.97GB    | -29.23GB  (-75.01%) | 366.62MB               | 227.02MB     | 139.6MB    (61.50%) | 81.65% (39.19GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 16     |              | 9.23GB               | 38.97GB    | -29.74GB  (-76.31%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 16     | 41563        | 9.23GB               | 38.97GB    | -29.74GB  (-76.31%) | 8.03GB                 | 7.78GB       | 251.46MB   (03.15%) | 97.40% (46.75GB/48GB)     
  | Context | 16     | 25258        | 9.23GB               | 38.97GB    | -29.74GB  (-76.31%) | 4.98GB                 | 4.77GB       | 216.14MB   (04.42%) | 91.13% (43.74GB/48GB)     
  | Context | 16     | 4096         | 9.23GB               | 38.97GB    | -29.74GB  (-76.31%) | 1.03GB                 | 872.02MB     | 178.66MB   (20.49%) | 82.96% (39.82GB/48GB)     
  | Context | 16     | 2048         | 9.23GB               | 38.97GB    | -29.74GB  (-76.31%) | 658.64MB               | 484.02MB     | 174.63MB   (36.08%) | 82.17% (39.44GB/48GB)     
  | Context | 16     | 1024         | 9.23GB               | 38.97GB    | -29.74GB  (-76.31%) | 462.63MB               | 290.02MB     | 172.61MB   (59.52%) | 81.78% (39.25GB/48GB)     
  | Context | 16     | 512          | 9.23GB               | 38.97GB    | -29.74GB  (-76.31%) | 364.62MB               | 225.02MB     | 139.6MB    (62.04%) | 81.65% (39.19GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 15     |              | 8.78GB               | 38.97GB    | -30.19GB  (-77.47%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 15     | 42429        | 8.78GB               | 38.97GB    | -30.19GB  (-77.47%) | 8.03GB                 | 7.78GB       | 253.55MB   (03.18%) | 97.40% (46.75GB/48GB)     
  | Context | 15     | 25258        | 8.78GB               | 38.97GB    | -30.19GB  (-77.47%) | 4.89GB                 | 4.67GB       | 216.23MB   (04.52%) | 90.93% (43.64GB/48GB)     
  | Context | 15     | 4096         | 8.78GB               | 38.97GB    | -30.19GB  (-77.47%) | 1.01GB                 | 856.02MB     | 178.65MB   (20.87%) | 82.93% (39.81GB/48GB)     
  | Context | 15     | 2048         | 8.78GB               | 38.97GB    | -30.19GB  (-77.47%) | 650.64MB               | 476.02MB     | 174.62MB   (36.68%) | 82.16% (39.43GB/48GB)     
  | Context | 15     | 1024         | 8.78GB               | 38.97GB    | -30.19GB  (-77.47%) | 458.62MB               | 286.02MB     | 172.61MB   (60.35%) | 81.77% (39.25GB/48GB)     
  | Context | 15     | 512          | 8.78GB               | 38.97GB    | -30.19GB  (-77.47%) | 362.61MB               | 223.02MB     | 139.6MB    (62.60%) | 81.64% (39.19GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 14     |              | 8.33GB               | 38.97GB    | -30.64GB  (-78.62%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 14     | 43331        | 8.33GB               | 38.97GB    | -30.64GB  (-78.62%) | 8.03GB                 | 7.79GB       | 250.61MB   (03.14%) | 97.41% (46.76GB/48GB)     
  | Context | 14     | 25258        | 8.33GB               | 38.97GB    | -30.64GB  (-78.62%) | 4.79GB                 | 4.58GB       | 216.31MB   (04.61%) | 90.73% (43.55GB/48GB)     
  | Context | 14     | 4096         | 8.33GB               | 38.97GB    | -30.64GB  (-78.62%) | 1018.67MB              | 840.02MB     | 178.65MB   (21.27%) | 82.90% (39.79GB/48GB)     
  | Context | 14     | 2048         | 8.33GB               | 38.97GB    | -30.64GB  (-78.62%) | 642.64MB               | 468.02MB     | 174.62MB   (37.31%) | 82.14% (39.43GB/48GB)     
  | Context | 14     | 1024         | 8.33GB               | 38.97GB    | -30.64GB  (-78.62%) | 454.62MB               | 282.02MB     | 172.6MB    (61.20%) | 81.76% (39.25GB/48GB)     
  | Context | 14     | 512          | 8.33GB               | 38.97GB    | -30.64GB  (-78.62%) | 360.61MB               | 221.02MB     | 139.6MB    (63.16%) | 81.64% (39.19GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 13     |              | 7.83GB               | 38.97GB    | -31.14GB  (-79.92%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 13     | 44273        | 7.83GB               | 38.97GB    | -31.14GB  (-79.92%) | 8.03GB                 | 7.78GB       | 255.07MB   (03.20%) | 97.40% (46.75GB/48GB)     
  | Context | 13     | 25258        | 7.83GB               | 38.97GB    | -31.14GB  (-79.92%) | 4.69GB                 | 4.48GB       | 216.39MB   (04.72%) | 90.52% (43.45GB/48GB)     
  | Context | 13     | 4096         | 7.83GB               | 38.97GB    | -31.14GB  (-79.92%) | 1002.66MB              | 824.02MB     | 178.65MB   (21.68%) | 82.86% (39.77GB/48GB)     
  | Context | 13     | 2048         | 7.83GB               | 38.97GB    | -31.14GB  (-79.92%) | 634.63MB               | 460.02MB     | 174.62MB   (37.96%) | 82.12% (39.42GB/48GB)     
  | Context | 13     | 1024         | 7.83GB               | 38.97GB    | -31.14GB  (-79.92%) | 450.62MB               | 278.02MB     | 172.6MB    (62.08%) | 81.75% (39.24GB/48GB)     
  | Context | 13     | 512          | 7.83GB               | 38.97GB    | -31.14GB  (-79.92%) | 358.61MB               | 219.02MB     | 139.59MB   (63.74%) | 81.63% (39.18GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 12     |              | 7.38GB               | 38.97GB    | -31.59GB  (-81.07%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 12     | 45257        | 7.38GB               | 38.97GB    | -31.59GB  (-81.07%) | 8.03GB                 | 7.78GB       | 255.67MB   (03.21%) | 97.40% (46.75GB/48GB)     
  | Context | 12     | 25258        | 7.38GB               | 38.97GB    | -31.59GB  (-81.07%) | 4.6GB                  | 4.39GB       | 216.48MB   (04.82%) | 90.32% (43.36GB/48GB)     
  | Context | 12     | 4096         | 7.38GB               | 38.97GB    | -31.59GB  (-81.07%) | 986.66MB               | 808.02MB     | 178.65MB   (22.11%) | 82.83% (39.76GB/48GB)     
  | Context | 12     | 2048         | 7.38GB               | 38.97GB    | -31.59GB  (-81.07%) | 626.63MB               | 452.02MB     | 174.61MB   (38.63%) | 82.11% (39.41GB/48GB)     
  | Context | 12     | 1024         | 7.38GB               | 38.97GB    | -31.59GB  (-81.07%) | 446.61MB               | 274.02MB     | 172.6MB    (62.99%) | 81.74% (39.24GB/48GB)     
  | Context | 12     | 512          | 7.38GB               | 38.97GB    | -31.59GB  (-81.07%) | 356.61MB               | 217.02MB     | 139.59MB   (64.32%) | 81.63% (39.18GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 11     |              | 6.93GB               | 38.97GB    | -32.04GB  (-82.22%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 11     | 46286        | 6.93GB               | 38.97GB    | -32.04GB  (-82.22%) | 8.03GB                 | 7.78GB       | 258.63MB   (03.25%) | 97.39% (46.75GB/48GB)     
  | Context | 11     | 25258        | 6.93GB               | 38.97GB    | -32.04GB  (-82.22%) | 4.5GB                  | 4.29GB       | 216.56MB   (04.93%) | 90.12% (43.26GB/48GB)     
  | Context | 11     | 4096         | 6.93GB               | 38.97GB    | -32.04GB  (-82.22%) | 970.66MB               | 792.02MB     | 178.64MB   (22.56%) | 82.80% (39.74GB/48GB)     
  | Context | 11     | 2048         | 6.93GB               | 38.97GB    | -32.04GB  (-82.22%) | 618.63MB               | 444.02MB     | 174.61MB   (39.33%) | 82.09% (39.4GB/48GB)      
  | Context | 11     | 1024         | 6.93GB               | 38.97GB    | -32.04GB  (-82.22%) | 442.61MB               | 270.02MB     | 172.6MB    (63.92%) | 81.74% (39.23GB/48GB)     
  | Context | 11     | 512          | 6.93GB               | 38.97GB    | -32.04GB  (-82.22%) | 354.6MB                | 215.02MB     | 139.59MB   (64.92%) | 81.62% (39.18GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 10     |              | 6.42GB               | 38.97GB    | -32.55GB  (-83.52%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 10     | 47362        | 6.42GB               | 38.97GB    | -32.55GB  (-83.52%) | 8.03GB                 | 7.78GB       | 258.82MB   (03.25%) | 97.39% (46.75GB/48GB)     
  | Context | 10     | 25258        | 6.42GB               | 38.97GB    | -32.55GB  (-83.52%) | 4.4GB                  | 4.19GB       | 216.64MB   (05.05%) | 89.92% (43.16GB/48GB)     
  | Context | 10     | 4096         | 6.42GB               | 38.97GB    | -32.55GB  (-83.52%) | 954.66MB               | 776.02MB     | 178.64MB   (23.02%) | 82.77% (39.73GB/48GB)     
  | Context | 10     | 2048         | 6.42GB               | 38.97GB    | -32.55GB  (-83.52%) | 610.62MB               | 436.02MB     | 174.61MB   (40.05%) | 82.07% (39.4GB/48GB)      
  | Context | 10     | 1024         | 6.42GB               | 38.97GB    | -32.55GB  (-83.52%) | 438.61MB               | 266.02MB     | 172.59MB   (64.88%) | 81.73% (39.23GB/48GB)     
  | Context | 10     | 512          | 6.42GB               | 38.97GB    | -32.55GB  (-83.52%) | 352.6MB                | 213.02MB     | 139.58MB   (65.53%) | 81.62% (39.18GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 9      |              | 5.91GB               | 38.97GB    | -33.06GB  (-84.83%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 9      | 48489        | 5.91GB               | 38.97GB    | -33.06GB  (-84.83%) | 8.03GB                 | 7.77GB       | 262.29MB   (03.29%) | 97.38% (46.74GB/48GB)     
  | Context | 9      | 25258        | 5.91GB               | 38.97GB    | -33.06GB  (-84.83%) | 4.31GB                 | 4.1GB        | 216.73MB   (05.17%) | 89.72% (43.07GB/48GB)     
  | Context | 9      | 4096         | 5.91GB               | 38.97GB    | -33.06GB  (-84.83%) | 938.65MB               | 760.02MB     | 178.64MB   (23.50%) | 82.73% (39.71GB/48GB)     
  | Context | 9      | 2048         | 5.91GB               | 38.97GB    | -33.06GB  (-84.83%) | 602.62MB               | 428.02MB     | 174.61MB   (40.79%) | 82.06% (39.39GB/48GB)     
  | Context | 9      | 1024         | 5.91GB               | 38.97GB    | -33.06GB  (-84.83%) | 434.61MB               | 262.02MB     | 172.59MB   (65.87%) | 81.72% (39.23GB/48GB)     
  | Context | 9      | 512          | 5.91GB               | 38.97GB    | -33.06GB  (-84.83%) | 350.6MB                | 211.02MB     | 139.58MB   (66.15%) | 81.62% (39.18GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 8      |              | 5.41GB               | 38.97GB    | -33.56GB  (-86.13%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 8      | 49672        | 5.41GB               | 38.97GB    | -33.56GB  (-86.13%) | 8.03GB                 | 7.77GB       | 264.55MB   (03.32%) | 97.38% (46.74GB/48GB)     
  | Context | 8      | 25258        | 5.41GB               | 38.97GB    | -33.56GB  (-86.13%) | 4.21GB                 | 4GB          | 216.81MB   (05.29%) | 89.52% (42.97GB/48GB)     
  | Context | 8      | 4096         | 5.41GB               | 38.97GB    | -33.56GB  (-86.13%) | 922.65MB               | 744.02MB     | 178.63MB   (24.01%) | 82.70% (39.7GB/48GB)      
  | Context | 8      | 2048         | 5.41GB               | 38.97GB    | -33.56GB  (-86.13%) | 594.62MB               | 420.02MB     | 174.6MB    (41.57%) | 82.04% (39.38GB/48GB)     
  | Context | 8      | 1024         | 5.41GB               | 38.97GB    | -33.56GB  (-86.13%) | 430.6MB                | 258.02MB     | 172.59MB   (66.89%) | 81.71% (39.22GB/48GB)     
  | Context | 8      | 512          | 5.41GB               | 38.97GB    | -33.56GB  (-86.13%) | 348.59MB               | 209.02MB     | 139.58MB   (66.78%) | 81.61% (39.17GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 7      |              | 4.9GB                | 38.97GB    | -34.07GB  (-87.43%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 7      | 50914        | 4.9GB                | 38.97GB    | -34.07GB  (-87.43%) | 8.03GB                 | 7.77GB       | 266.16MB   (03.35%) | 97.38% (46.74GB/48GB)     
  | Context | 7      | 50653        | 4.9GB                | 38.97GB    | -34.07GB  (-87.43%) | 7.99GB                 | 7.73GB       | 269.81MB   (03.41%) | 97.28% (46.7GB/48GB)      
  | Context | 7      | 25258        | 4.9GB                | 38.97GB    | -34.07GB  (-87.43%) | 4.11GB                 | 3.9GB        | 216.89MB   (05.43%) | 89.32% (42.87GB/48GB)     
  | Context | 7      | 4096         | 4.9GB                | 38.97GB    | -34.07GB  (-87.43%) | 906.65MB               | 728.02MB     | 178.63MB   (24.54%) | 82.67% (39.68GB/48GB)     
  | Context | 7      | 2048         | 4.9GB                | 38.97GB    | -34.07GB  (-87.43%) | 586.62MB               | 412.02MB     | 174.6MB    (42.38%) | 82.03% (39.37GB/48GB)     
  | Context | 7      | 1024         | 4.9GB                | 38.97GB    | -34.07GB  (-87.43%) | 426.6MB                | 254.02MB     | 172.58MB   (67.94%) | 81.70% (39.22GB/48GB)     
  | Context | 7      | 512          | 4.9GB                | 38.97GB    | -34.07GB  (-87.43%) | 346.59MB               | 207.02MB     | 139.58MB   (67.42%) | 81.61% (39.17GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 6      |              | 4.39GB               | 38.97GB    | -34.58GB  (-88.73%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 6      | 52219        | 4.39GB               | 38.97GB    | -34.58GB  (-88.73%) | 8.03GB                 | 7.76GB       | 272.6MB    (03.43%) | 97.36% (46.73GB/48GB)     
  | Context | 6      | 50653        | 4.39GB               | 38.97GB    | -34.58GB  (-88.73%) | 7.8GB                  | 7.53GB       | 269.82MB   (03.50%) | 96.88% (46.5GB/48GB)      
  | Context | 6      | 25258        | 4.39GB               | 38.97GB    | -34.58GB  (-88.73%) | 4.02GB                 | 3.81GB       | 216.97MB   (05.57%) | 89.12% (42.78GB/48GB)     
  | Context | 6      | 4096         | 4.39GB               | 38.97GB    | -34.58GB  (-88.73%) | 890.64MB               | 712.02MB     | 178.63MB   (25.09%) | 82.64% (39.67GB/48GB)     
  | Context | 6      | 2048         | 4.39GB               | 38.97GB    | -34.58GB  (-88.73%) | 578.61MB               | 404.02MB     | 174.6MB    (43.22%) | 82.01% (39.36GB/48GB)     
  | Context | 6      | 1024         | 4.39GB               | 38.97GB    | -34.58GB  (-88.73%) | 422.6MB                | 250.02MB     | 172.58MB   (69.03%) | 81.70% (39.21GB/48GB)     
  | Context | 6      | 512          | 4.39GB               | 38.97GB    | -34.58GB  (-88.73%) | 344.59MB               | 205.02MB     | 139.57MB   (68.08%) | 81.60% (39.17GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 5      |              | 3.89GB               | 38.97GB    | -35.08GB  (-90.03%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 5      | 53593        | 3.89GB               | 38.97GB    | -35.08GB  (-90.03%) | 8.03GB                 | 7.76GB       | 275.03MB   (03.46%) | 97.36% (46.73GB/48GB)     
  | Context | 5      | 50653        | 3.89GB               | 38.97GB    | -35.08GB  (-90.03%) | 7.6GB                  | 7.34GB       | 269.83MB   (03.59%) | 96.48% (46.31GB/48GB)     
  | Context | 5      | 25258        | 3.89GB               | 38.97GB    | -35.08GB  (-90.03%) | 3.92GB                 | 3.71GB       | 217.06MB   (05.71%) | 88.92% (42.68GB/48GB)     
  | Context | 5      | 4096         | 3.89GB               | 38.97GB    | -35.08GB  (-90.03%) | 874.64MB               | 696.02MB     | 178.63MB   (25.66%) | 82.60% (39.65GB/48GB)     
  | Context | 5      | 2048         | 3.89GB               | 38.97GB    | -35.08GB  (-90.03%) | 570.61MB               | 396.02MB     | 174.59MB   (44.09%) | 81.99% (39.36GB/48GB)     
  | Context | 5      | 1024         | 3.89GB               | 38.97GB    | -35.08GB  (-90.03%) | 418.59MB               | 246.02MB     | 172.58MB   (70.15%) | 81.69% (39.21GB/48GB)     
  | Context | 5      | 512          | 3.89GB               | 38.97GB    | -35.08GB  (-90.03%) | 342.59MB               | 203.02MB     | 139.57MB   (68.75%) | 81.60% (39.17GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 4      |              | 3.38GB               | 38.97GB    | -35.59GB  (-91.33%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 4      | 55042        | 3.38GB               | 38.97GB    | -35.59GB  (-91.33%) | 8.03GB                 | 7.76GB       | 274.63MB   (03.46%) | 97.36% (46.73GB/48GB)     
  | Context | 4      | 50653        | 3.38GB               | 38.97GB    | -35.59GB  (-91.33%) | 7.41GB                 | 7.15GB       | 269.84MB   (03.69%) | 96.08% (46.12GB/48GB)     
  | Context | 4      | 25258        | 3.38GB               | 38.97GB    | -35.59GB  (-91.33%) | 3.83GB                 | 3.61GB       | 217.14MB   (05.87%) | 88.72% (42.58GB/48GB)     
  | Context | 4      | 4096         | 3.38GB               | 38.97GB    | -35.59GB  (-91.33%) | 858.64MB               | 680.02MB     | 178.62MB   (26.27%) | 82.57% (39.63GB/48GB)     
  | Context | 4      | 2048         | 3.38GB               | 38.97GB    | -35.59GB  (-91.33%) | 562.61MB               | 388.02MB     | 174.59MB   (45.00%) | 81.98% (39.35GB/48GB)     
  | Context | 4      | 1024         | 3.38GB               | 38.97GB    | -35.59GB  (-91.33%) | 414.59MB               | 242.02MB     | 172.58MB   (71.31%) | 81.68% (39.21GB/48GB)     
  | Context | 4      | 512          | 3.38GB               | 38.97GB    | -35.59GB  (-91.33%) | 340.58MB               | 201.02MB     | 139.57MB   (69.43%) | 81.60% (39.17GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 3      |              | 2.87GB               | 38.97GB    | -36.1GB   (-92.63%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 3      | 56570        | 2.87GB               | 38.97GB    | -36.1GB   (-92.63%) | 8.03GB                 | 7.76GB       | 281.08MB   (03.54%) | 97.34% (46.73GB/48GB)     
  | Context | 3      | 50653        | 2.87GB               | 38.97GB    | -36.1GB   (-92.63%) | 7.22GB                 | 6.95GB       | 269.85MB   (03.79%) | 95.67% (45.92GB/48GB)     
  | Context | 3      | 25258        | 2.87GB               | 38.97GB    | -36.1GB   (-92.63%) | 3.73GB                 | 3.52GB       | 217.22MB   (06.03%) | 88.52% (42.49GB/48GB)     
  | Context | 3      | 4096         | 2.87GB               | 38.97GB    | -36.1GB   (-92.63%) | 842.64MB               | 664.02MB     | 178.62MB   (26.90%) | 82.54% (39.62GB/48GB)     
  | Context | 3      | 2048         | 2.87GB               | 38.97GB    | -36.1GB   (-92.63%) | 554.6MB                | 380.02MB     | 174.59MB   (45.94%) | 81.96% (39.34GB/48GB)     
  | Context | 3      | 1024         | 2.87GB               | 38.97GB    | -36.1GB   (-92.63%) | 410.59MB               | 238.02MB     | 172.57MB   (72.50%) | 81.67% (39.2GB/48GB)      
  | Context | 3      | 512          | 2.87GB               | 38.97GB    | -36.1GB   (-92.63%) | 338.58MB               | 199.02MB     | 139.57MB   (70.13%) | 81.59% (39.16GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 2      |              | 2.37GB               | 38.97GB    | -36.6GB   (-93.93%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 2      | 58187        | 2.37GB               | 38.97GB    | -36.6GB   (-93.93%) | 8.03GB                 | 7.75GB       | 282.26MB   (03.55%) | 97.34% (46.72GB/48GB)     
  | Context | 2      | 50653        | 2.37GB               | 38.97GB    | -36.6GB   (-93.93%) | 7.02GB                 | 6.76GB       | 269.85MB   (03.90%) | 95.27% (45.73GB/48GB)     
  | Context | 2      | 25258        | 2.37GB               | 38.97GB    | -36.6GB   (-93.93%) | 3.63GB                 | 3.42GB       | 217.31MB   (06.20%) | 88.31% (42.39GB/48GB)     
  | Context | 2      | 4096         | 2.37GB               | 38.97GB    | -36.6GB   (-93.93%) | 826.63MB               | 648.02MB     | 178.62MB   (27.56%) | 82.51% (39.6GB/48GB)      
  | Context | 2      | 2048         | 2.37GB               | 38.97GB    | -36.6GB   (-93.93%) | 546.6MB                | 372.02MB     | 174.59MB   (46.93%) | 81.94% (39.33GB/48GB)     
  | Context | 2      | 1024         | 2.37GB               | 38.97GB    | -36.6GB   (-93.93%) | 406.59MB               | 234.02MB     | 172.57MB   (73.74%) | 81.66% (39.2GB/48GB)      
  | Context | 2      | 512          | 2.37GB               | 38.97GB    | -36.6GB   (-93.93%) | 336.58MB               | 197.02MB     | 139.56MB   (70.84%) | 81.59% (39.16GB/48GB)     
  |         |        |              |                      |            |                     |                        |              |                     |                           
  | Type    | Layers | Context size | Estimated model VRAM | Model VRAM | Diff                | Estimated context VRAM | Context VRAM | Diff                | VRAM usage                
  | Model   | 1      |              | 1.86GB               | 38.97GB    | -37.11GB  (-95.23%) |                        |              |                     | 81.19% (38.97GB/48GB)     
  | Context | 1      | 59898        | 1.86GB               | 38.97GB    | -37.11GB  (-95.23%) | 8.03GB                 | 7.75GB       | 287.67MB   (03.63%) | 97.33% (46.72GB/48GB)     
  | Context | 1      | 50653        | 1.86GB               | 38.97GB    | -37.11GB  (-95.23%) | 6.83GB                 | 6.57GB       | 269.86MB   (04.01%) | 94.87% (45.54GB/48GB)     
  | Context | 1      | 25258        | 1.86GB               | 38.97GB    | -37.11GB  (-95.23%) | 3.54GB                 | 3.32GB       | 217.39MB   (06.39%) | 88.11% (42.29GB/48GB)     
  | Context | 1      | 4096         | 1.86GB               | 38.97GB    | -37.11GB  (-95.23%) | 810.63MB               | 632.02MB     | 178.61MB   (28.26%) | 82.47% (39.59GB/48GB)     
  | Context | 1      | 2048         | 1.86GB               | 38.97GB    | -37.11GB  (-95.23%) | 538.6MB                | 364.02MB     | 174.58MB   (47.96%) | 81.93% (39.33GB/48GB)     
  | Context | 1      | 1024         | 1.86GB               | 38.97GB    | -37.11GB  (-95.23%) | 402.58MB               | 230.02MB     | 172.57MB   (75.02%) | 81.66% (39.19GB/48GB)     
  | Context | 1      | 512          | 1.86GB               | 38.97GB    | -37.11GB  (-95.23%) | 334.58MB               | 195.02MB     | 139.56MB   (71.56%) | 81.58% (39.16GB/48GB)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Significantly slower running node-llama-cpp compared to llama.cpp on M1 Max #397

{{title}}

Replies: 2 comments 2 replies

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

Significantly slower running node-llama-cpp compared to llama.cpp on M1 Max #397

lzimm Dec 10, 2024

Replies: 2 comments · 2 replies

giladgd Dec 11, 2024 Maintainer

lzimm Dec 11, 2024 Author

giladgd Dec 11, 2024 Maintainer

lzimm Dec 11, 2024 Author

lzimm
Dec 10, 2024

Replies: 2 comments 2 replies

giladgd
Dec 11, 2024
Maintainer

lzimm
Dec 11, 2024
Author

giladgd Dec 11, 2024
Maintainer

lzimm Dec 11, 2024
Author